📢 转载信息
原文作者:Gopinath Jagadesan, David Kim, and Premjit Singh
在全球范围内扩展自助服务支持面临的挑战远不止翻译问题。在本文中,我们将介绍亚马逊家庭安全子公司 Ring 如何利用 Amazon Bedrock 知识库构建一个生产级、支持多语言区域的 检索增强生成 (RAG) 支持聊天机器人。通过消除各区域单独部署基础设施的需求,Ring 在扩展到新地区时将成本降低了 21%,同时保持了全球 10 个国际区域的一致客户体验。
您将了解到 Ring 如何实现基于元数据的特定区域内容过滤,如何将内容管理拆分为摄入、评估和推广工作流,以及如何在扩展规模的同时实现成本优化。本文描述的架构集成了 Amazon Bedrock 知识库、Amazon Bedrock、AWS Lambda、AWS Step Functions 以及 Amazon S3。无论您是计划扩大国际运营规模,还是寻求优化现有的 RAG 架构,这些实战经验都极具参考价值。
Ring 的支持演进历程
Ring 的客户支持最初依赖于基于规则的 Amazon Lex 聊天机器人。虽然该系统能处理预定义对话,但面对多样化的客户咨询时显得力不从心。在高峰期,16% 的交互需要人工介入,且支持工程师需耗费 10% 的精力维护规则系统。随着 Ring 业务的国际化扩展,这种方式已不可持续。
RAG 支持系统的要求
Ring 面临的核心挑战是:如何在不为每个地区构建独立基础设施的情况下,提供准确且符合语境的本地化支持。团队确立了四个关键需求:
- 全球内容本地化:不仅是翻译,更需要针对各地区的电压规格、监管合规细节等配置进行管理。
- 无服务器托管架构:团队希望专注于优化客户体验,而非管理基础设施。
- 可扩展的知识管理:需要强大的向量搜索技术,支持自动化内容摄入管道,实现跨多区域的实时更新。
- 性能与成本优化:通过集中式架构替代区域化部署,降低运营复杂度。
解决方案概述
Ring 将 RAG 架构设计分为两个核心流程:摄入与评估以及推广。
摄入与评估工作流
图 1:Ring 摄入与评估工作流架构,利用 Step Functions 编排每日知识库创建与质量验证。
该流程包括内容上传至 Amazon S3、通过 Lambda 触发事件进行自动处理与元数据提取,并利用 Anthropic Claude Sonnet 4 作为“裁判”模型,对不同版本知识库的表现进行评估,最终将表现最优的版本提升为生产环境的“黄金数据集”。
推广工作流:客户导向
图 2:Ring 生产环境聊天机器人架构,通过 Lambda 应用元数据过滤获取最相关的区域内容,并结合基础模型生成回答。
结论
通过这种创新的 RAG 架构,Ring 实现了基础设施成本的大幅降低。除了核心功能,Ring 还考虑了向量存储选择(如 Amazon OpenSearch Serverless)、灾难恢复的多区域部署,以及利用跨区域推理(CRIS)来扩展基础模型的吞吐量。Ring 目前正致力于向代理模型演进,未来将集成多个专业代理,进一步提升服务的智能化水平。
🚀 想要体验更好更全面的AI调用?
欢迎使用青云聚合API,约为官网价格的十分之一,支持300+全球最新模型,以及全球各种生图生视频模型,无需翻墙高速稳定,文档丰富,小白也可以简单操作。
评论区