AI Agent的整体介绍
AI Agent是基于大模型技术开发的应用程序,它利用了大模型强大的语言理解和生成能力来完成各种任务。与基础的大模型相比,AI Agent通过集成外部能力(即大模型本身不具备的能力)来克服一些固有的局限性。这些局限包括无法回答私有领域问题、获取最新消息以及解决某些专业领域的问题等。因此,AI Agent不仅能够处理广泛的语言相关任务,还能够在特定场景下提供更加精准和有用的服务。
AI Agent的应用场景
- 私有领域知识问答
用户可以通过准备包含所需信息的知识库文件,在百炼控制台轻松创建一个专门针对私有领域的问答系统。这样的系统非常适合用于企业内部关于公司政策、员工资料等的查询服务。
- 个性化聊天机器人
利用百炼提供的长期记忆特性,聊天机器人能够记住用户之前的对话内容,从而提供更加个性化的交流体验。此外,还可以将夸克搜索和图像生成等功能集成进来,进一步增强其互动性和实用性。
- 智能助手
通过整合检索增强生成(RAG)技术、长期记忆支持及自定义插件,可以开发出功能全面的个人或工作助手。这类应用可以帮助用户自动管理日程安排、撰写报告甚至是进行邮件往来等日常事务。
上述提到的所有应用场景都可以在百炼控制台上以零代码的方式实现,极大地简化了构建过程并降低了入门门槛。
AI Agent的核心原
AI Agent主要由记忆模块、工具模块和行动模块三个关键部分组成。这三个组件协同工作,使Agent能够感知环境、处理信息并采取行动。
- 记忆模块
- 功能: 存储和管理代理的知识和经验。
- 输入: 来自外部环境的感知数据、过去的行动结果、工具的反馈等。
- 输出: 提供历史数据和知识,用于决策和行动。
- 处理逻辑:
- 存储感知到的信息和行动结果。
- 提供历史数据和知识,用于当前决策和行动。
- 更新和优化记忆,确保知识库的准确性和有效性。
- 工具模块
- 功能: 提供执行特定任务的能力,如数据处理、计算、外部系统交互等。
- 输入: 来自记忆模块的知识、当前任务的需求。
- 输出: 处理后的数据、任务执行结果。
- 处理逻辑:
- 接收任务需求,调用相应的工具进行处理。
- 将处理结果返回给记忆模块或直接用于行动模块。
- 根据任务需求,动态选择和配置工具。
- 行动模块
- 功能: 执行具体的行动,响应外部环境的变化。
- 输入: 来自记忆模块的知识、工具模块的处理结果。
- 输出: 行动指令、反馈信息。
- 处理逻辑:
- 根据记忆模块提供的知识和工具模块的处理结果,制定行动计划。
- 执行具体的行动,并将结果反馈给记忆模块。
- 动态调整行动策略,确保目标的实现。
组件间的协作流程
- 记忆模块:
- 从外部环境接收感知数据,并存储在知识库中。
- 提供历史数据和知识,支持工具模块和行动模块的决策。
- 工具模块:
- 接收记忆模块提供的知识和当前任务需求,调用相应工具进行处理。
- 将处理结果返回给记忆模块或直接用于行动模块。
- 行动模块:
- 根据记忆模块提供的知识和工具模块的处理结果,制定并执行行动计划。
- 将行动结果反馈给记忆模块,更新知识库。
他们的协作关系:
为了更好地理解这些组件之间的协作关系,详细描述了记忆模块、工具模块和行动模块之间的协作关系:
通过这种结构化的组件设计,AI Agent能够在复杂的环境中高效地完成任务。
使用AI Agent来做一个基于私有知识库的客服答疑系统例子
本例子使用通义千问+阿里云百炼实现
通义千问是由阿里集团输出的开源大模型服务,它支持全尺寸、多模态的大模型。在中文开源模型领域,通义千问具备显著的优势。以下是通义千问的核心能力、能力排行榜以及价格情况的详细介绍。
核心优势
- 能力排名靠前:通义千问在多个客观评测指标上表现优异,如MMLU、TheoremQA和GPQA等,超越了Llama 3 70B。特别是在国产大模型中,其竞技场模式下的性能仅次于OpenAI的GPT系列、Claude和GreK。
- 可访问性和合规性:通过API调用时,通义千问提供了安全保护措施,有效避免了恶意攻击问题。
- 完全开源:作为目前最为开放的模型之一,通义千问提供了全尺寸的多模态大模型开源版本,用户可以根据需求选择不同规模的模型。
- 价格合适:通义千问为用户提供100万免费token,并且调用API的成本相对较低。对于自建模型的情况,甚至可以实现免费使用。特别推荐关注Qwen和Qwen VL两个模态的模型,它们在国内开源榜单上均处于领先地位。
具体的步骤:
一、创建机器人
- 登录到智能对话机器人的管理控制台,进入控制台后,选择左侧导航栏的应用管理>机器人>新建机器人。
- 在弹出框中填写机器人基本信息,包括头像、名称与介绍;信息填写完成后,点击确定按钮完成创建。
二、配置机器人
配置过程包括基础设置、知识绑定、高级设置和转人工设置。这些步骤将赋予机器人准确回答用户问题的能力。
基础配置
- 人设:定义虚拟身份和性格特点,例如“零售小助手”可以提供商品信息查询等服务。
- 回复风格:可选精简、标准或自然风格,以适应不同的交互场景。
- 欢迎语配置:设定机器人首次与用户交流时使用的问候语。详情参考:基础设置。
知识绑定
- 文档知识:上传PDF、DOC/DOCX、TXT格式的文档作为知识来源,具体操作请见:文档知识管理。
- 高频问答:录入常见问题及其答案,详情请参阅:高频问答。
- 流程管理和API插件:通过配置节点调用API实现特定任务对话,详情请访问:技能管理(机器人空间)。
- 网站知识:爬取网页内容用于回答用户问题,了解更多信息请查看:网站知识。
- 数据表格:利用SQL查询相关数据表进行推理并作答,详情参见:表格管理(机器人空间)。
三、高级设置
- 无答案处理:当没有找到匹配答案时,使用预设话术回应。
- 安全过滤:确保生成的回答安全可靠。
- 推荐问题:在应答后推荐其他可能感兴趣的问题。
四、转人工设置
设定触发人工干预的具体条件以及相应的话术提示。
五、发布
将知识和机器人从测试环境迁移至生产环境,保障线上服务稳定安全运行。根据需求选择发布方式:
- 仅发布机器人:不包含知识库内容更新。
- 发布机器人及知识:同时推送所有关联的知识条目。
- 业务空间维度的知识发布:同步更新该业务下所有相关的知识资源。
六、效果测试
确保提问的内容与已上传资料相关联,观察机器人是否能准确引用资料作出回应。
七、拓展能力
通过设置Prompt、添加RAG与插件进一步增强客服系统的功能。
通过设置Prompt指引内容方向
输入具体的指令让大模型按需生成内容,如:“请模仿李白的语气”。
通过RAG提升私域知识问答能力
- 访问数据管理,上传所需文档。
- 创建知识库并关联到智能体应用中,具体步骤如下图所示。
- 在应用中集成RAG,选择之前创建的知识库。
通过插件扩展功能
- 添加官方提供的插件,比如图片生成插件。
- 测试插件效果,输入命令验证其工作情况。
- 本文固定链接: https://maimengkong.com/morejc/1844.html
- 转载请注明: : 萌小白 2024年12月1日 于 卖萌控的博客 发表
- 百度已收录