AI Agent技术正重塑我们的未来工作与生活。本文深入探索了AI Agent构建平台的奥秘,从概念理解到功能剖析,再到国内外平台的全面盘点,带领读者领略这一变革性技术的魅力。
Agent一词,在人工智能领域的早期研究中,就已被用来描述能够执行任务或做出决策的程序或系统。
从2023年下半年开始,Agent这个词的热度便随RAG,大模型开发框架等概念推出后一度飙升,至今依旧热度不减(由下图「百度指数」和「谷歌趋势」关于“Agent”关键词的搜索指数和趋势可以看出)。
图1-1来自百度指数(数据统计范围:2022.11.30~2024.7.17)
图1-2来自谷歌指数(数据统计范围:2023.7.16~2024.7.17)
当前Agent,在人工智能领域,通常用来指代“决策、感知、执行于一体”的智能系统或智能应用,并且进行指挥和决策的“大脑”可以由各类LLM或VLM充当。
在2023年11月20日,在OpenAI首届开发者大会上推出GPTs以后,各种类GPTs构建平台便如雨后春笋一样出现,并且功能也越来越丰富。
在AI Agent热浪下,国内外的AI头部公司、互联网大厂以及原有RPA、企业办公(CRM、客服)业务的公司,都纷纷推出了Agent相关产品。比如助力企业实现业务流程自动化的Beam.ai、亚马逊Bedrock Agent等,面向多种应用场景的各类AI Agent构建平台(字节扣子、智谱清言智能体中心、百度文心智能体平台、阿里百炼平台、百度智能客服产品-客悦“Agent0-1构建功能”、昆仑万维的skyAgents等。
这些Agent和GPTs,正在悄然改变人们的工作方式,提高工作与生产效率,以及重新定义生产力。据有关人士整理,目前单国内外的AI Agent构建平台,至少已经超过80个。
图1-3 智谱AI-智谱清言-“新建智能体”产品功能截图
图1-4 文心一言智能体-产品界面截图
图1-5 百度客悦智能对话平台一2024年4月产品界面截图(1)
图1-6 百度客悦智能对话平台一2024年4月产品界面截图(2)
前段时间,吴恩达教授在红杉资本AI Ascent的分享中提到反思(reflection)、工具使用(Tool use)、规划(Planning)、多智能体协作(Multiagent collaboration)四种AI Agent设计模式已经逐步在一些Agent构建平台实现,有的平台如Coze等已经能够支持全部四种设计模式。
图2-1 字节AI智能体构建平台(Coze)-产品主页截图
前面说了那么多,那到底什么是AI Agent构建平台?AI Agent平台有什么特点?有哪些功能模块?
如若你使用过几款AI Agent平台(工具)产品,你就会发现:现在的这些AI Agent构建平台,不论是产品UI界面上,还是产品功能逻辑上,都大差不差,均提供基于LLM通识能力的对话机器人构建(简单智能体构建),和基于LLM、工作流、知识库、API插件于一体的复杂Agent构建两种。
且在创建Agent应用时,用户只需要输入一段简单的智能体工作&技能相关描述,后台AI便能帮你自动生成智能体名称、头像、简介及系统提示词等内容,非常之快捷、方便,分分钟即可配好你的智能体。
图2-2(a) 智谱清言-“新建智能体”-用户输入智能体描述
图2-2(b) 智谱清言-“新建智能体”-系统据用户输入,智能生成的智能体配置信息
p.s.在当前时间节点(2024年7月17日),字节Coze、百度文心智能体、智谱AI-智谱清言均早已实现“一句话描述智能体,AI自动生成配置”,而腾讯元器(腾讯的智能体平台)还暂未实现,还需要用户手动输入头像&名称这些信息,否则无法创建成功。
1)适用场景:
适用于仅依照LLM通识能力,通过设定好LLM系统提示词(人设&工作内容&温度值等参数)就可以实现业务需求的场景,如“美食推荐专家”、“智能沟通专家”、“冷笑话专家”、“知识百科小助手”等等;
图2-3 字节Coze新建智能体(test-bot)
1)适用场景:
如果需要访问企业/个人知识库、调用一些额外的API插件来实现业务需求,则需要配置好相应的插件(如网络爬虫、xxx数据库查询与数据统计、天气查询、航班查询等等)、知识库数据。
另外,若有高阶需求,比如需要根据不同的业务触发条件执行对应的sop,则还需要配置工作流。
——当前阶段,一般的Agent平台,均提供“画布拖拽式”的工作流搭建功能。在你的工作流中,你可以选择让LLM参与任务,也可以选择不参与,此时LLM就相当于一个组件而已。
图2-4 字节Coze-工作流配置页面
图2-5 Dify-工作流配置页面
Q1. AI Agent产品有什么特点?
A1:AI Agent产品,一般具备AI Agent 0-1构建的功能,可帮助用户或企业零代码或低代码,通过“自然语言”的方式,输入一段智能体描述,即可分分钟快速搭建一个chatbot,如美食推荐专家、旅游规划专家、情感树洞、讲冷笑话小助手。
此外,AI Agent构建平台产品,还支持个人和企业用户构建复杂的智能体应用,通过提供【插件】、【知识库】、【工作流】、【多智能体协作】配置相关功能,实现这一过程。同时支持对智能体【在线调试】和【发布】,发布形式上,支持按API调用,也支持直接发布带前端界面的应用(这种应用一般以chatbot(对话机器人)形式为主,一些AppBuilder产品,还可支持低代码和无代码搭建网站等应用,如之前火过的钉钉「宜搭」、「轻流」低代码平台。
——答案来自个人理解,仅供参考~
Q2. AI Agent用来解决谁的什么问题的?
A2:AI Agent平台,可以帮助个人用户和企业,通过“自然语言”、工作流配置等方式,无代码或低代码地简单高效的搭建一款chatbot应用,在对话和任务执行过程中,用户可选择LLM来完成任务,相较于原来的智能对话机器人“总是从头说”、“回答话术一成不变”、“无法很好理解用户问题”等问题来说,基于LLM的chatbot更加智能、更加“懂用户”。
——答案来自个人理解,仅供参考~
Q3. 目前AI Agent产品有哪几种设计模式?分别有什么特点?
A3:吴恩达教授在红杉资本AI Ascent的分享中提到反思(reflection)、工具使用(Tool use)、规划(Planning)、多智能体协作(Multiagent collaboration)四种AI Agent设计模式。
Q4. AI Agent平台,一般有哪些功能模块?
A4:基于LLM的chatbot0-1搭建,包括:【智能体创建】、【智能体配置】、【智能体调试】、【智能体发布】功能;以及【智能体商城】功能,支持用户从平台中挑选其感兴趣的智能体进行应用和体验;以及多智能体协作功能。
关于【智能体配置】功能,包括智能体『基本信息配置』(名称、头像、简介、LLM模型选择与参数配置(工作技能和工作内容&流程描述、温度值等)、『智能体复杂配置』(工作流配置、插件配置、知识库配置等);
——答案来自个人理解,仅供参考~
下面给出行内有关人士整理(+个人补充)的海内外AI Agent平台盘点名单,包括68个海外AI Agent构建平台和 21个国内AI Agent平台 产品名称及介绍,老师们可根据产品名称自行搜索体验,建议从互联网大厂、AI独角兽厂商的产品开始使用体验。
图3-1 海外AI Agent平台构建(图来自网络,仅做学习交流使用,如有侵权联系删除)
图3-2 SignalWire Agent平台构建
除此之外,还有百度智能客服-客悦平台、简易云的语聚AI产品等,也支持AI Agent构建。
文章《全球80+AI Agent构建平台大盘点…》:https://hub.baai.ac.cn/view/37088
本文由 @南方碟道 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议