目前在 AI 智能体领域,有一些与咖啡相关的应用和测试。例如,“Coffee test”要求一台机器进入一个普通的美国家庭,并弄清楚如何煮咖啡,包括找到咖啡机、咖啡、水、杯子,然后按下适当按钮煮咖啡。但专门针对咖啡的 AI 智能体相对较少。同时,AI 智能体在其他方面也有应用和发展,如决策智能体在健康计划自动化、监管合规、KYC 等领域的应用。在一般的 AI 智能体应用中,具有个性化、自主完成任务、多 Agent 协作等特点,目前大多集中在 2B 场景,面向个人消费者的产品较少。
2024北京智源大会,张亚勤院士认为无人驾驶可能会成为第一个真正实现具身智能或物理智能的AGI,而时间节点就在明年。他说,“无人驾驶要变成主流、通过新图灵测试,需要是好司机,也需要是老司机。我认为明年会实现。”而这一进展如果实现,将加速人工智能技术在实际场景中的落地应用。网址:https://mp.weixin.qq.com/s/DwVExFiJTUBNnr6-xmoZCQ【智谱清言智能体推荐】了解更多关于具身智能,点击互动👇达成“具身智能”需具备哪些特征?核心要素在于智能体与真实世界进行带有实时闭环反馈的感知-推理-行动交互(sense-plan-act)的能力。“具身图灵测试(Embodied Turing Test)”由Yoshua Bengio、Yann LeCun等科学家提出,作为具身智能的终极挑战,其标准在于高级感觉运动能力。具体包括四种特征:与真实环境互动对不同环境的适应性(多任务、多环境泛化)动物行为的灵活性从稀疏观察中做出一般推断的能力论文标题:《Catalyzing next-generation Artificial Intelligence through NeuroAI》论文链接:https://www.nature.com/articles/s41467-023-37180-x其他具身智能测试:Coffee test:一台机器需要进入一个普通的美国家庭,并弄清楚如何煮咖啡:找到咖啡机,找到咖啡,加水,找到一个杯子,然后通过按下适当的按钮来煮咖啡。
准确的来说,AI Agent指的是一种智能代理系统,它接近人类的大脑,可形成记忆、达成行动规划、自动交互、主动预测。目前AI Agent的概念在市场上并没有达成共识,存在被广泛滥用的现象。(很多Chatbot应用给Bot冠以“智能体”的名称,准确的说是对Agent的误用)[heading3]AI Agent应用的特点:[content]个性化:随着用户的使用越来越了解用户习惯和想法,从而作出喜好预测Dot App在对话中了解用户喜好,随后为用户推荐新的咖啡店自主完成任务:Auto GPT:用户输入一个目标后,可自主执行任务、递归地开发和调试代码多Agent协作斯坦福大学的SmallVille(小镇)项目,现已开源25个人工智能体居住在一个沙盒虚拟城镇中通过复杂的社交互动来执行他们的日常生活Fixie AI在收到用户请求后启动多个负责不同模块的Agent进行数据查询和传递,最终生成邮件内容给客户回复博主林亦LYi的《AI炒股?我开了一家员工全是AI的公司,自动帮我炒股》就在某种程度上实现了多Agent协作的能力:目前,AI Agent应用大多集中在2B场景,面向个人消费者的产品少之又少。一方面是高度智能化的Agent能力需要打磨,概念落地还有较长一段距离;一方面是AI和娱乐消费诉求的结合还几乎没有,其主要带来的是生产方式变革和效率变革。个人消费者方向,目前只看到“私人助理”场景。
我们将探讨的第一类智能体是决策智能体,它们使用智能体决策制定在复杂、多步骤的推理流程中导航并做出业务决策。与RAG或工具使用方法不同,这种架构首次将一定的控制逻辑交给LLMs,而不是预先设定所有步骤-但仍位于智能体自由度范围的较低端,因为智能体主要作为路由器导航一组预先确定的决策树。让我们以[Anterior](https://www.anterior.com/)(前称Co:Helm)为例。该健康计划自动化公司开发了一个临床决策引擎,用于自动化理赔提交审核。护士们如今凭借装满条件知识(就像世界上最无聊的"自选冒险")的付款人规则手册,人工完成这些审核。Anterior简化了这个过程。该公司首先将付款方规则转换为有向无环图(DAG),使用基于规则的脚本和语言模型。然后,他们的智能体遍历这个决策树,在每个节点利用LLMs来评估相关的临床文件是否符合特定的规则。对于较简单的节点,这可能涉及基本的检索增强型生成(RAG)步骤。但是,Anterior经常遇到需要子链的更复杂的任务,在这种情况下,智能体必须选择最佳方法,然后才能进入下一个节点。它会在每次决策时更新自己的状态(在内存中管理这些中间输出),并一直进行到最终确定。前者并非独一无二的采取这种方法。其他领域也在利用决策智能体,包括[Norm AI](https://norm.ai/)正在为监管合规打造AI智能体,以及[Parcha](https://www.parcha.com/)正在为KYC建立智能体。