AI Agent 与 GPT 的关系是什么?
AI Agent 是一种智能体,它可以自主地执行任务并与环境进行交互。而 GPT(Generative Pre-trained Transformer)是一种大规模预训练的语言模型,它可以生成自然语言文本。
虽然 AI Agent 和 GPT 是不同的概念,但它们可以相互配合使用。例如,GPT 可以作为 AI Agent 的语言生成模块,为其提供自然语言文本生成能力。同时,AI Agent 可以使用 GPT 生成的文本作为输入,执行各种任务,如问答、对话、文本摘要等。
此外,GPT 还可以作为 AI Agent 的知识来源,为其提供各种领域的知识和信息。通过将 GPT 与 AI Agent 相结合,可以实现更加智能、灵活和高效的 AI 应用。
总的来说,AI Agent 和 GPT 是相互补充的概念,它们可以结合使用,为人工智能的发展提供更广阔的前景。
“大型语言模型的潜力不仅仅在于创作出流畅的文本、故事、论文和程序;它还可以被视为一个强大的通用问题解决工具。”和开头提到的计算机领域的通用比,Lilian进一步具体化了Agent的能力模型:在Lilian看来,Agent的能力被具象为三大类:1.规划2.记忆3.使用工具(工具+行为Action)你可能有印象——在之前的GPT-4,画图工具Dall-E,Bing搜索,插件,和代码解释器,都需要切换不同的会话/窗口实现的。后来GPT-4成为了GPT:All-Tools,可以在一个会话里根据用户需求和上下文自行选择工具,并且做出行动——这个行动,就是OpenAI定义的“Action”,如下图:当你在让它搜索,画图的时候,GPT会先思考决定怎么使用工具,然后会出现一个小图示,告诉你他尝试使用工具来完成你的任务。现在你应该能够认清AI-Agent、GPT和Action之间的联系了:GPT(All-Tools,也是现在大家正在开发的“GPTs”),是OpenAI之于传统Agent定义交上的一份答卷——具体的描绘了在大语言模型(LLM)驱动下Agent的系统实现方式。即:使用LLM驱动,通过外部API获取信息和执行的行动(Action),也是本文后半部提到的Action的定义,如下:
解释了GPTs目前还不是真正的智能代理,但它可以通过结构化提示完成一些有用的任务。随后介绍了如何通过对话与AI交互来构建GPT模型,以及如何修改和完善结构化提示来提升GPT模型的功能。文章还提到GPTs可以连接到其他系统中,比如邮箱或购物网站,从而让AI能够完成更广泛的任务,预示着下一代更智能的AI将要来临。同时也指出连接到更多系统会带来更高的安全风险。文章重点介绍了如何利用GPTs为教育和工作创造有用的工具。比如通过GPT为写作指导创建一个交互式写作辅导工具。同时也提到如何为自己教授的课程创建定制化的GPT助教。
本文不代表智谱认同文中任何观点。为鼓励自由发言,我们也暂时不披露参与者个人信息,不做流水账,抛开敏感信息,分类整理如下。后面继续办,一起来聊!🌊以下为本文目录,建议结合要点进行针对性阅读。一、Agent什么是Agent?具备什么能力?观点一:狭义的Agent,由OpenAI定义观点二:广义的Agent,具有基础智能、角色管理、技能调用、复杂思维、及未来更多的可扩展性Agent在B端的落地到底情况如何?观点一:设想与现实之间的gap有多大?人和大模型长期共存观点二:在Autonomy Agent或multi-agent成熟之前,大模型应从“对外业务”和“简单功能”切入To B服务观点三:大模型要做专家知识,还是通用知识?观点四:人机边界识别,工程落地能力,基座模型能力,并驾齐驱,同样重要未来可能有机会的方向二、在DevDay之后,国产大模型和OpenAI之间的差距是扩大了还是缩小了?三、AI LLMOps及开源社区OpenAI对AI Ops的态度如何?观点一:中间件挡住了Open AI的数据飞轮,注定会被吞没,开源中间件是在帮助OpenAI打磨产品那么,什么形态的AI Ops会/不会挡住OpenAI数据飞轮?观点一:哪些AI Ops会挡住OpenAI数据飞轮观点二:哪些AI Ops不会挡住OpenAI数据飞轮AI Ops公司们应该怎样调整入场姿势?