以下是一些 AI Agent 的开源项目及相关信息:
此外,还有以下开源项目:
LLM可以成为AI Agent的“大脑”主要是因为它具备了以下的关键能力1.复杂语言理解:LLM经过大规模数据训练,具备理解和处理自然语言的能力,包括语法、句法以及言外之意。2.丰富的世界知识:训练数据覆盖广泛的知识域,模型可以连结不同的信息片段,进行知识推理和应用。3.上下文感知:能够根据上下文信息做出响应,连贯地处理对话或相关任务,这在处理持续的交互中非常重要。4.生成能力:不仅能够理解信息,还能够创建回答、文章甚至代码,这在任务自动化中尤为重要。5.适应不同场景:通用性和可定制性使得LLM能够适应各种不同的应用场景和需求,类似于大脑如何通过学习适应新环境。6.持续学习能力:一些LLM可通过进一步训练根据反馈学习和提升,类似于大脑通过经验学习。[heading2]1.5 AI Agent的开源项目[content][AutoGPT](https://github.com/Significant-Gravitas/AutoGPT)[BabyAGI](https://github.com/yoheinakajima/babyagi)[MetaGPT](https://github.com/geekan/MetaGPT)[GPT Researcher](https://github.com/assafelovic/gpt-researcher)[AI-16Z的AI-town](https://github.com/a16z-infra/ai-town)[斯坦福的AI-Town](https://github.com/joonspk-research/generative_agents)[ChatDev](https://github.com/OpenBMB/ChatDev)
DeepSeek-V3-Base宣布开源。685B参数,256个专家动态路由,效率与性能兼备在aider多语言编程测评超过Claude 3.5 Sonnet-20241022和Gemini Exp-1206。🌟地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main[heading3]智谱开源新的GUI Agent:CogAgent-9B-20241220[content]CogAgent仅依赖于屏幕截图作为输入(无需HTML等文本表征),可以根据用户指定的任意任务,结合过往的操作历史,预测下一步的GUI操作。在GUI感知、推理预测准确性、动作空间完善性、任务的普适和泛化性上得到了大幅提升,能够接受中英文双语的屏幕截图和语言交互。1.模型基座和结构升级:使用更强大的视觉语言模型GLM-4V-9B作为基座模型,大幅提升模型的基座图像理解性能。2.视觉处理模块优化:实现了更高效统一的视觉处理模块,支持1120*1120原生高分辨率图像输入。3.数据集丰富与完善4.预训练策略优化,后训练策略改进,模型推理及思维链优化此版CogAgent模型已被应用于智谱AI的GLM-PC产品🌟地址:https://cogagent.aminer.cn/blog#/articles/cogagent-9b-20241220-technical-report申请内测:[https://cogagent.aminer.cn/home](https://cogagent.aminer.cn/home)如有任何问题请联系后台~电子邮箱:alolg@163.com
准确的来说,AI Agent指的是一种智能代理系统,它接近人类的大脑,可形成记忆、达成行动规划、自动交互、主动预测。目前AI Agent的概念在市场上并没有达成共识,存在被广泛滥用的现象。(很多Chatbot应用给Bot冠以“智能体”的名称,准确的说是对Agent的误用)[heading3]AI Agent应用的特点:[content]个性化:随着用户的使用越来越了解用户习惯和想法,从而作出喜好预测Dot App在对话中了解用户喜好,随后为用户推荐新的咖啡店自主完成任务:Auto GPT:用户输入一个目标后,可自主执行任务、递归地开发和调试代码多Agent协作斯坦福大学的SmallVille(小镇)项目,现已开源25个人工智能体居住在一个沙盒虚拟城镇中通过复杂的社交互动来执行他们的日常生活Fixie AI在收到用户请求后启动多个负责不同模块的Agent进行数据查询和传递,最终生成邮件内容给客户回复博主林亦LYi的《AI炒股?我开了一家员工全是AI的公司,自动帮我炒股》就在某种程度上实现了多Agent协作的能力:目前,AI Agent应用大多集中在2B场景,面向个人消费者的产品少之又少。一方面是高度智能化的Agent能力需要打磨,概念落地还有较长一段距离;一方面是AI和娱乐消费诉求的结合还几乎没有,其主要带来的是生产方式变革和效率变革。个人消费者方向,目前只看到“私人助理”场景。