以下是一些可参考的做 chatbot 的开源项目:
如果大家使用Kimi Chat来查询某个问题,你会发现它会在互联网上检索相关内容,并基于检索结果进行总结分析,最后给出结论。这其实是大模型利用「网页搜索」工具的一个典型例子,同时你也会看到PPT中介绍了非常多的不同领域类型的工具,它其实是为大模型在获取、处理、呈现信息上做额外的补充。PlanningAgent通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。比如下图中:Agent会先识别男孩的姿势,并可能找到一个姿势提取模型来识别姿势,在接下来要找到一个姿势图像模型来合成一个新的女孩图像,然后再使用图像理解文本的模型,并在最后使用语音合成输出,完成这个流程任务。Multiagent Collaboration吴恩达通过开源项目ChatDev进行举例,你可以让一个大语言模型扮演不同的角色,比如让一个Agent扮演公司CEO、产品经理、设计师、代码工程师或测试人员,这些Agent会相互协作,根据需求共同开发一个应用或者复杂程序。AI Agent基本框架OpenAI的研究主管Lilian Weng曾经写过一篇博客叫做《LLM Powered Autonomous Agents》,其中就很好的介绍了Agent的设计框架,她提出了“Agent=LLM+规划+记忆+工具使用”的基础架构,其中大模型LLM扮演了Agent的“大脑”。Planning(规划)主要包括子目标分解、反思与改进。将大型任务分解为较小可管理的子目标处理复杂的任务。而反思和改进指可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。Memory(记忆)
[heading1]ShowMeAI周刊No.11[content]1.把350万条Midjourney提示词,放进一张可视化图里?!!!2.2套权威的AI术语表,从此拿捏术语翻译:机器之心+GPT Academic+ChatPaper&清华大学3.天工新功能的定位竟然靠近元宇宙?以及,颜值果然是爆款第一生产力!4.NotebookLM≠AI播客,但开发者们把「AI播客」玩出了新花样5.Bob≈能选多种大模型的、更轻巧的「豆包」桌面端应用6.Monica.im:从浏览器插件到全家桶,之后还要推出中国版Cursor7.物圆TreLoop:AI版「闲鱼+小红书」火了,但团队觉得做产品不能太「AI」8.所以,AGI还太遥远,我们先回归对「产品本质」的讨论9.Arc浏览器进入维护状态,但公司决定整个大活儿,把新的浏览器做成应用平台10.李开复很忙:2025上半年2C应用爆发,2030年实现AGI,中国面对霸权要发展应用11.跟着李继刚玩Prompt似乎成了一种潮流?本周发现的新玩法、新讨论12.OpenAI研究副总裁(安全)翁茘(Lilian Weng)离职13.zmh:15岁已有7年开发经验,开源项目ChatNio被数百万收购14.讨论:关于AI编程我算了本「效率账」,结果发现有点亏(⊙_⊙)?公众号菜单栏底部有星球入口添加南乔(AhaNanQiao)好友进社群!
🫧宝玉日报「10月1日」✨✨✨✨✨✨✨✨1⃣️💬AI开源项目推荐:ChatMLX多语言支持:英语、简体中文、繁体中文、日语、韩语。多模型兼容:支持Llama、OpenELM、Phi、Qwen、Starcoder、Cohere等模型。高性能与隐私保障:基于MLX和Apple silicon,本地运行确保用户隐私与数据安全。应用场景:适用于需要高性能且注重隐私的对话应用开发者。🔗[https://github.com/maiqingqiang/ChatMLX](https://github.com/maiqingqiang/ChatMLX)2⃣️📉OpenAI转型的阵痛:商业化之路带来的挑战内部紧张:CEO山姆·奥特曼的领导风格和公司商业化步伐引发高管离职潮。文化冲突:公司逐渐偏向商业优先,原本的研究文化受到冲击。关键发展:预计将推出GPT-5,但面临竞争对手(如Anthropic和xAI)的挑战。融资与扩展:OpenAI员工从770人扩展到1700人,寻求65亿美元融资。前景分歧:有人认为商业化是必要之举,有人则担忧公司的初衷已被损害。🔗[https://x.com/dotey/status/1839904630894989670](https://x.com/dotey/status/1839904630894989670)3⃣️🗣️GPT-4o高级语音模式与英语学习App的未来