开发 Agent 可以从以下几个方面考虑:
我是个ComfyUI新人。在此之前更多的是使用Coze来做Agent,涉及到绘图的功能也是调用Coze的图像流来完成。但当时的图像流还挺弱的,我曾为了优化这个问题在Glif上做了若干个Bot,以插件调用API的方式来完成绘图功能的调用。Glif提供了一个有限节点集合的云端ComfyUI,带来了更多图像的玩法。这个过程让我也有些新的体会Coze的工作流和ComfyUI的图像流代表了在Agent内部这两个子领域最领先水平。但大多数同学是专注在其中一个领域中持续的精进。好处是在扎的够深才能做出真正落地的Agent。短期的短板另一块非常依赖平台或社区来建设弥补。举两个相对的例子:1.从熟悉Coze的同学视角,在Coze上有非常丰富的工作流节点和配套能力,开发助理类Bot非常便捷,但在流程中如果想出图自由度是不高的,几乎依赖平台的封装,或一些三方的插件。2.从熟悉ComfyUI的同学视角,ComfyUI有非常繁荣开源的节点和图像模型来完成高水平的图像,视频流。但流程本身的Agent含量不高,可能在反推图像信息会使用到Ollama等一些本地大模型。那其实我们只要从自己擅长的阵地向另一块阵地多迈出一步,就能揉合更整体的把控住在一个Agent中如何设计和运用各种节点来实现最终想要的,多掌握一些,限制就少一些。题外话:现在Coze将图像流的概念弱化拆解掉,可能也是认为优秀的Agent开发者,在一个Agent中使用工程节点和图像节点应该是灵活相通的,不需要过多设限。
(这部分是应用开发相关的,不是GPTs)其实赚钱的方式有很多种,在财猫同学的群里,我也结交了很多通过AI赚到钱的朋友。Key商、写书、卖课、接项目、做镜像站等等等等...但是如果真正从做产品的角度去说的话,我选择的方向还是Agent。在上面提到过的WebPilot作者,最近又开发了一个长文写作的Agent,对外提供接口。效果非常惊艳,作为同行,我研究了很久,还是忍不住给出赞叹!我本人其实一直都是Agent的忠实拥护者,看过市面上大多的开源框架,也研究了很多闭源产品的实现。早先的时候我也天真地想过自己做一套通用的框架,在各种场景里去用。后来等到真正做的时候才发现,这个想法其实现阶段还是比较天真。这麽多年产品的经验也告诉我,熟悉业务才是正道。熟悉业务之后,结合AI的能力真正去打磨产品,这部分东西,就是护城河。这个方向,也是我始终认为AI应用开发者应该坚持的一个方向。所以,加油吧,朋友们,期待AGI早日到来。
毫无疑问,AI Agent开发正迎来一个重要的市场机遇期。当下,我们正在经历AI带来的人机交互范式的重大转变。从精准交互到理解模糊意图,从信息孤岛到整合多源信息,从单一功能到全流程服务,每个领域都在寻找适合自己的Agent解决方案。这种转变带来了前所未有的开发需求。在众多智能体编排平台中,百宝箱的基因优势尤为突出。依托支付宝庞大的线上线下商家网络和生活服务小程序生态,它为开发者打开了一扇通向本地生活服务的大门。而本地生活服务恰恰是最能体现Agent价值的领域,一次外出用餐可能涉及查店、订位、导航、点餐、支付、评价等多个环节;一次旅行计划可能需要机票、酒店、景点、用餐等诸多安排。这些由多个微需求组成的复杂场景,正是Agent最擅长应对的。技术的浪潮永不止息,而真正的应用机遇常常在于发现那些最贴近生活、最困扰用户的痛点。“让复杂的事情变简单”,这正是AI Agent开发者的使命所在。过去的互联网革新了信息获取,而未来的Agent将革新服务体验。对开发者而言,这无疑是一个值得深耕的新蓝海。BTW,如果你也想参加支付宝百宝箱的创作者活动,来官方群里跟进迭代进度,看看其他开发者都在搓什么👇https://mp.weixin.qq.com/s/Lz9leZy9HYSz71Wu8_-fUA以上,既然看到这里,如果觉得不错,不妨随手点个赞、在看、转发三连,这将对我有很大的帮助。谢谢你的阅读🌟