Chat with Wiki - 如果开发agent

Answer

开发 Agent 可以从以下几个方面考虑：

技术基础与经验：
- 对于 ComfyUI 新人来说，之前更多使用 Coze 做 Agent，涉及绘图功能会调用 Coze 的图像流。但图像流较弱时，会在 Glif 上做 Bot 并以插件调用 API 完成绘图功能。Glif 提供的云端 ComfyUI 带来更多图像玩法。
- Coze 的工作流和 ComfyUI 的图像流代表了 Agent 内部两个子领域的领先水平，但大多数同学专注一个领域精进，好处是能做出落地的 Agent，短期短板是依赖平台或社区弥补。
- 例如，熟悉 Coze 的同学开发助理类 Bot 便捷，但出图自由度不高；熟悉 ComfyUI 的同学能完成高水平图像、视频流，但流程中 Agent 含量不高。
- 只要从擅长的阵地向另一块多迈出一步，就能更好把控 Agent 中各种节点的设计和运用。
赚钱与应用方向：
- 赚钱方式多样，如 Key 商、写书、卖课、接项目、做镜像站等。
- 从做产品角度，选择的方向是 Agent。如 WebPilot 作者开发长文写作的 Agent 并对外提供接口。
- 熟悉业务结合 AI 能力打磨产品是护城河，是 AI 应用开发者应坚持的方向。
市场机遇：
- AI Agent 开发正迎来重要市场机遇期，我们正经历人机交互范式的重大转变。
- 从精准交互到理解模糊意图，从信息孤岛到整合多源信息，从单一功能到全流程服务，每个领域都在寻找适合的 Agent 解决方案，带来前所未有的开发需求。
- 百宝箱的基因优势突出，依托支付宝庞大的线上线下商家网络和生活服务小程序生态，为开发者打开通向本地生活服务的大门。
- 本地生活服务是体现 Agent 价值的领域，复杂场景正是 Agent 擅长应对的。
- 技术浪潮不停，发现贴近生活、困扰用户的痛点是应用机遇，“让复杂的事情变简单”是开发者的使命。

Content generated by AI large model, please carefully verify (powered by aily)

References

我是个ComfyUI新人。在此之前更多的是使用Coze来做Agent，涉及到绘图的功能也是调用Coze的图像流来完成。但当时的图像流还挺弱的，我曾为了优化这个问题在Glif上做了若干个Bot，以插件调用API的方式来完成绘图功能的调用。Glif提供了一个有限节点集合的云端ComfyUI，带来了更多图像的玩法。这个过程让我也有些新的体会Coze的工作流和ComfyUI的图像流代表了在Agent内部这两个子领域最领先水平。但大多数同学是专注在其中一个领域中持续的精进。好处是在扎的够深才能做出真正落地的Agent。短期的短板另一块非常依赖平台或社区来建设弥补。举两个相对的例子：1.从熟悉Coze的同学视角，在Coze上有非常丰富的工作流节点和配套能力，开发助理类Bot非常便捷，但在流程中如果想出图自由度是不高的，几乎依赖平台的封装，或一些三方的插件。2.从熟悉ComfyUI的同学视角，ComfyUI有非常繁荣开源的节点和图像模型来完成高水平的图像，视频流。但流程本身的Agent含量不高，可能在反推图像信息会使用到Ollama等一些本地大模型。那其实我们只要从自己擅长的阵地向另一块阵地多迈出一步，就能揉合更整体的把控住在一个Agent中如何设计和运用各种节点来实现最终想要的，多掌握一些，限制就少一些。题外话：现在Coze将图像流的概念弱化拆解掉，可能也是认为优秀的Agent开发者，在一个Agent中使用工程节点和图像节点应该是灵活相通的，不需要过多设限。

从GPTs/GLMs如何赚钱谈起：AI应用的曙光在哪？

（这部分是应用开发相关的，不是GPTs）其实赚钱的方式有很多种，在财猫同学的群里，我也结交了很多通过AI赚到钱的朋友。Key商、写书、卖课、接项目、做镜像站等等等等...但是如果真正从做产品的角度去说的话，我选择的方向还是Agent。在上面提到过的WebPilot作者，最近又开发了一个长文写作的Agent，对外提供接口。效果非常惊艳，作为同行，我研究了很久，还是忍不住给出赞叹！我本人其实一直都是Agent的忠实拥护者，看过市面上大多的开源框架，也研究了很多闭源产品的实现。早先的时候我也天真地想过自己做一套通用的框架，在各种场景里去用。后来等到真正做的时候才发现，这个想法其实现阶段还是比较天真。这麽多年产品的经验也告诉我，熟悉业务才是正道。熟悉业务之后，结合AI的能力真正去打磨产品，这部分东西，就是护城河。这个方向，也是我始终认为AI应用开发者应该坚持的一个方向。所以，加油吧，朋友们，期待AGI早日到来。

搓了一周支付宝智能体，我看到的人机交互新未来

毫无疑问，AI Agent开发正迎来一个重要的市场机遇期。当下，我们正在经历AI带来的人机交互范式的重大转变。从精准交互到理解模糊意图，从信息孤岛到整合多源信息，从单一功能到全流程服务，每个领域都在寻找适合自己的Agent解决方案。这种转变带来了前所未有的开发需求。在众多智能体编排平台中，百宝箱的基因优势尤为突出。依托支付宝庞大的线上线下商家网络和生活服务小程序生态，它为开发者打开了一扇通向本地生活服务的大门。而本地生活服务恰恰是最能体现Agent价值的领域，一次外出用餐可能涉及查店、订位、导航、点餐、支付、评价等多个环节；一次旅行计划可能需要机票、酒店、景点、用餐等诸多安排。这些由多个微需求组成的复杂场景，正是Agent最擅长应对的。技术的浪潮永不止息，而真正的应用机遇常常在于发现那些最贴近生活、最困扰用户的痛点。“让复杂的事情变简单”，这正是AI Agent开发者的使命所在。过去的互联网革新了信息获取，而未来的Agent将革新服务体验。对开发者而言，这无疑是一个值得深耕的新蓝海。BTW，如果你也想参加支付宝百宝箱的创作者活动，来官方群里跟进迭代进度，看看其他开发者都在搓什么👇https://mp.weixin.qq.com/s/Lz9leZy9HYSz71Wu8_-fUA以上，既然看到这里，如果觉得不错，不妨随手点个赞、在看、转发三连，这将对我有很大的帮助。谢谢你的阅读🌟