要使用 Coze 实现一个支持音频调用的心理学调研智能体,您可以按照以下步骤进行操作:
在配置子任务节点时:
首先进入Coze,点击「个人空间-工作流-创建工作流」,打开创建工作流的弹窗。根据弹窗要求,自定义工作流信息。点击确认后完成工作流的新建,可以看到整个编辑视图与功能如下:其中,左侧「选择节点」模块中,根据我们的子任务需要,实际用上的有:1.插件:提供一系列能力工具,拓展Agent的能力边界。本案例涉及的思维导图、英文音频,因为无法通过LLM生成,就需要依赖插件来实现。2.大模型:调用LLM,实现各项文本内容的生成。本案例的中文翻译、英文大纲、单词注释等都依赖大模型节点。3.代码:支持编写简单的Python、JS脚本,对数据进行处理。而编辑面板中的开始节点、结束节点,则分别对应1.2分解子任务流程图中的原文输入和结果输出环节。接下来,按照流程图,在编辑面板中拖入对应的LLM大模型、插件、代码节点,即可完成工作流框架的搭建。
[@小互(@imxiaohu)](https://x.com/imxiaohu)日报1⃣️?TheoremExplainAgent:AI生成数学&科学定理动画双智能体架构,结合大模型推理、动画生成、语音合成。自动制作5+分钟视频,适用于数学、物理、计算机科学等STEM领域。?[介绍](https://x.com/imxiaohu/status/1895089392127279517)|[详情](https://www.xiaohu.ai/c/xiaohu-ai/theoremexplainagent)2⃣️?️ElevenLabs发布全球最精准语音转文字模型Scribe支持99语言,准确率超越Gemini 2.0和Whisper v3。可识别32个说话者,标记笑声、鼓掌等非语言元素。单词级时间戳+结构化JSON输出,便于字幕&开发集成。?[介绍](https://x.com/imxiaohu/status/1895037124954747308)|[详情](https://www.xiaohu.ai/c/xiaohu-ai/elevenlabs-scribe-99)3⃣️?5分钟用Coze免费创建AI机器人!DeepSeek R1驱动,支持Function Calling,调用外部工具。完全免费+图文教程,快速搭建你的AI机器人。?体验我的AI:小互教你谈恋爱?[点击体验](https://coze.cn/s/i5Y1wcBx/)?[教程](https://x.com/imxiaohu/status/1894998739091431675)|[完整图文>>更多详细内容查看[XiaoHu.AI日报](https://waytoagi.feishu.cn/wiki/T2fUwmHBSiHU6Ukq9Imcu7n7nMh)
1.关于模型选择:1.1.没有强制必须用某个模型的说法。而是根据自己的习惯、实测的响应速度、生成质量、调用费用,进行综合选择。比如Doubao Function Call模型,对于插件调用、Coze内json格式输出比较擅长;MiniMax处理文字速度很快;GLM对于用户提示词的理解比较好。每个模型都有自己擅长的特点,而且每家模型都在不断的迭代。所以模型的选用,需要根据实测情况综合调整。1.2.我一般选择豆包·function call 32k。“function call”代表有着更好的Coze的工具调用能力,“32k”代表模型的上下文窗口大小,即模型在处理文本时能够考虑的单词或标记的数量。如果输出和输入的类型不是纯文本时,比如是array、object结构,请根据实测情况,考虑替换上豆包function call版本,其他的LLM可能会输出格式比较混乱。