要让智能体输出内容的格式为 PDF ,可以参考以下步骤:
值得注意的是,Coze 支持 Markdown 格式输出 AI 生成的内容,Markdown 作为轻量级文本标记语言,能够有效展示文本、图片、URL 链接和表格等多种内容形式。前两者可直接用 Markdown 输出/嵌入,音频则需通过 URL 链接跳转外部网页收听。总体而言,通过稍加变通,基本可以实现所需功能。
在开始设计和开发任何AI Agent之前,最关键的第一步是明确定义你期望AI最终输出的结果。这包括:1.详细描述期望获得的输出内容1.1.是文本、图像、音频还是其他形式的数据?1.2.输出的具体格式和结构是什么?1.3.确定输出内容的质量标准2.预估任务的可行性3.确定任务的执行形式以LearnAndRecord的一篇文章[《全球多地遭遇微软蓝屏》](https://mp.weixin.qq.com/s/6R-Wph0yVmtwqPpAahFbDA)为例,拆解其结构可以分为如下框架:这种结构设计非常适合外语学习者,从小作业到全文精读,再到重点单词盘点,很符合外语学习者的精读需求。基于LearnAndRecord的框架,假设我是CET-4英语学习者,对架构进行了微调后,优化后的精读结构如下(使用Markdown语法表示):值得注意的是,Coze支持Markdown格式输出AI生成的内容。Markdown作为轻量级文本标记语言,能够有效展示文本、图片、URL链接和表格等多种内容形式。参照精读结构,评估任务的可行性,我们的生成结果包括三类输出格式:文字、图片(思维导图)、音频(原文音频)前两者可直接用Markdown输出/嵌入,音频则需通过URL链接跳转外部网页收听。总体而言,通过稍加变通,基本可以实现所需功能。最后结合使用习惯,我期望在我输入一篇英文原文时,AI Agent能够按模板要求,直接输出精读结果。所以,大致预期的执行形式如下:
在开始设计和开发任何AI Agent之前,最关键的第一步是明确定义你期望AI最终输出的结果。这包括:1.详细描述期望获得的输出内容1.1.是文本、图像、音频还是其他形式的数据?1.2.输出的具体格式和结构是什么?1.3.确定输出内容的质量标准2.预估任务的可行性3.确定任务的执行形式以LearnAndRecord的一篇文章[《全球多地遭遇微软蓝屏》](https://mp.weixin.qq.com/s/6R-Wph0yVmtwqPpAahFbDA)为例,拆解其结构可以分为如下框架:这种结构设计非常适合外语学习者,从小作业到全文精读,再到重点单词盘点,很符合外语学习者的精读需求。基于LearnAndRecord的框架,假设我是CET-4英语学习者,对架构进行了微调后,优化后的精读结构如下(使用Markdown语法表示):值得注意的是,Coze支持Markdown格式输出AI生成的内容。Markdown作为轻量级文本标记语言,能够有效展示文本、图片、URL链接和表格等多种内容形式。参照精读结构,评估任务的可行性,我们的生成结果包括三类输出格式:文字、图片(思维导图)、音频(原文音频)前两者可直接用Markdown输出/嵌入,音频则需通过URL链接跳转外部网页收听。总体而言,通过稍加变通,基本可以实现所需功能。最后结合使用习惯,我期望在我输入一篇英文原文时,AI Agent能够按模板要求,直接输出精读结果。所以,大致预期的执行形式如下:
在上一步中,我们已经生成了英文阅读大纲{{enTreeMind}},接下来就是用<generateTreeMind>插件节点,接收思维导图的原材料文本,自动生成我们所需的思维导图。1)确定处理方式:由于我们一次精读任务,仅需生成一张思维导图,所以处理方式选择“单次”。2)确定输入:在输入区,该插件仅需设置{{query_text}}变量,格式是string字符串。所以只需要引用“标题、导语、大纲”节点的{{enTreeMind}}变量即可。3)确定输出:观察输出区,能看到有很多的输出字段。为了确定插件生成的导图的对应字段,可以根据字段名称、「查看示例」中的示例说明,或者试运行后定位所需的字段。我们所需的是图片格式的思维导图,所以确定pic就是需要的输出。至此,第一个子任务流程分支已集齐了预期的输出字段:附:为什么能提前在前一个节点确认思维导图的所需输入格式?如果插件上架的时候,说明写的比较规范,可以看插件的示例说明。这个插件说的是AI思维导图软件,但是请求体写的很简单,其实没法确定如何稳定生成预期结果。但既然是AI思维导图软件,所以猜测通过类似prompt的指令就能控制输出结果。所以尝试沿用大部分思维导图软件在转换为大纲时的常见格式,方便大模型理解。实际单节点测试下来,输出结构确实是ok的。