以下是关于制作书籍内容整理智能体的相关信息:
创建智能体:
生物医药小助手智能体:
AI 稍后读助手:
本地word文件,这里要注意了~~~如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面画小二这个课程80节课程,分为了11个章节,那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法,首先将11章的大的章节名称内容放进来,如下图所示。章节内详细内容格式如下如所示,如果你再分节的内容,依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据,这里不再赘述。
这个智能体是由1个工作流+6个数据库实现的。工作流的设计比较简单,一个input,对接知识库,然后搭载豆包function call大模型,最后是一个output。6个数据库分别是我的公众号发表过的文章+执业药师教材(做第一个知识库的时候没经验,其实应该分开成两个数据库)、执业医师讲义、药监局新药审评报告、中国医药企业融资动态、药物对外授权(BD)动态、全球药物销售额。工作流是非常简单的,相对有难度的是收集知识库的资料并根据清洗结果进行手动二次校对(需要一定专业知识)。也许有人要问,医药知识我直接问大模型不好吗?大模型的语料来源庞杂,广度一定是比智能体好很多的,但是在医疗这个严肃领域,对回答准确性的要求非常高。为了避免出现误导性的回答,我在提示词中约定了回答只能来自于知识库。也许有问题超出知识库范畴的情况,但还没发现智能体回答是医学上不严谨的现象。广or精准,在医疗领域一定是精准优先的。
基于前面的分析,我们可以勾勒出AI稍后读助手的大致思路:1.简化"收集":2.实现跨平台收集功能,支持电脑(web端)、安卓、iOS多端操作。3.考虑到待阅读内容通常都有网页链接,最理想的方式是只需输入一个URL就能完成收集。借鉴微信文件传输助手的直观操作方式,通过聊天窗口完成收集输入会更符合用户习惯。4.自动化"整理入库":5.为便于存储和回顾已收集的阅读清单,系统应在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。6.同时,这份阅读清单最好也能支持跨平台查看,提高可访问性。7.智能"选择"推荐:8.根据当前收藏记录,结合用户的阅读兴趣,进行相关性匹配,并生成最合适的阅读计划。根据以上思路不难发现,同在字节生态中的Coze、飞书、飞书多维表格,正好可以为AI稍后读构建一个完整的AI工作流。具体来说:通过飞书机器人与Coze搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出由Coze调用大模型、插件,完成内容的整理、推荐