Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何搭建一个本地的ai助手,通过学习本地文档进行训练

Answer

搭建一个本地的 AI 助手并通过学习本地文档进行训练,可参考以下步骤:

  1. 设计 AI 机器人:
    • 编写【prompt】提示词,设定 Bot 的身份和目标。
  2. 创建知识库:
    • 整理“关键字”与“AI 相关资料链接”的对应关系,并将信息存储起来。
    • 创建知识库路径:个人空间 - 知识库 - 创建知识库。
    • 知识库文档类型支持本地文档、在线数据、飞书文档、Notion 等,本次使用【本地文档】。
    • 按照操作指引上传文档、分段设置、确认数据处理。
    • 小技巧:在内容中加上特殊分割符“###”,以便于自动切分数据。分段标识符号选择“自定义”,内容填“###”。
    • 同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。
  3. 创建工作流:
    • 告诉 AI 机器人应该按什么流程处理信息。
    • 创建工作流路径:个人空间 - 工作流 - 创建工作流。
    • 工作流设计好后,先点击右上角“试运行”,测试工作流无误后,就可以点击发布。
    • 如果任务和逻辑复杂,可以结合左边“节点”工具来实现。比如:可以在工作流中再次调用【大模型】,总结分析知识库内容;可以调用【数据库】存储用户输入的信息;可以调用【代码】来处理复杂逻辑等。
    • 个人建议:工作流不必复杂,能实现目的即可,所以在设计 Bot 前“确定目的”和“确定功能范围”很重要。

另外,您还可以参考以下 10 分钟在网站上增加一个 AI 助手的方法:

  1. 搭建示例网站:
    • 点击这里打开提供的函数计算应用模板,参考下图选择直接部署、并填写前面获取到的百炼应用 ID 以及 API-KEY。
    • 其他表单项保持默认,点击页面左下角的创建并部署默认环境,等待项目部署完成(预计耗时 1 分钟)。
  2. 为网站增加 AI 助手:
    • 增加 AI 助手相关代码:回到应用详情页,在环境详情的最底部找到函数资源,点击函数名称,进入函数详情页。在代码视图中找到 public/index.html 文件,然后取消③所在位置的代码注释即可。最后点击部署代码,等待部署完成。
    • 验证网站上的 AI 助手:重新访问示例网站页面以查看最新效果。此时您会发现网站的右下角出现了 AI 助手图标,点击即可唤起 AI 助手。
Content generated by AI large model, please carefully verify (powered by aily)

References

「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人

[heading5]3)创建【知识库】,整理“关键字”与“AI相关资料链接”的对应关系,并将信息存储起来。创建知识库路径:个人空间-知识库-创建知识库知识库文档类型支持:本地文档、在线数据、飞书文档、Notion等,本次使用【本地文档】按照操作指引上传文档、分段设置、确认数据处理。💡小技巧:知识库好不好用,跟内容切分粒度有很大关系,我们可以在内容中加上一些特殊分割符,比如“###”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“###”。最终的知识库结果如下,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。[heading5]4)创建【工作流】,告诉AI机器人应该按什么流程处理信息。[content]创建工作流路径:个人空间-工作流-创建工作流“AI前线”Bot的工作流最终结果如上,本次只用到了“知识库”进行处理。工作流设计好后,先点击右上角“试运行”,测试工作流无误后,就可以点击发布啦。如果任务和逻辑复杂,可以结合左边“节点”工具来实现。比如:可以在工作流中再次调用【大模型】,总结分析知识库内容;可以调用【数据库】存储用户输入的信息;可以调用【代码】来处理复杂逻辑等等;💡个人建议:工作流不必复杂,能实现目的即可,所以在设计Bot前“确定目的”和“确定功能范围”很重要。

「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人

[heading5]3)创建【知识库】,整理“关键字”与“AI相关资料链接”的对应关系,并将信息存储起来。创建知识库路径:个人空间-知识库-创建知识库知识库文档类型支持:本地文档、在线数据、飞书文档、Notion等,本次使用【本地文档】按照操作指引上传文档、分段设置、确认数据处理。💡小技巧:知识库好不好用,跟内容切分粒度有很大关系,我们可以在内容中加上一些特殊分割符,比如“###”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“###”。最终的知识库结果如下,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。[heading5]4)创建【工作流】,告诉AI机器人应该按什么流程处理信息。[content]创建工作流路径:个人空间-工作流-创建工作流“AI前线”Bot的工作流最终结果如上,本次只用到了“知识库”进行处理。工作流设计好后,先点击右上角“试运行”,测试工作流无误后,就可以点击发布啦。如果任务和逻辑复杂,可以结合左边“节点”工具来实现。比如:可以在工作流中再次调用【大模型】,总结分析知识库内容;可以调用【数据库】存储用户输入的信息;可以调用【代码】来处理复杂逻辑等等;💡个人建议:工作流不必复杂,能实现目的即可,所以在设计Bot前“确定目的”和“确定功能范围”很重要。

10分钟在网站上增加一个AI助手

在让AI助手能准确回答问题之前,我们可以先尝试快速将AI助手集成到网站中。您可以通过我们提前准备好的应用模板,快速搭建一个空白的示例网站,用于模拟您的企业官网或者其他站点。详细步骤如下:[heading3]2.1创建应用[content]请点击[这里](https://fcnext.console.aliyun.com/applications/create?template=web-chatbot&from=solution)打开我们提供的函数计算应用模板,参考下图选择直接部署、并填写前面获取到的百炼应用ID以及API-KEY。然后其他表单项保持默认,点击页面左下角的创建并部署默认环境,等待项目部署完成即可(预计耗时1分钟)。[heading3]2.2访问网站[content]应用部署完成后,您可以在应用详情的环境信息中找到示例网站的访问域名,点击即可查看,确认示例网站已经部署成功。[heading2]3.为网站增加AI助手[content]在网站中增加AI助手非常简单,您只需要在网站的html文件中插入几行代码。[heading3]3.1增加AI助手相关代码[content]示例工程中包含了被注释的引入AI助手代码,您需要找到并解除注释。详细操作步骤如下:1.回到应用详情页,在环境详情的最底部找到函数资源,点击函数名称,进入函数详情页。1.2.在代码视图中找到public/index.html文件,然后取消③所在位置的代码注释即可。1.2.最后点击部署代码,等待部署完成即可。[heading3]3.2验证网站上的AI助手[content]现在,您可以重新访问示例网站页面以查看最新效果。此时您会发现网站的右下角出现了AI助手图标,点击即可唤起AI助手。

Others are asking
ai初步怎么学习
以下是新手学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 对于中学生学习 AI 的补充建议: 从编程语言入手学习,如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等,探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 学习 AI 基础知识,包括基本概念、发展历程、主要技术如机器学习、深度学习等,以及在教育、医疗、金融等领域的应用案例。 参与 AI 相关的实践项目,参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题。 关注 AI 发展的前沿动态,关注权威媒体和学者,思考 AI 技术对未来社会的影响。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-07
有没有ai制作海报的软件或者网站,最好能理解案例图片的
以下是一些可以用 AI 制作海报的软件和网站,并为您附上相关案例和使用方法: 1. 无界 AI: 网址:https://www.wujieai.cc/ 做图逻辑类似于 SD,优势在于国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。 应用场景示例:朋友圈 po 图,画幅比例选择 1:1。 皮克斯卡通模型位置:二次元模型》模型主题》皮克斯卡通。 关键词类别:场景(如向日葵花田、面包店等)、氛围(如温馨、温暖等)、人物(如父亲和女儿、父亲和儿子)、造型(如发型、发色、服饰、配饰)、情绪(如笑得很开心、大笑、对视等)、道具(如童话书等)、构图(如半身、中景等)、画面(色彩明艳)。 2. Canva(可画): 网址:https://www.canva.cn/ 是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,用户可通过简单拖放操作创建海报,其 AI 功能可帮助选择合适颜色搭配和字体样式。 3. 稿定设计: 网址:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 4. VistaCreate: 网址:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 5. Microsoft Designer: 网址:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子和其他视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,大大简化设计流程。 此外,还有东阿阿胶的海报设计案例分享: 1. 拆解步骤:得到需求 提取元素 绘制线稿 用 controlnet 转绘上色 ps 优化 定稿。 2. 需求元素:风格要潮流插画,还要有唐代元素和国潮(前期基本上是沟通成本,主要定线稿)。 3. 提取元素:获取的信息需要体现产品图,需要体现唐代元素,需要 logo 在中心位置,按照需求开始绘制线稿。 4. 线稿绘制:沟通的元素是牡丹花,驴子(最后换成了琵琶),人参和产品图和 logo,所以进行线稿调整绘制(中间很多细节沟通)最终定下线稿(里面很多元素都是拼接的)。 5. 拆分元素线稿:这一步非常重要,因为会涉及到后续元素替换等问题,比如单个 logo,产品等,提取出单独元素,进行绘制,最后进行替换。 6. 单个元素绘制:这样会让单个元素更加精致,也方便后期替换。 7. 然后利用拼接好的线稿进行大量跑图抽卡,选出一张最合适的进行 ps 优化。 8. 整体拼接上色后的效果(将单独跑的元素在 ps 里替换优化,再过一遍 sd 进行溶图放大)得到以下效果。 9. 最终客户把驴子去掉了,换成了一把琵琶,也是同产品图一样的做法,最后把琵琶替换掉驴子,得到定稿图。 上色运用的大模型:GhostMix 鬼混_V2.0 lora 模型:"盒子系列——平面国潮插画_v1.0:182ba9e2f576 controlnet 模型:"Module:lineart_coarse,Model:contr"
2025-01-07
哪个AI工具可以对音频内容进行总结
以下是一些可以对音频内容进行总结的 AI 工具: 1. 飞书妙记(https://www.feishu.cn/product/minutes):飞书的办公套件之一。 2. 通义听悟(https://tingwu.aliyun.com/home):阿里推出的 AI 会议转录工具。 3. 讯飞听见(https://www.iflyrec.com/):讯飞旗下智慧办公服务平台。 4. Otter AI(https://otter.ai/):转录采访和会议纪要。 5. BibiGPT·AI 音视频内容一键总结(https://b.jimmylv.cn/) 6. 15 个值得一试的 YouTube 视频摘要 AI 工具(https://nealschaffer.com/youtubevideosummarizerai/) 7. summarize.tech:AIpowered video summaries(https://www.summarize.tech/) 8. NotebookLM:最早主打的是智能笔记,上传文件之后会自动生成概览性的总结。用户可以在对话框里,根据上传文本的内容,直接用文字提问。支持长文本,语言目前只支持英文。
2025-01-07
哪个AI可以对音频进行总结
以下是一些可以对音频进行总结的 AI 工具和公司: 声音检测方面: :通过更强的听觉感知创造卓越的人类体验。 :先进的声音识别解决方案,能够分类如尖叫、枪声、咳嗽和哭泣等声音。 :下一代声音 AI 平台,能够像人类一样理解任何声音。 :语音控制的家庭自动化系统。 :世界上首个智能家居听觉系统。 :可用于从音频源中提取隐藏数据的 AI 模型。 :无需键盘、按钮或触摸屏,无缝融合物理世界和数据世界。 :为手机、VR/AR 头戴设备、智能手表、扬声器和笔记本电脑提供上下文感知。 :智能音频穿戴设备。 :我们将声音转化为信息。 :使用先进的深度学习技术进行声音事件检测和上下文识别,为世界上的每一个声音赋予意义。 语音增强与操作方面: :实时语音和口音转换流媒体服务。 :为高效在线会议提供的 AI 驱动软件解决方案。 :免费的实时语音变换器。 :为创作者、开发者和虚拟会议提供的降噪产品。 :软件在复杂声学环境中提升语音的清晰度和可懂度。 :不制作音频,让音频更好。 :会议和音频的降噪。 :采用最先进的 AI 技术消除视频会议通话中的所有背景噪音。 :一套 AI 驱动的音频质量增强工具。 :将智能手机变成高级语音增强设备的应用程序。 :去除干扰性背景噪音的智能手机应用程序。 :用于音频和语音产品的智能音频解决方案。 :通过引入机器学习功能来革新麦克风。 :生成式 AI 音频增强。 音视频总结方面:
2025-01-07
我想要设计一个以班级期末总结为主题的40分钟班会课,请你帮我推荐一下有哪些AI软件可以完成这项任务
目前没有专门针对设计班级期末总结主题班会课的特定 AI 软件。但您可以借助一些通用的工具来辅助您完成,例如: 1. 文字处理工具,如 Microsoft Word 或 WPS,帮助您撰写班会课的流程和内容。 2. 思维导图工具,如 XMind 或百度脑图,用于梳理班会课的框架和要点。 3. 演示文稿工具,如 Microsoft PowerPoint 或 Keynote,制作展示用的 PPT 来辅助讲解。 希望这些建议对您有所帮助。
2025-01-07
怎么学习ai
以下是新手学习 AI 的方法和建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得自己的成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-07
我是否可以在飞书上传我的相关文档,然后把这些文档作为知识库进行对话,若可以,如何操作
在飞书上可以上传您的相关文档并将其作为知识库进行对话。具体操作如下: 1. 您需要一个额外的软件:AnythingLLM。其安装地址为:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步: 第一步:选择大模型。 第二步:选择文本嵌入模型。 第三步:选择向量数据库。 2. 在 AnythingLLM 中,有一个 Workspace 的概念,您可以创建自己独有的 Workspace 与其他项目数据进行隔离。操作步骤为: 首先创建一个工作空间。 上传文档并且在工作空间中进行文本嵌入。 选择对话模式,AnythingLLM 提供了两种对话模式: Chat 模式:大模型会根据自己的训练数据和您上传的文档数据综合给出答案。 Query 模式:大模型仅仅会依靠文档中的数据给出答案。 测试对话。 3. 另外,您还可以参考以下操作在飞书上创建知识库并上传文本内容: 登录 。 在左侧导航栏的工作区区域,选择进入指定团队。 在页面顶部进入知识库页面,并单击创建知识库。在弹出的页面配置知识库名称、描述,并单击确认(一个团队内的知识库名称不可重复,必须是唯一的)。 在单元页面,单击新增单元。 在弹出的页面选择要上传的数据格式(默认是文本格式),然后选择一种文本内容上传方式完成内容上传。上传方式如下: 本地文档: 在文本格式页签下,选择本地文档,然后单击下一步。 将要上传的文档拖拽到上传区,或单击上传区域选择要上传的文档。目前支持上传.txt、.pdf、.docx 格式的文件内容,每个文件不得大于 20M,一次最多可上传 10 个文件。当上传完成后单击下一步。 选择内容分段方式: 自动分段与清洗:系统会对上传的文件数据进行自动分段,并会按照系统默认的预处理规则处理数据。 自定义:手动设置分段规则和预处理规则。分段标识符:选择符合实际所需的标识符。分段最大长度:设置每个片段内的字符数上限。文本预处理规则:替换掉连续的空格、换行符和制表符,删除所有 URL 和电子邮箱地址。单击下一步完成内容上传和分片。
2025-01-07
请给我推荐最适合翻译PDF文档的AI平台
以下是一些适合翻译 PDF 文档的 AI 平台: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。还能一键开启网页中 Youtube 视频的双语字幕。 3. Calibre(电子书管理应用):,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式,但进阶功能基本需要付费。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译,有免费次数限制且进阶功能需要付费。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-06
哪款AI 工具可以梳理文档知识形成知识库
以下是一些可以梳理文档知识形成知识库的 AI 工具: 1. Cursor:对于非开发性质的问答,它是一个天然的 RAG 引擎。能针对大的代码库精准找到相关函数,并利用其信息撰写代码。在问答窗口使用 Command 加回车发出问题时,会先在当前文件夹下搜索并显示相关文档和相关度,最后用这些信息构建提示词完成生成。对于非开发任务,也能与私有文档结合问答,并将新生成的 insights 沉淀成新文档,形成知识闭环,提升知识管理效率。 2. 百炼:通过以下步骤为 AI 助手增加私有知识形成知识库: 上传文件:在百炼控制台的中的非结构化数据页签中点击导入数据,根据引导上传虚构的产品介绍。 建立索引:进入,创建新的知识库并选择上传的文件,其他参数保持默认。 引用知识:完成知识库创建后,在中设置,打开知识检索增强开关、选择目标知识库,测试验证符合预期后点击发布。 3. kimichat:可以让 AI 拆解书籍的章节并按照 markdown 产出内容,然后将内容复制到在线思维导图 Markmap 中,一键生成思维导图,并可自定义微调内容及免费导出图片。
2025-01-04
如何用AI梳理文档知识
以下是关于如何用 AI 梳理文档知识的一些方法和步骤: 使用 Kimi 梳理文档: Kimi 是月之暗面公司推出的类似 ChatGPT 的大模型聊天机器人,支持超长上下文,能输入长达 20 万字。 可以让 Kimi 梳理全书,与目录对照,脉络会更清晰。 能要求 Kimi 更细致地梳理,虽然目前不能生成思维导图,但可借助 MarkMap 获得。 针对具体章节或知识点,可让 Kimi 展开讲解,还能让其给出例子和代码。 可以让 Kimi 出题测试对知识点的掌握程度。 在网站上增加 AI 助手梳理文档: 上传文件:在百炼控制台的中的非结构化数据页签中点击导入数据,根据引导上传相关文档。 建立索引:进入,创建新的知识库并选择上传的文件,其他参数保持默认。 引用知识:完成知识库创建后,在中进行相关设置,打开知识检索增强开关、选择目标知识库,测试验证符合预期后点击发布。 AI 梳理文档的检索原理: 信息筛选与确认:对检索器提供的信息进行评估,筛选出最相关和最可信的内容,验证信息的来源、时效性和相关性。 消除冗余:识别和去除多个文档或数据源中的重复信息。 关系映射:分析不同信息片段之间的逻辑和事实关系。 上下文构建:将筛选和结构化的信息组织成连贯的上下文环境,包括排序、归类和整合。 语义融合:合并意义相近但表达不同的信息片段。 预备生成阶段:将整合好的上下文信息编码成适合生成器处理的格式。 大模型生成回答:大语言模型根据提供的信息来回答问题。
2025-01-04
语料库训练相关文档
以下是为您提供的语料库训练相关文档: 中文数据集 |ID|标题|更新日期|数据集提供者|许可|说明|关键字|类别|论文地址|备注| ||||||||||| |6||2020 年|CLUE||CLUENER2020 数据集,是在清华大学开源的文本分类数据集 THUCTC 基础上,选出部分数据进行细粒度命名实体标注,原数据来源于 Sina News RSS。数据包含 10 个标签类别,训练集共有 10748 条语料,验证集共有 1343 条语料|细粒度;CULE|命名实体识别|\\|中文| |7||英文| |8||||EMNLP2015|命名实体识别||| |9||2005 年|MSR/PKU|||bakeoff2005|命名实体识别||| TTS 超全教程 音库制作和文本前端 音库制作 音频录制 音频的录制对合成语音的表现较为重要,较差的语音甚至会导致端到端声学模型无法正常收敛。用于训练的录音至少要保证录音环境和设备始终保持一致,无混响、背景噪音;原始录音不可截幅;如果希望合成出来的语音干净,则要删除含口水音、呼吸音、杂音、模糊等,但对于目前的端到端合成模型,有时会学习到在合适的位置合成呼吸音、口水音,反而会增加语音自然度。录音尽可能不要事先处理,语速的调节尚可,但调节音效等有时会造成奇怪的问题,甚至导致声学模型无法收敛。音频的录制可以参考录音公司的标准,购买专业麦克风,并保持录音环境安静即可。在音库录制过程中,可尽早提前尝试声学模型,比如音库录制 2 个小时语音后,就可尝试训练基线语音合成系统,以防止录音不符合最终的需求。 语料整理 检查文本和录制的语音是否一一对应,录制的音频本身一句话是否能量渐弱,参与训练的语音前后静音段要保持一致,能量要进行规范化。可使用预训练的语音活动检测(Voice Activity Detection,VAD)工具,或者直接根据语音起止的电平值确定前后静音段。可以使用一些开源的工具,比如统一所有语音的整体能量,这将有助于声学模型的收敛。当然,在声学模型模型训练时,首先就要对所有语料计算均值方差,进行统一的规范化,但是这里最好实现统一能量水平,防止一句话前后能量不一致。能量规整的示例代码如下。
2025-01-02
有没有可以帮我翻译万字中文文档为英文的工具
以下是一些可以帮助您翻译万字中文文档为英文的工具和方法: 1. 利用 ChatGPT:先将中文内容以流水账式记叙文写出来,然后把中文丢进 ChatGPT,并给出指令让其翻译成英文。 2. DeepL(网站): 点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 3. 沉浸式翻译(浏览器插件): 安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 4. calibre(电子书管理应用): 下载并安装 calibre,并安装翻译插件「Ebook Translator」。 5. 谷歌翻译(网页): 使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 6. 百度翻译(网页): 点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 7. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、PDF、Word、Excel、PPT、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 8. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 9. 浏览器自带的翻译功能:如果一些 PDF 太大,翻译工具不支持,除了将 PDF 压缩或者切分外,还可以转成 HTML 格式,然后使用浏览器自带的网页翻译功能。
2024-12-31
什么是智能体,怎么搭建智能体,给我找一些课程,要那种从0起步的
智能体是建立在大模型之上,具有强大学习能力、灵活性和泛化能力,能够通过精确的提示词设计来控制和利用大型模型以达到设定目标的系统。 以下是一些从 0 起步搭建智能体的课程和步骤: 1. 智谱 BigModel 共学营第二期: 注册智谱 Tokens 智谱 AI 开放平台:https://bigmodel.cn/ 参与课程至少需要有 token 体验资源包,获取资源包的方式有: 新注册用户,注册即送 2000 万 Tokens 充值/购买多种模型的低价福利资源包,如直接充值现金,所有模型可适用:https://open.bigmodel.cn/finance/pay ;语言资源包:免费 GLM4Flash 语言模型/ ;所有资源包购买地址:https://bigmodel.cn/finance/resourcepack ;共学营报名赠送资源包 先去【财务台】左侧的【资源包管理】看看自己的资源包,本次项目会使用到的有 GLM4、GLM4VPlus、CogVideoX、CogView3Plus 模型。 进入智能体中心我的智能体,开始创建智能体。 2. 提示词培训课——Part2: 了解智能体的概念和特点。 基于一些公开的大模型应用产品(如 Chat GLM、Chat GPT、Kimi 等)尝试开发属于自己的智能体: Step.1 点击“浏览 GPTs”按钮 Step.2 点击“Create”按钮创建自己的智能体 Step.3 使用自然语言对话进行具体设置或手工设置 Step.4 开始调试你的智能体并发布
2025-01-07
RAG工作流搭建
RAG(检索增强生成)工作流搭建主要包括以下步骤: 1. 文档加载:从多种不同来源加载文档,如非结构化的 PDF 数据、结构化的 SQL 数据、代码等,LangChain 提供了 100 多种不同的文档加载器。 2. 文本分割:文本分割器把文档切分为指定大小的块,称为“文档块”或者“文档片”。 3. 存储: 将切分好的文档块进行嵌入转换成向量的形式。 将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法从向量数据库中找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 RAG 是一种结合了检索和生成的技术,其基本流程为:首先,给定用户输入,如问题或话题,从数据源中检索出相关文本片段作为上下文。然后,将用户输入和检索到的上下文拼接成完整输入传递给大模型,并包含提示指导模型生成期望输出。最后,从大模型输出中提取或格式化所需信息返回给用户。 此外,您还可以通过以下方式学习 RAG: 1. 观看视频演示,如: 2. 利用相关 Bot 进行学习,如: Query 改写效果对比 Bot:https://www.coze.cn/store/bot/7400553639514800182?panel=1&bid=6dkplh1r43g15 RAG 全流程学习 Bot:结合大模型,模拟 RAG 的离线存储和在线检索全流程。 您还可以参考如何使用 LangChain 开发一个简单的 RAG 问答应用。
2025-01-06
知识库搭建流程
搭建知识库的流程通常包括以下几种情况: 本地部署大模型及搭建个人知识库: 1. 了解 RAG 技术:RAG 是利用大模型能力搭建知识库的应用,在需要依靠不在大模型训练集中的数据时,通过检索增强生成。其过程包括文档加载(从多种来源加载文档,如 PDF 等非结构化数据、SQL 等结构化数据及代码)、文本分割(把文档切分为指定大小的块)、存储(将切分好的文档块嵌入转换为向量形式并存储到向量数据库)、检索(通过检索算法找到与输入问题相似的嵌入片)、输出(把问题及检索出的嵌入片提交给 LLM 生成答案)。 2. 文本加载器:将用户提供的文本加载到内存中以便后续处理。 利用 Coze 搭建知识库: 1. 收集知识:确认知识库支持的数据类型,收集知识通常有三种方式,包括企业或个人沉淀的 Word、PDF 等文档,企业或个人沉淀的云文档(通过链接访问),互联网公开的一些内容(可安装 Coze 提供的插件采集)。 2. 创建知识库。 3. 创建数据库用以存储每次的问答。 4. 创建工作流。 5. 编写 Bot 的提示词。 6. 预览调试与发布。 信息管理与知识体系构建: 1. 信息源的选择:明确需求和兴趣点,选择相关信息源,保证信息质量和相关性。 2. 信息通路的建立:通过工具和方法,如浏览器插件、笔记应用等,建立稳定的信息获取和存储机制。 3. 知识结构化:使用笔记方法和工具,对收集的信息分类、标签化和链接,形成结构化知识体系,便于检索和应用。 4. 知识内化与应用:定期复习、思考和实践,将外部信息转化为个人知识,并在实际中应用解决问题。
2025-01-06
dify智能体搭建
搭建 Dify 智能体的步骤如下: 1. 理解智能体母体:智能体母体可视为智能体的原型或基础形式,是创建智能体的原始模板,通过它能衍生出众多子智能体。其设计和功能为子智能体的特定任务和特性提供基础,扩展了应用范围和多样性。 2. 准备提示词:分享了用于构建和定制子智能体的提示词,可直接复制应用到项目中以创建和优化智能体满足特定需求和目标。 3. 实践创建智能体母体: 登录后台系统,点击“工作室”按钮,进入智能体管理界面。 点击“创建空白应用”选项,选择“Agent”,输入智能体名称并点击“创建”按钮。 完成创建后,点击所创建的智能体,进入编排页面。调整模型,选择所需模型并设置温度及输出长度参数(默认输出长度通常为 512,常需调整),然后输入提示词,可使用准备好的提示词模板编排进智能体。 另外,在搭建 AI 智能体时,还可参考以下步骤: 1. 设计 AI 智能体架构。 2. 规定稍后读阅读清单的元数据:新建飞书多维表格,根据管理需要定义元数据字段,如“内容”(超链接格式,显示页面标题,可点击跳转具体页面)、“摘要”(总结内容主题、关键信息、阅读价值,并指出适合的读者群体)、“作者”、“平台”、“状态”(收藏的默认态为“仅记录”)、“发布日期”、“收集时间”等。为方便操作,可直接复制准备好的模板:
2025-01-06
RAG工作流搭建
RAG(检索增强生成)工作流搭建主要包括以下步骤: 1. 文档加载:从多种不同来源加载文档,如包括 PDF 在内的非结构化数据、SQL 在内的结构化数据以及 Python、Java 之类的代码等。LangChain 提供了 100 多种不同的文档加载器。 2. 文本分割:文本分割器把 Documents 切分为指定大小的块,称为“文档块”或者“文档片”。 3. 存储: 将切分好的文档块进行嵌入(Embedding)转换成向量的形式。 将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 RAG 是一种结合了检索和生成的技术,它可以让大模型在生成文本时利用额外的数据源,从而提高生成的质量和准确性。其基本流程为:首先,给定一个用户的输入,如问题或话题,RAG 会从数据源中检索出相关的文本片段作为上下文。然后,将用户输入和检索到的上下文拼接成完整输入传递给大模型,并包含提示指导模型生成期望输出。最后,从大模型输出中提取或格式化所需信息返回给用户。 此外,还有相关的学习资源,如用 Coze 学习 RAG 的视频演示,包括 Query 改写效果对比 Bot 和 RAG 全流程学习 Bot 等。同时,也有关于如何使用 LangChain 开发简单 RAG 问答应用的介绍。
2025-01-06
RAG工作流搭建
RAG(检索增强生成)工作流搭建主要包括以下步骤: 1. 文档加载:从多种不同来源加载文档,如非结构化的数据(包括 PDF)、结构化的数据(如 SQL)以及代码(如 Python、Java 等)。LangChain 提供了 100 多种不同的文档加载器。 2. 文本分割:文本分割器把 Documents 切分为指定大小的块,称为“文档块”或者“文档片”。 3. 存储: 将切分好的文档块进行嵌入(Embedding)转换成向量的形式。 将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 RAG 是一种结合了检索和生成的技术,其基本流程为:首先,给定用户输入(如问题或话题),从数据源中检索出相关文本片段作为上下文。然后,将用户输入和检索到的上下文拼接成完整输入,并添加提示传递给大模型(如 GPT)。最后,从大模型的输出中提取或格式化所需信息返回给用户。 您还可以通过以下资源进一步学习 RAG: 视频演示: Query 改写效果对比 Bot:https://www.coze.cn/store/bot/7400553639514800182?panel=1&bid=6dkplh1r43g15 视频演示: RAG 全流程学习 Bot:
2025-01-06
用于训练销售助手类型业务的私有模型
以下是关于训练销售助手类型业务私有模型的相关信息: 1. 提示词方面:设计了一套模拟江南皮革厂销售的拟人化提示词模板,并将其应用于国内的豆包角色扮演模型,生成吸引人的广告词。若与语音技术结合用于宣传,能创造出有趣且有效的销售助手,吸引顾客注意。拟人化提示词母体可通过关注作者微信领取。 2. 增加私有知识方面:通过前面步骤拥有可与客户对话的 AI 助手后,若想让其像公司员工一样精准专业回答商品相关问题,需为大模型应用配置知识库。例如在售卖智能手机的公司,网站上有很多相关信息,不同机型的详细配置清单可参考相关文档。
2025-01-07
AI智能数据库查询助手
以下是关于您提出的“AI 智能数据库查询助手”的相关信息: 能联网检索的 AI: 存在能联网检索的 AI,它们通过连接互联网实时搜索、筛选并整合所需数据,为用户提供更精准和个性化的信息。例如: ChatGPT Plus 用户现在可以开启 web browsing 功能,实现联网功能。 Perplexity 结合了 ChatGPT 式的问答和普通搜索引擎的功能,允许用户指定希望聊天机器人在制定响应时搜索的源类型。 Bing Copilot 作为 AI 助手,旨在简化您的在线查询和浏览活动。 还有如 You.com 和 Neeva AI 等搜索引擎,提供基于人工智能的定制搜索体验,并保持用户数据的私密性。 AI 新产品|网站精选推荐: AIHelperBot 自动生成 SQL Queries,支持数据库一键链接或导入。当前收费$5 每月,可免费试用 7 天。链接:https://skybox.blockadelabs.com/ ChartGPT by CadLabs 由 CadLabs 开发工具,基于 GPT3.5,可以根据数据生成图表并回答问题。链接:https://chartgpt.cadlabs.org/ Embedding Store 功能如其名,是一站式 Embedding Marketplace,支持公开、私有及第三方数据,用于发现、评估和访问相关的嵌入(embeddings),产品还未上线。链接:https://www.embedding.store/ AI 在医疗药品零售领域的应用: AI 在医疗药品零售领域有着多方面的应用前景: 药品推荐系统:利用机器学习算法分析用户购买记录、症状描述等数据,为用户推荐合适的非处方药品和保健品,提升销售转化率。 药品库存管理:通过分析历史销售数据、天气、疫情等因素,AI 系统可以预测未来某段时间内的药品需求量,优化药店的库存管理策略,降低成本。 药品识别与查询:借助计算机视觉技术,用户可以用手机拍摄药品图像,AI 系统自动识别药名并提供说明、用法、禁忌等信息查询服务。 客户服务智能助手:基于自然语言处理技术,AI 虚拟助手可以回答顾客关于购药、用药、保健等常见问题,减轻人工客服的工作压力。 药店运营分析:AI 可以分析药店的销售、顾客流量、库存等大数据,发现潜在的运营问题和优化空间,为决策提供参考。 药品质量监控:通过机器视觉、图像识别等技术,AI 能够自动检测药品的包装、标签、颜色等是否合格,及时发现问题。 药品防伪追溯:利用区块链等技术,AI 可以实现全流程的药品溯源,确保药品供应链的安全性和真实可信度。 总之,AI 技术在药品零售领域可以提升购药体验、优化库存管理、降低运营成本、保障药品质量安全,是一个值得重视的发展方向。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-07
开发简单的 Agent 助手
开发简单的 Agent 助手可以参考以下内容: 基于结构化数据来 RAG 实战:以餐饮生活助手为例,它是基于结构化数据 RAG 方法的应用,能从大规模餐饮数据集中检索合适餐厅并提供信息服务。实现餐饮生活助手 RAG 的 Langchain 代码实战需完成以下步骤:定义餐饮数据源,将其转化为 Langchain 可识别和操作的形式并注册;定义 LLM 的代理,通过 Langchain 的代理根据用户问题提取信息、形成查询语句、检索数据源并生成答案。 从基础案例入门: 三分钟捏 Bot: 登录控制台:登录扣子控制台(coze.cn),使用手机号或抖音注册/登录。 在我的空间创建 Agent:在扣子主页左上角点击“创建 Bot”,选择空间名称为“个人空间”、Bot 名称为“第一个 Bot”并确认。 编写 Prompt:填写 Prompt,即 Bot 功能说明,第一次可用简短词语作为提示词。 优化 Prompt:点击“优化”进行优化。 设置开场白及其他环节。 发布到多平台&使用。 进阶之路: 15 分钟:查看其他 Bot 获取灵感。 1 小时:找到与兴趣、工作方向结合的 Bot 深入沟通,阅读相关文章。 一周:了解基础组件,寻找不错的扣子借鉴复制,加入 Agent 共学小组,尝试在群里问第一个问题。 一个月:合理安排时间,参与 WaytoAGI Agent 共学计划,创建 Agent 并分享经历心得。 《执笔者》:基于多 Agent 模式的全能写手: 操作步骤: 多 agent 模式切换:在 bot 编排页面点选多 agent 模式,页面自动切换,相比单 agent 多了中间的 agent 连接区。 添加合适节点:有两种方式选择,用已发布的 bot 或创建新的 agent,按需选取并连接在默认总管 agent 后面,无结束节点。 添加合适的 prompt:为每个 agent 填写合适 prompt,外围人设填写主要功能,内部 bot 填写应用场景。 调试与美化:经过以上三步基本搭建完成,后续需调试,调整提示词优化交互。
2025-01-07
一个好玩的车载语音助手应该是什么样子的?
一个好玩的车载语音助手可以有以下特点和形式: Glowby Basic:能够让用户搭建一个拥有自己声音的 AI 语音助手,您可以通过 🔗https://github.com/glowbom/glowby 了解更多。 Dreamkeeper:在 AI 的帮助下记录并了解梦境。它使用多个 Gen AI 模型,具体流程为:由 ChatGPT 驱动的助手向用户提问以记住用户的梦,并根据回答调整内容;通过 Stable Diffusion 模型提取 ChatGPT 生成的关于用户梦境的摘要描述中的关键词来生成图像;将图像传输至图生视频模型创建基于用户梦境的动画;用 GPT 进行嵌入处理,将用户想要保留的梦保留在一个画廊中。您可以访问 🔗https://thedreamkeeper.co/ 进一步了解。 Andrej Karpathy 开发的 Awesome movies:这是一个电影搜索与推荐平台,搭建该网站共分三步,包括抓取自 1970 年以来的所有 11,768 部电影,从维基百科上抓取每部电影的简介和情节,并使用 OpenAI API(ada002)进行嵌入处理,最后将所有信息整合成一个电影搜索/推荐引擎网站。您可以通过 🔗https://awesomemovies.life/ 查看。
2025-01-06
我想学习创建自己的AI助手
以下是创建自己的 AI 助手的相关内容: 使用 Coze 免费打造微信 AI 机器人 搭建步骤: 1. 创建好 Bot 后,从“个人空间”入口找到自己的机器人。 2. 设计环节:在 Coze 里称为“编排”。 常用概念和功能: 提示词:设定 Bot 的身份和目标。 插件:通过 API 连接集成各种平台和服务。 工作流:设计复杂的多步骤任务。 触发器:创建定时任务。 记忆库:保留对话细节,支持外部知识库。 变量:保存用户个人信息。 数据库:存储和管理结构化数据。 长期记忆:总结聊天对话内容。 3. 设计步骤(以“AI 前线”Bot 为例): 确定目的:比如“AI 前线”,目的是成为一个 AI 学习助手,帮助职场专业人士提升在人工智能领域的知识和技能,提供高效的站内信息检索服务。 注:Coze 官方使用指南见链接:https://www.coze.cn/docs/guides/welcome ,遇到疑问可查官方指南。 在网站上增加一个 AI 助手(以百炼为例) 1. 创建大模型问答应用: 进入百炼控制台的,在页面右侧点击新增应用,在对话框选择智能体应用并创建。 在应用设置页面,模型选择通义千问Plus,其他参数保持默认。也可以输入一些 Prompt 来设置人设以引导大模型更好地应对客户咨询。 在页面右侧提问验证模型效果,点击右上角的发布。 2. 获取调用 API 所需的凭证: 在我的应用>应用列表中查看所有百炼应用 ID,保存到本地用于后续配置。 在顶部导航栏右侧,点击人型图标,点击 APIKEY 进入我的 APIKEY 页面。在页面右侧,点击创建我的 APIKEY,在弹出窗口中创建一个新 APIKEY,保存到本地用于后续配置。
2025-01-05
如何本地化部署一个ai助手
本地化部署一个 AI 助手可以参考以下几种方式: 1. 在网站上增加 AI 助手: 搭建示例网站: 创建应用:点击打开函数计算应用模板,参考相关选择直接部署、填写百炼应用 ID 以及 APIKEY,其他表单项保持默认,点击创建并部署默认环境,等待项目部署完成(预计耗时 1 分钟)。 访问网站:应用部署完成后,在应用详情的环境信息中找到示例网站的访问域名,点击即可查看,确认示例网站已经部署成功。 为网站增加 AI 助手: 增加 AI 助手相关代码:回到应用详情页,在环境详情的最底部找到函数资源,点击函数名称,进入函数详情页。在代码视图中找到 public/index.html 文件,取消相关位置的代码注释。最后点击部署代码,等待部署完成。 验证网站上的 AI 助手:重新访问示例网站页面以查看最新效果,网站的右下角会出现 AI 助手图标,点击即可唤起 AI 助手。 2. 从 LLM 大语言模型、知识库到微信机器人的全本地部署(以 windows10 系统为例): 本地 Hook 或 COW 机器人(二选一,建议先选择 COW): 注意:本教程完成后,程序将在您的电脑本地运行,假如关掉了窗口,进程也就结束。所以,如果想让 AI 持续使用,就必须保持窗口打开和运行,也就是电脑不能关。 安装环境: 点击电脑“系统”,直接输入“cmd”,点击回车,打开命令窗口。 在命令窗口中,粘贴入相关代码,确认是否有 python 和 pip。 如果没有,先进行 python 的安装,可点击下载:。 部署项目:下载 COW 机器人项目,解压缩。 3. 把大模型接入小米音箱(node.js): 第四步:填写 API 服务: 智普:接口地址:https://open.bigmodel.cn/api/paas/v4,模型:glm4flash。 硅基:选择 AI 服务为自定义,接口地址:https://api.siliconflow.cn/v1。 其他模型的 API 端口请参考官方文档:https://migptgui.com/docs/apply/。 第五步:语音服务:官方说明:https://migptgui.com/docs/faqs/tts。 第六步:启动服务:在最上方可导出编辑的内容,格式为 json 格式,如果改错了可以导入之前保存的配置。单击启动,回到 powshell 界面。每次调整设置都需要重置后重新启动。建议回答完毕后增加结束的提示语,可以提高连续对话的稳定性。官方常见问题文档:https://migptgui.com/docs/faqs/noreply。
2025-01-05