直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

如何训练专属我的问答机器人

回答

要训练专属您的问答机器人,基于飞书能力开发时,首先需要了解问答机器人的底层原理——RAG 技术。

RAG 的基本流程如下:

  1. 当接收到用户的输入,比如一个问题或一个话题,RAG 会从数据源(如网页、文档或数据库记录)中检索出与之相关的文本片段,这些文本片段被称为上下文。
  2. 接着,RAG 会将用户的输入和检索到的上下文拼接成一个完整的输入,并传递给大语言模型(例如 GPT)。这个输入通常会包含一些提示,用于指导模型生成期望的输出,比如一个答案或一个摘要。
  3. 最后,RAG 会从大语言模型的输出中提取或格式化所需的信息,再返回给用户。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

如何基于飞书能力来开发问答机器人

RAG的基本流程是:首先,给定一个用户的输入,例如一个问题或一个话题,RAG会从一个数据源中检索出与之相关的文本片段,例如网页、文档或数据库记录。这些文本片段称为上下文(context)。然后,RAG会将用户的输入和检索到的上下文拼接成一个完整的输入,传递给一个大语言模型,例如GPT。这个输入通常会包含一些提示(prompt),指导模型如何生成期望的输出,例如一个答案或一个摘要。最后,RAG会从大语言模型的输出中提取或格式化所需的信息,返回给用户。

其他人在问
如何创建个人专属知识库
以下是创建个人专属知识库的相关内容: 私人知识库中的内容通常包括从互联网收集的优质信息以及个人日常的思考和分享。 基于私人知识库打造个人专属的 ChatGPT 常见有两种技术方案: 训练专有大模型:可以使用个人知识库训练专有大模型,但此方案并非当下主流,存在高成本、更新难度大等缺陷。 利用 RAG(检索增强生成)技术:先将文本拆分成若干小文本块并转换为 embeddings 向量,保存在向量储存库中。当用户提出问题时,将问题转换为向量与储存库中的向量比对,提取关联度高的文本块与问题组合成新的 prompt 发送给 GPT API。 搭建基于 GPT API 的定制化知识库时,由于 GPT3.5 一次交互支持的 Token 有限,OpenAI 提供了 embedding API 解决方案。embeddings 是一个浮点数字的向量,向量之间的距离衡量关联性,小距离表示高关联度。
2024-11-16
如何制作一个专属的工作机器人
以下是制作专属工作机器人的两种方式: 基于 GitHub 开源项目 chatgptonwechat 实现 chatgptonwechat项目是使用 ChatGPT 搭建的智能聊天机器人,在 GPT3.5/4.0 API 及 itchat 框架的基础上实现,支持个人微信、公众号、企业微信部署,能生成文本、语音和图片,访问操作系统和互联网。项目地址:https://github.com/zhayujie/chatgptonwechat 。 基于 Coze 直聘的职业助手 Bot 实现 1. 职业助手 Bot 是一个专为帮助用户找到理想工作而设计的智能机器人。只需输入求职信息和偏好,就能迅速匹配适合的工作机会,并提供全面的求职支持。 2. 设计理念:旨在通过智能化和个性化的服务,帮助求职者更快、更精准地找到理想工作。 高效匹配:利用先进的算法和大数据分析,迅速从海量招聘信息中筛选出最适合用户的职位,节省时间,提高求职效率。 实时更新:持续跟踪最新招聘信息,通过即时通知功能让用户掌握最新求职动态。 个性化推荐:根据用户的职业目标、工作经验、技能、地域偏好等信息提供高度个性化的职位推荐服务。 数据安全:重视用户数据的安全与隐私,采用最先进的安全技术确保用户个人信息和求职数据不被泄露。 3. 创建 Bot: 在 Coze 的主页创建 Bot。 输入 Bot 名称与 Bot 介绍,并使用 AI 功能生成图标(也可上传自己喜欢的图标)。 4. 人设与回复逻辑:简单描述 Bot 的人设与逻辑,然后使用 AI 助手进行优化。例如:角色为一个专业的职业助手 Bot,能够根据用户输入信息为用户精准提供匹配的职位推荐。 5. 技能:为 Bot 增加一些技能。 6. 插件:增加一个新闻类插件,来捕捉行业相关的动态。
2024-10-31
我想做一个知识库管理,用于用户累计只是,在此基础上打造属于用户个人的知识库,通过ai生成用户专属的答案。但是我不知道应该怎么设计这个软件,请为我建议
设计一个用于用户知识累计和生成专属答案的知识库管理软件,您可以考虑以下几个关键方面: 1. 数据存储与架构 选择合适的数据库系统,如关系型数据库(如 MySQL、PostgreSQL)或非关系型数据库(如 MongoDB、Cassandra),以有效存储用户的知识数据。 设计合理的数据表结构,包括用户信息表、知识条目表、知识分类表等,确保数据的组织和关联清晰。 2. 知识录入与编辑 提供直观的用户界面,方便用户录入知识,支持多种格式,如文本、图片、音频、视频等。 具备知识编辑功能,允许用户修改、更新和完善已录入的知识。 3. 知识分类与标签 建立灵活的知识分类体系,让用户能够将知识分类存放,便于查找和管理。 支持用户为知识添加自定义标签,提高知识检索的准确性。 4. 搜索与检索功能 实现强大的搜索功能,支持全文搜索、关键词搜索、模糊搜索等多种搜索方式。 优化搜索算法,确保快速返回准确的搜索结果。 5. AI 模型集成 选择适合的 AI 模型,如自然语言处理模型,用于理解用户的问题和生成答案。 对 AI 模型进行训练和优化,使其能够基于用户的知识库提供准确和有用的回答。 6. 用户权限管理 设定不同的用户权限级别,如管理员、普通用户等,控制用户对知识库的操作权限,保障数据安全。 7. 数据备份与恢复 定期自动备份知识库数据,以防止数据丢失。 提供数据恢复功能,确保在意外情况下能够快速恢复知识库。 8. 界面设计 设计简洁、美观、易用的界面,提高用户体验。 遵循用户习惯和人机交互原则,使操作流程简单直观。 9. 性能优化 对软件进行性能优化,确保在处理大量知识数据时仍能保持高效运行。 10. 测试与迭代 进行充分的测试,包括功能测试、性能测试、用户体验测试等。 根据用户反馈和实际使用情况,不断迭代优化软件功能。 希望以上建议对您有所帮助,祝您成功设计出满足需求的知识库管理软件!
2024-10-29
怎们架构专属自己企业的AI系统
要架构专属自己企业的 AI 系统,可以参考以下步骤: 一、逐步搭建 AI 智能体 1. 搭建整理入库工作流 新建工作流「url2table」,根据弹窗要求自定义工作流信息。 工作流全局流程设置需根据实际需求进行。 2. 在外层 bot 中封装工作流,完成整体配置 创建 Bot。 填写 Bot 介绍。 切换模型为“通义千问”,测试下来通义对提示词理解和执行效果较好。 把配置好的工作流添加到 Bot 中。 新增变量{{app_token}}。 添加外层 bot 提示词(可按需求和实际效果优化调整)。 二、相关术语 以下是一些在 AI 系统架构中可能涉及的术语: 1. AI 或 AI 系统或 AI 技术:具有“适应性”和“自主性”的产品和服务,如在定义的第 3.2.1 节中所述。 2. AI 供应商:在 AI 系统的研究、开发、培训、实施、部署、维护、提供或销售中发挥作用的任何组织或个人。 3. AI 用户:使用 AI 产品的任何个人或组织。 4. AI 生命周期:与 AI 系统的寿命相关的所有事件和过程,从开始到退役,包括其设计、研究、培训、开发、部署、集成、操作、维护、销售、使用和治理。 5. AI 生态系统:在 AI 生命周期中实现 AI 使用和供应的复杂网络,包括供应链、市场和治理机制。 6. 基础模型:在大量数据上训练的一种 AI 模型,可适用于广泛的任务,可作为构建更具体 AI 模型的基础。 经过上述配置,您可以在「预览与调试」窗口与 AI 智能体对话并使用全部功能。
2024-09-11
如何构建一个专属自己的智能体,用于撰写公司新闻稿,我会长期输入公司信息 请选择几家大模型公司的产品,具体说下操作步骤
以下是一些可用于构建专属智能体以撰写公司新闻稿的平台及操作步骤: 1. Coze:这是新一代的一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot。它集成了丰富的插件工具,能极大地拓展 Bot 的能力边界。 2. Microsoft 的 Copilot Studio:其主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据自身需求打造大模型时代的产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行设计良好的工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托于钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 在实际构建和应用智能体时,您可以遵循以下准则: 1. 彻底让自己变成一个“懒人”。 2. 能动嘴的不要动手(用嘴说出您想做的事远比打字来的快)。 3. 能动手的尽量用 AI(用 AI 远比您苦哈哈的手敲要来的快)。 4. 把您手上的工作单元切割开,建设属于自己的智能体。 5. 根据结果反馈不断调整自己的智能体。 6. 定期审视自己的工作流程,看哪个部分可以更多的用上 AI。 您可以根据自己的需求选择适合的平台进行进一步探索和应用。
2024-08-09
如何构建一个专属自己的智能体,用于撰写公司新闻稿,我会长期输入公司信息
构建一个用于撰写公司新闻稿的专属智能体,您可以按照以下步骤进行: 1. 明确需求和目标:确定您希望智能体生成的新闻稿的风格、格式、内容重点等方面的要求。 2. 数据收集与整理:长期输入公司的相关信息,包括但不限于公司的发展历程、业务范围、近期重大事件、领导讲话等。确保数据的准确性、完整性和时效性。 3. 选择合适的技术和平台:有许多自然语言处理和机器学习的框架和平台可供选择,例如 TensorFlow、PyTorch 等。 4. 模型训练:使用收集到的数据对模型进行训练,不断调整参数以提高生成效果。 5. 测试与优化:在训练完成后,进行测试,查看生成的新闻稿是否符合预期,并根据测试结果对模型进行优化。 6. 持续学习与更新:随着公司的发展和信息的变化,持续为智能体提供新的数据,使其能够不断学习和改进。 需要注意的是,构建这样一个智能体需要一定的技术知识和实践经验,如果您不具备相关能力,可能需要寻求专业的技术团队或服务提供商的帮助。
2024-08-09
如何将传统知识库通过LLM能力转化成更智能与精细化的知识库?包括但不限于分段、QA问答和图片解析描述和总结
将传统知识库通过 LLM 能力转化为更智能和精细化的知识库是一个复杂但可行的过程,以下是一些关键步骤和方法: 1. 数据预处理:对传统知识库中的内容进行清理、格式化和标准化,确保数据的质量和一致性。 2. 内容分段:根据主题和逻辑结构,将长篇的知识内容合理分段,使信息更易于理解和处理。 3. 提取关键信息:从文本中提取重要的概念、实体和关系,为后续的问答和总结做准备。 4. 构建 QA 问答对:分析知识库中的内容,设计有针对性的问题和准确的答案,形成问答对,以方便用户快速获取所需信息。 5. 图片解析描述:对于包含图片的内容,使用图像识别技术提取关键元素,并进行详细的描述和解释。 6. 总结归纳:对分段后的内容进行总结,提炼核心要点,帮助用户快速了解主要内容。 在实施过程中,需要不断优化和调整方法,以确保转化后的知识库能够满足用户的需求,提供更高效和准确的服务。
2024-11-18
生成式搜索和知识问答的区别
生成式搜索和知识问答存在以下区别: 生成式搜索: 采用大型语言模型技术,能更好地理解用户自然语言查询的语义,不仅仅是匹配关键词。 可以生成通顺的自然语言回答,而非简单返回网页链接和片段,结果更易于理解和使用。 能够根据用户的历史查询和偏好个性化结果,提供更贴合需求的答复。 例如 Perplexity 等 AI 搜索引擎,通过收集各种来源的信息给出答案。 但存在训练成本高、可解释性差、潜在偏差和不当内容等问题。 知识问答: 例如 RAG ,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。 原理是在基础大模型基础上引用外部数据,对搜索到的数据信息进行切片、拆分和语义理解,再根据用户提问进行检索和回答,但比基座模型更耗时。 一些知识问答系统能够支持在本地运行。 此外,为您推荐一些 AI 搜索引擎: 秘塔 AI 搜索:由秘塔科技开发,提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能。 Perplexity:聊天机器人式搜索引擎,允许用户用自然语言提问,使用生成式 AI 技术收集信息并给出答案。 360AI 搜索:360 公司推出,通过 AI 分析问题,生成清晰、有理的答案,并支持增强模式和智能排序。 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来将支持多模态搜索。 Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,有插件系统和社区功能。 Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 Phind:专为开发者设计的 AI 搜索引擎,利用大型语言模型提供相关搜索结果和动态答案,擅长处理编程和技术问题。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-14
用20个字概括AI问答和搜索
AI 问答和搜索包括联网检索、多种引擎及检索原理 存在联网检索的 AI 及相关工具。 推荐多种 AI 搜索引擎。 介绍知识库检索的原理和步骤。
2024-11-13
国内关于问答最好的AI
以下是国内一些在问答方面表现较好的 AI: 出门问问:是一家以生成式 AI 和语音交互为核心的人工智能公司,为全球多个国家和地区提供 AI 智能硬件、AI 政企服务,以及面向创作者的 AIGC 工具。致力于打造国际领先的通用大模型,通过 AI 技术、产品及商业化三位一体发展,成为全球 AI CoPilot 的引领者。 跃问:原生聊天机器人,在国内 A2409 月度榜单中排名靠前。 智能口语大师:原生教育类产品。 AI 写作猿:原生写作软件。 AI 外教:原生教育类产品。 造梦次元:原生情感陪伴产品。 AI 写作专家:原生写作软件。 必剪:功能为视频编辑。 AI 写作助手:原生写作软件。 AI Mate:原生图片生成产品。 通义千问:最大亮点是强大的推理能力,在国内推理评测中表现出色,能处理复杂任务和逻辑推理,在科研、商业分析等领域有应用前景,允许用户创建自定义智能体,但在语义理解方面略显逊色。
2024-11-06
在一个设定中,使用阿里千问模型,设定角色为“美嘉”,知识库为《爱情公寓》全季剧情,实现问答。
在一个设定中,使用阿里千问模型,将角色设定为“美嘉”,知识库设定为《爱情公寓》全季剧情来实现问答。 大语言模型就像一个学习过无数本书、拥有无穷智慧的人,对公共知识、学识技能、日常聊天很擅长,但在工作场景中需要提示词来告诉它角色和专注技能,变成所需的“员工”。知识库则相当于给这个“聪明员工”发放的工作手册,比如知道老板娘吃饭要打三折等特定信息。 这里的设定为:AI 模型使用阿里千问模型,提示词设定的角色是“美嘉”,按照其人设、背景和对话风格设定,知识库是《爱情公寓》全季剧情,让“美嘉”拥有过往“记忆”。 例如,提问“你是谁?你和子乔在台球厅吵架那次是为了什么吵架?”,回复是“我是陈美嘉,那次在台球厅和吕子乔吵架是因为他约会被人撞见,我讽刺他脸大影响信号,他还反击我。后来谈到过去的事情,我指责他忘恩负义,他就说我平。最后,我伤心地说要分手,因为他之前甩过我。” 然而,有时回答会不准确,比如提问“一菲为美嘉找了一份助教工作”,AI 可能未根据正确的知识库内容回答,这是常见的错误场景,在严肃场景中不能接受。优化 AI 更准确回答问题的过程称为 RAG(RetrievalAugmented Generation),即检索增强生成,由检索器从外部知识中快速找到与问题相关的信息,生成器利用这些信息制作精确连贯的答案,适合处理需要广泛知识的任务,如问答系统,能提供详细准确的回答。
2024-10-29
如何在自己的电脑上搭建一个类似ChatGPT的问答网站?
要在自己的电脑上搭建一个类似 ChatGPT 的问答网站,可以参考以下几种方法: 1. 方法一: 搭建 ,用于汇聚整合多种大模型接口,方便后续更换使用各种大模型。同时了解如何白嫖大模型接口。 搭建 ,这是一个知识库问答系统。将知识文件放入,并接入上面的大模型作为分析知识库的大脑,用于回答问题。若不想接入微信,搭建到此即可,它有问答界面。 搭建 ,其中的 cow 插件能进行文件总结、MJ 绘画等。 2. 方法二: 推荐使用云原生服务 ,注意使用的域名是 https://laf.dev/,只有这个 dev 域名才能调用 ChatGPT 的服务,可能是风控方面的考虑。 Laf 是一个 Serverless 框架,提供开箱即用的云函数、云数据库、对象存储等能力。 后端接口部分: 添加环境变量,输入您的 apikeys,apikeys 的获取地址:https://platform.openai.com/ 。注意是否有免费流量,注意流量是否过期,否则无法调用。 开始写代码。 前端上传资源部分: 上传打包后的前端静态资料代码,上传后直接访问右侧的域名即可。 3. 搭建原因: 方便为亲戚朋友提供无需注册、无需魔法上网且能免费使用的网站,避免逐个指导注册和登录的繁琐。 为自身引流,让更多人看到相关使用文档。 帮助更多人快速搭建网站。 自定义网站可扩展功能更丰富,如一键导出对话、把对话生成图片、内置提示词等。 4. 搭建步骤: 第一步:找到一个 ChatGPT 源码,如 https://github.com/Chanzhaoyu/chatgptweb(Vue 版本),支持下载聊天数据为图片;https://github.com/Yidadaa/ChatGPTNextWeb/,一键导出所有聊天记录,支持 markdown 格式;https://github.com/zuoFeng59556/chatGPT(Vue 版本),简化版本不支持创建多个聊天框。 第二步:找到免费的云服务器并写后端代码。项目上线需要涉及购买服务器、云存储空间、域名、数据库(本项目简单做,未用到)。
2024-10-26
如何学习开源机器人,要求是ROS操作系统,如何购置相应的机器人
学习开源机器人并基于 ROS 操作系统购置相应机器人,您可以从以下几个方面入手: 1. 控制系统:负责处理传感器数据、规划路径和执行任务,并与其他子系统协作。通常由嵌入式计算设备或工业计算机组成,通过运行控制算法(如 PID 控制、深度学习模型等)决定机器人运动和操作。 2. 伺服驱动系统:负责驱动机器人关节和执行机构,实现精确运动控制。一般包括伺服电机、伺服驱动器和指令机构。伺服电机作为执行机构实现运动,伺服驱动器作为功率电源控制电机运动,指令机构发出脉冲或速度信号配合工作。能进行速度与转矩控制,以及精确、快速、稳定的位置控制,其结构通常包括电流环、速度环和位置环三个闭环控制。 3. 交互设备:常见的有麦克风、遥控器等,尤其是带屏遥控器,集成了显示屏和控制功能,允许用户直接在遥控器上查看实时图像和进行各种操作。 4. 软件中间件:机器人操作系统中间件负责硬件抽象、设备驱动、库函数、可视化、消息传递和软件包管理等。最常用的元操作系统是 ROS(Robot Operating System),它并非真正的操作系统,而是运行在 Ubuntu 上的软件框架。ROS 将机器人软件功能封装为节点,支持节点间分布式、点对点通信,并由主节点(master)管理调度网络中各节点通信过程。不同节点可使用不同编程语言,可分布式运行在不同主机,这种设计使机器人各模块能松耦合协同工作,便于模块化修改和升级,提高系统容错能力。 在购置相应机器人时,您需要考虑机器人的功能需求、性能指标、价格预算等因素,选择适合您学习和研究的型号。
2024-11-19
怎么制作一个桌面智能机器人
制作桌面智能机器人可以参考以下步骤: 1. 利用 RPA 技术: 可以通过拖拉拽指令控件来构建机器人任务。例如,以在京东查询感冒灵并采集价格为例,包括打开浏览器、填写搜索框、点击搜索、采集数据等步骤。 采集数据后会生成数据表格,编辑器有拖拉拽功能适合业务人员,也可切换为 Python 界面写代码,还封装了很多控件,如 Excel 控件等。 RPA 机器人可通过触发器设置,像搭建奥康 1700 多个脚本的案例还有方太 450 多个基线等,交付的是动态能力。 RPA 加上 AI 效率极大提升,数字化分标准化、自动化、RPA 加 AI 三个阶段。 2. 使用 Coze 平台: 准备一个 Coze 账号,这是一个免费的 AI 机器人搭建平台。 准备一台能够上网的电脑。 用 Coze 搭建的 AI 机器人目前可以发布在“微信(订阅号/服务号/微信客服)、飞书、豆包、Bot Store、掘金”几个渠道,也可以通过网页地址的形式分享。 需要注意的是,不同的方法和平台可能有其特定的要求和特点,您可以根据自己的需求和技术水平选择适合的方式。
2024-11-19
使用coze搭建一个心理咨询机器人,将机器人接入自己开发的应用后,如何再进一步实现让ai把每个用户每天的聊天内容,总结成日记,并传回给应用展示日记
目前知识库中没有关于使用 Coze 搭建心理咨询机器人,并将用户每天聊天内容总结成日记传回应用展示的相关内容。但一般来说,要实现这个功能,您可能需要以下步骤: 1. 数据采集与存储:在机器人与用户交互过程中,采集并妥善存储聊天数据。 2. 自然语言处理与分析:运用相关的自然语言处理技术,对聊天内容进行理解和分析,提取关键信息。 3. 内容总结:基于分析结果,使用合适的算法和模型将聊天内容总结成日记形式。 4. 数据传输:建立与应用的稳定接口,将总结好的日记数据传输回应用。 这只是一个大致的思路,具体的实现会涉及到很多技术细节和开发工作。
2024-11-15
最近AGI机器人特别火,请帮我找出相关新闻
以下是一些与 AGI 机器人相关的新闻: :随着 OpenAI 聊天机器人 ChatGPT 的热潮持续,探讨其如何帮助创建用户体验调查问卷或其他调查问卷。 :给 25 个 AI 代理人动机和记忆,并将它们放在模拟城镇中,其行为被评价比人类角色扮演更“人类化”。 :ChemCrow 是一个 LLM 化学代理,能在合成、药物发现和材料设计等领域执行任务,并集成 13 个专家设计的工具以增强性能。 :OpenAI 发布 GPT4 被证明是生成 AI 的一小步,对 AGI 而言是一大步,自 2022 年 11 月发布以来吸引众多用户和媒体关注,此工作是对 ChatGPT 的首次全面审查。 :有人让 AutoGPT 查找最近一个月的开源相关新闻并汇总成 word 文件,还有人在相关项目基础上做了改进和增强的新项目,如 TeenageAGI、BabyAGIasi、TypeScript 版本的 AutoGPT 等。 :特斯拉训练机器人“Optimus”抓取物体,通过人类示范学习。还提到当训练比 GPT4 大 100 倍的模型时在图像识别、生成图像和视频等方面的预测。
2024-11-10
用Coze创建AI,打造自己的图像生成AI机器人
以下是使用 Coze 创建自己的图像生成 AI 机器人的步骤: 1. 注册 Coze 账号: 访问 Coze 官网,可选择中文版(https://www.coze.cn/,支持大模型:kimi、云雀)或英文版(https://coze.com/,支持大模型:chatgpt4)进行快速注册。 产品定位为新一代 AI 原生应用开发服务平台。 2. 创建机器人: 登录 Coze,可使用抖音或手机号登陆,登陆后选择“创建 Bot”,起一个响亮的名字。 工作空间选“个人空间”。 小技巧:“图标”AI 可以自动生成,先在“Bot 名称”用文字描述想要的图标,满意后再把“Bot 名称”改为简洁版名称。 3. 具体创建 AI Bot: 首先打开扣子的首页(https://www.coze.cn/home),直接点击左上角的创建 AI Bot 按钮。 直接在弹窗输入 Bot 的相关信息,完成创建后细化其功能。 设计人设与回复逻辑,根据功能需求设计提示词。 调整模型设置,比如基于聊天为主的需求,将对话轮数记录改为 20 轮。 选择插件,如英文名言警句(get_one_eng_word & get_many_eng_words)随机获取英语名言,Simple OCR(ocr)识别图片中的文字。 设置开场白和预置问题,预置问题有参考价值。 最后设置语音,若为英语陪练 AI Bot,选择亲切的英语音色。
2024-11-09
用 Coze 免费打造自己的图像生成 AI 机器人
以下是用 Coze 免费打造自己的图像生成 AI 机器人的步骤: 1. 注册 Coze 账号 访问 Coze 官网,快速注册,开启智能之旅。 Coze 中文名扣子,字节跳动出品。 中文版:https://www.coze.cn/(支持大模型:kimi、云雀)——本次教程使用中文版 Coze。 英文版:https://coze.com/(支持大模型:chatgpt4) 产品定位:新一代 AI 原生应用开发服务平台,Nextgeneration AI chatbot building platform。 2. 创建你的机器人 登录 Coze,可使用抖音或手机号登陆,登陆后选择“创建 Bot”,然后起一个响亮的名字。 登录页面、首页、创建 Bot 时,工作空间选“个人空间”即可。 小技巧:“图标”AI 可以自动生成,先在“Bot 名称”那里用文字描述你想要的图标,图标生成满意后,再把“Bot 名称”改为简洁版名称。 此外,在实际体验中: 测试 AI Bot 时,可能会出现回答不完整的情况,如部分信息未给出,这是因为 Coze 国内版刚发布不久,有些官方和第三方插件的 API 调用和返回结果不太稳定。但官方会尽快解决。 成功的回答是根据提示词和插件+工作流的组合,结果非常详细。若加上自己的知识库甚至定制化使用数据库功能,AI Bot 的使用场景会更丰富。 国外版有免费的 GPT4 大模型使用,插件和工作流功能更丰富稳定,还有更多自定义插件和工作流功能,能更灵活定制 AI Bot。 作者演示上述步骤后发布的 AI Bot,其 ID 是:7333630516673167394,有兴趣可在 Coze 平台上搜索这个 ID 来体验。
2024-11-09
flux lora 训练
以下是关于 Flux 的 Lora 模型训练的详细步骤: 准备工作: 下载所需模型:t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。 注意:不使用时模型放置位置不限,只要知道“路径”,后续会引用到“路径”。 训练建议使用 flux1dev.safetensors 版本的模型和 t5xxl_fp16.safetensors 版本的编码器。 下载训练脚本: 夸克网盘链接:https://pan.quark.cn/s/ddf85bb2ac59 百度网盘链接:https://pan.baidu.com/s/1pBHPYpQxgTCcbsKYgBi_MQ?pwd=pfsq 提取码:pfsq 数据集准备: 进入厚德云模型训练数据集:https://portal.houdeyun.cn/sd/dataset 步骤一:创建数据集 在数据集一栏中,点击右上角创建数据集。 输入数据集名称。 可以上传包含图片+标签 txt 的 zip 文件,也可以上传只有图片的文件(之后可在 c 站使用自动打标功能),或者一张一张单独上传照片,但建议提前将图片和标签打包成 zip 上传。 Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。 上传 zip 以后等待一段时间,确认创建数据集,返回到上一个页面,等待一段时间后上传成功,可点击详情检查,预览数据集的图片以及对应的标签。 步骤二:Lora 训练 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 选择数据集,点击右侧箭头,会跳出所有上传过的数据集。 触发词可有可无,取决于数据集是否有触发词。 模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 训练参数可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。 可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。 等待训练,会显示预览时间和进度条,训练完成会显示每一轮的预览图。 鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 数据集放置位置:.Flux_train_20.4\\train\\qinglong\\train 运行训练:约 1 2 小时即可训练完成。 验证和 lora 跑图:有 ComfyUI 基础的话,直接原版工作流的模型后面,多加一个 LoraloaderModelOnly 的节点就可以,自行选择您的 Lora 和调节参数。
2024-11-20
如何将历史写过的文章发给 Ai,训练生成写作风格
要将历史写过的文章发给 AI 以训练生成写作风格,可以参考以下步骤: 1. 首先,像安迪的做法一样,把过去写的多篇相关文章发给 AI。 2. 让 AI 总结这些文章的写作特点。 3. 根据 AI 总结的特点,编写出描述写作风格的提示词,从而克隆出自己的写作风格。 4. 未来使用这个风格时,先花 3 分钟时间让 AI 分别写多篇内容。 5. 从多篇内容中找到最符合心意的作品,并从其他作品中寻找好的段落。 6. 最后进行整合、修改、删减和润色,少则几分钟、十几分钟,多则半个小时就能完成一篇文章。 同时,就像夙愿提到的,找选题对于写作很重要。我们可以通过学习其他优秀公众号的文章,分析其选题思路、文章结构、表达方式等,不断训练自己的“写作模型”,但要注意不能照搬,而是要形成自己独特的风格。 另外,在写作过程中,“主体性”的介入也很关键。比如在使用 Prompt 生成公众号文章时,要先思考自己对写作的理解以及对特定主题写作风格的认知,这样写出来的 Prompt 才会有个人特色。日常也要注重基本功的积累,因为在表达“意象”时非常考验语言能力。
2024-11-18
如何用ai模型做训练
以下是关于如何用 AI 模型做训练的相关内容: 要在医疗保健领域让 AI 产生真正的改变,应投资创建像优秀医生和药物开发者那样学习的模型生态系统。成为顶尖人才通常从多年密集信息输入和学徒实践开始,AI 也应如此。当前的学习方式存在问题,应通过堆叠模型训练,如先训练生物学、化学模型,再添加特定数据点。就像预医学生从基础课程学起,设计新疗法的科学家经历多年学习和指导,这种方式能培养处理细微差别决策的直觉。 大模型的构建过程包括: 1. 收集海量数据:如同教孩子博学多才要让其阅读大量资料,对于 AI 模型要收集互联网上的各种文本数据。 2. 预处理数据:像为孩子整理适合的资料,AI 研究人员要清理和组织收集的数据,如删除垃圾信息、纠正拼写错误等。 3. 设计模型架构:为孩子设计学习计划,研究人员要设计 AI 模型的“大脑”结构,通常是复杂的神经网络,如 Transformer 架构。 4. 训练模型:像孩子开始学习,AI 模型开始“阅读”数据,通过反复预测句子中的下一个词等方式逐渐学会理解和生成人类语言。 为提高 AI 模型的鲁棒性,应对可能的“恶意”样本数据导致的幻觉,可使用对抗训练技术,让模型在训练中接触并学会识别和抵抗。
2024-11-13
怎么训练自己的小说大纲模型
训练自己的小说大纲模型可以参考以下步骤: 步骤一:创建数据集 1. 进入厚德云模型训练数据集,网址为:https://portal.houdeyun.cn/sd/dataset 。 2. 在数据集一栏中,点击右上角创建数据集。 3. 输入数据集名称。 4. 可以上传包含图片+标签的 zip 文件,也可以只有图片没有打标文件(之后可在 c 站使用自动打标功能)。 5. 也可以一张一张单独上传照片,但建议提前把图片和标签打包成 zip 上传。 6. Zip 文件里图片名称与标签文件应当匹配,例如:图片名“1.png”,对应的达标文件就叫“1.txt”。 7. 上传 zip 以后等待一段时间。 8. 确认创建数据集,返回到上一个页面,等待一段时间后上传成功,可以点击详情检查,可预览到数据集的图片以及对应的标签。 步骤二:Lora 训练 1. 点击 Flux,基础模型会默认是 FLUX 1.0D 版本。 2. 选择数据集,点击右侧箭头,会跳出所有上传过的数据集。 3. 触发词可有可无,取决于数据集是否有触发词。 4. 模型效果预览提示词则随机抽取一个数据集中的标签填入即可。 5. 训练参数这里可以调节重复次数与训练轮数,厚德云会自动计算训练步数。如果不知道如何设置,可以默认 20 重复次数和 10 轮训练轮数。 6. 可以按需求选择是否加速,点击开始训练,会显示所需要消耗的算力。 7. 然后等待训练,会显示预览时间和进度条。训练完成的会显示出每一轮的预览图。 8. 鼠标悬浮到想要的轮次模型,中间会有个生图,点击会自动跳转到使用此 lora 生图的界面。点击下方的下载按钮则会自动下载到本地。 步骤三:Lora 生图 1. 点击预览模型中间的生图会自动跳转到这个页面。 2. 模型上的数字代表模型强度,可以调节大小,正常默认为 0.8,建议在 0.6 1.0 之间调节。 3. 也可以自己添加 lora 文件,点击后会显示训练过的所有 lora 的所有轮次。 4. VAE 不需要替换。 5. 正向提示词输入写的提示词,可以选择基于这个提示词一次性生成几张图。 6. 选择生成图片的尺寸,横板、竖版、正方形。 7. 采样器和调度器新手小白可以默认不换。 8. 迭代步数可以按照需求在 20 30 之间调整。 9. CFG 可以按照需求在 3.5 7.5 之间调整。 10. 随机种子 1 代表随机生成图。 11. 所有设置都好了以后,点击开始生态,生成的图会显示在右侧。 12. 如果有哪次生成结果觉得很不错,想要微调或者高分辨率修复,可以点开那张图,往下滑,划到随机种子,复制下来,粘贴到随机种子这里,这样下次生成的图就会和这次的结果近似。 13. 如果确认了一张很合适的种子和参数,想要高清放大,则点开高清修复,可以选择想放大的倍数。新手小白可以就默认这个算法,迭代步数也是建议在 20 30 之间,重回幅度根据需求调整,正常来说在 0.3 0.7 之间调整。 今日作业 按照比赛要求,收集六个主题中一个主题的素材并且训练出 lora 模型后提交 lora 模型与案例图像。提交链接:https://waytoagi.feishu.cn/share/base/form/shrcnpJAtTjID7cIcNsWB79XMEd 。 另外,直接在 Comfy UI 中训练 LoRA 模型的步骤如下: 1. 确保后面有一个空格。然后将 requirements_win.txt 文件拖到命令提示符中(如果在 Windows 上;否则,选择另一个文件 requirements.txt)。拖动文件将在命令提示符中复制其路径。 2. 按 Enter 键,这将安装所有所需的依赖项,使其与 ComfyUI 兼容。请注意,如果为 Comfy 使用了虚拟环境,必须首先激活它。 3. 教程: 图像必须放在一个以命名的文件夹中。那个数字很重要:LoRA 脚本使用它来创建一些步骤(称为优化步骤…但别问我是什么^^’)。它应该很小,比如 5。然后,下划线是必须的。 对于 data_path,必须写入包含数据库文件夹的文件夹路径。例如:C:\\database\\5_myimages ,必须写 C:\\database 。 对于参数,在第一行,可以从 checkpoint 文件夹中选择任何模型。据说必须选择一个基本模型进行 LoRA 训练。但也可以尝试使用微调。
2024-11-12
怎么训练自己的模型
训练自己的模型可以参考以下内容: 基于百川大模型: 选择 Baichuan27BChat 模型作为底模,配置模型本地路径和提示模板。 在 Train 页面里,选择 sft 训练方式,加载定义好的数据集(如 wechat 和 self_cognition)。 注意学习率和训练轮次的设置,要根据数据集大小和收敛情况来调整。 使用 FlashAttention2 可减少显存需求,加速训练速度。 显存小的情况下,可以减少 batch size 并开启量化训练,内置的 QLora 训练方式好用。 需要用到 xformers 的依赖。 显存占用约 20G 左右,训练时间根据聊天记录规模大小而定,少则几小时,多则几天。 训练自己的 AI 绘画模型(Stable Diffusion): 样本采样器(sample_sampler):可选择,默认是“ddim”。 保存模型格式(save_model_as):可选择,SD WebUI 兼容"ckpt"和"safetensors"格式模型。 训练流程主要包括: 训练集制作:数据质量评估、标签梳理、数据清洗、标注、标签清洗、增强等。 训练文件配置:预训练模型选择、训练环境配置、训练步数及其他超参数设置等。 模型训练:运行训练脚本,使用 TensorBoard 监控。 模型测试:用于效果评估与消融实验。 训练资源: Rocky 整理优化过的 SD 完整训练资源 SDTrain 项目,可通过关注公众号 WeThinkIn,后台回复“SDTrain”获取。
2024-11-12
AI训练师是什么职业
AI 训练师是一种新兴职业,其职责和工作内容因具体领域和应用场景而有所不同。 例如,在 AI 教育培训和商业应用方面,像星动 AI 联合创始人李先森所从事的工作,可能包括对学员进行 AI 相关知识和技能的培训,以及参与 AI 项目的测评和指导等。 在 AI 设计领域,AI 训练师可能需要负责 AI 风格的开发和调试工作,参与项目的整体风格和审美定义。根据产品需求完成风格渲染的研发、测试、配置和维护,熟练使用 StableDiffusion Web UI 等 AI 框架进行风格研发,负责 AI 模型(如 LoRA,Prompt/Prompt Sentence)的训练、参数调整以及性能优化,编写高质量的渲染记录文档,进行配置和模型训练质量控制,并为团队提供技术支持和指导,解决技术难题。 总之,AI 训练师需要具备相关的专业知识和技能,以帮助 AI 系统更好地学习和优化,从而实现各种应用目标。
2024-11-11