Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

RAG和微调是什么,分别详细讲讲一下它是怎么实现的

Answer

RAG(Retrieval-Augmented Generation,检索增强生成)是解决大语言模型在实际应用中存在的一些问题的有效方案。

大语言模型存在以下问题:

  1. 知识的局限性:模型自身的知识完全源于训练数据,对于实时性、非公开或离线的数据无法获取。
  2. 幻觉问题:基于数学概率的文字预测导致可能提供虚假、过时或通用的信息。
  3. 数据安全性:企业担心私域数据上传第三方平台训练导致泄露。

RAG 可以让大语言模型从权威的、预先确定的知识来源中检索、组织相关信息,更好地控制生成的文本输出,用户也能深入了解模型如何生成最终结果。它类似于为模型提供教科书,适用于回答特定询问或解决特定信息检索任务,但不适合教模型理解广泛领域或学习新的语言、格式或样式。

微调类似于让学生通过广泛学习内化知识。这种方法在模型需要复制特定结构、样式或格式时非常有用。微调可以提高非微调模型的性能,使交互更有效率,特别适合强调基础模型中的现有知识,修改或自定义模型的输出,并向模型提供复杂的指令。然而,微调不适合合并模型中的新知识或需要新用例的快速迭代。

参考资料:《Retrieval-Augmented Generation for Large Language Models:A Survey》(https://arxiv.org/pdf/2312.10997.pdf)

Content generated by AI large model, please carefully verify (powered by aily)

References

RAG提示工程(一):基础概念

大语言模型技术的本质导致了大模型的输出结果具有不可预测性,此外,静态的训练数据导致了大模型所掌握的知识存在截止日期,无法即时掌握最新信息。因此,当我们将大模型应用于实际业务场景时会发现,通用的基础大模型无法满足我们的实际业务需求。主要存在以下原因:知识的局限性:模型自身的知识完全源于它的训练数据,而现有的主流大模型(ChatGPT、文心一言、通义千问…)的训练集基本都是抓取网络公开的数据用于训练,对于一些实时性的、非公开的或离线的数据是无法获取到的,这部分知识也就无从具备。幻觉问题:大模型的底层原理是基于数学概率的文字预测,即文字接龙。因此大模型存在幻觉问题,会在没有答案的情况下提供虚假信息,提供过时或通用的信息,从可信度低非权威来源的资料中提供结果等。数据安全性:对于企业来说,数据安全至关重要,没有企业愿意承担数据泄露的风险,将自身的私域数据上传第三方平台进行训练。因此如何大模型落地应用时如何保障企业内部数据安全是一个重要问题。而RAG是解决上述问题的一套有效方案。它可以让大模型从权威的、预先确定的知识来源中检索、组织相关信息,更好地控制大模型生成的文本输出,并且用户可以深入了解LLM如何生成最终的结果。并且,RAG可以和微调结合使用,两者并不冲突。RAG类似于为模型提供教科书,允许它基于特定查询检索信息。这该方法适用于模型需要回答特定的询问或解决特定的信息检索任务。然而,RAG不适合教模型来理解广泛的领域或学习新的语言,格式或样式。微调类似于让学生通过广泛的学习内化知识。这种方法当模型需要复制特定的结构、样式或格式时非常有用。以下是RAG与微调从维度方面的比较:参考资料:《Retrieval-Augmented Generation for Large Language Models:A Survey》(https://arxiv.org/pdf/2312.10997.pdf)

19. RAG 提示工程系列(一)

微调类似于让学生通过广泛的学习内化知识。这种方法当模型需要复制特定的结构、样式或格式时非常有用。微调可以提高非微调模型的性能,并使交互更加频繁有效率的它特别适合强调基础模型中的现有知识,修改或自定义模型的输出,并向提供复杂的指令模型然而,微调不适合合并模型中的新知识或需要的情况新用例的快速迭代。以下是RAG与微调从维度方面的比较:参考资料:《Retrieval-Augmented Generation for Large Language Models:A Survey》(https://arxiv.org/pdf/2312.10997.pdf)

02-基础通识课

[heading2]总结大语言模型的介绍与原理国内大模型的分类:国内大模型有通用模型如文心一言、讯飞星火等,处理自然语言;还有垂直模型,专注特定领域如小语种交流、临床医学、AI蛋白质结构预测等。大模型的体验:以‘为什么我爸妈结婚的时候没有邀请我参加婚礼’和‘今天我坐在凳子上’为例,体验了Kimi、通义千问、豆包等大模型的回答和续写能力,发现回复有差异,且大模型基于统计模型预测生成内容。大语言模型的工作原理:大语言模型工作原理包括训练数据、算力、模型参数,在训练数据一致情况下,模型参数越大能力越强,参数用b链形容大小。Transformer架构:Transformer是大语言模型训练架构,17年出现用于翻译,具备自我注意力机制能理解上下文和文本关联,其工作原理是单词预测,通过嵌入、位置编码、自注意力机制生成内容,模型调教中有控制输出的temperature。关于大语言模型的原理、应用及相关概念Transformer模型原理:通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率,是一个偏向概率预测的统计模型。大模型幻觉:大模型通过训练数据猜测下一个输出结果,可能因错误数据导致给出错误答案,优质数据集对其很重要。Prompt的分类和法则:分为system prompt、user prompt和assistant prompt,写好prompt的法则包括清晰说明、指定角色、使用分隔符、提供样本等,核心是与模型好好沟通。Fine tuning微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。RAG概念:未对RAG的具体内容进行详细阐述,仅提出了这个概念。

Others are asking
RAG的原理是啥
RAG(RetrievalAugmented Generation,检索增强生成)是一种结合检索和生成能力的自然语言处理架构,其原理如下: 对于大语言模型(LLM),RAG 的作用类似于开卷考试对学生的作用。在开卷考试中,学生可借助参考资料查找解答问题的相关信息,重点考察推理能力而非记忆能力。同样,在 RAG 中,事实性知识与 LLM 的推理能力相分离,被存储在易于访问和及时更新的外部知识源中,包括参数化知识(模型在训练中学习得到,隐式存储在神经网络权重中)和非参数化知识(存储在外部知识源,如向量数据库中)。 回顾 LLM 的原理,是将互联网文献材料降维到 latent space 中,并通过 transformer 方式学习其中的“经验”。但固定文献资料可能导致无法回答某些问题,RAG 的出现解决了这一问题,它允许模型到搜索引擎上搜索问题相关资料,并结合自身知识体系综合回复。 RAG 中的“检索”环节并非简单操作,涉及传统搜索的逻辑,如对输入问题的纠错、补充、拆分,以及对搜索内容的权重逻辑等。例如,对于“中国界世杯夺冠那年的啤酒销量如何”的问题,会先纠错为“中国世界杯夺冠那年的啤酒销量如何”,然后拆分为两个问题进行综合搜索,再将搜索到的资料提供给大模型进行总结性输出。 LLM 需要 RAG 是因为 LLM 存在一些缺点: 1. 无法记住所有知识,尤其是长尾知识,对长尾知识的接受能力不高。 2. 知识容易过时且不好更新,微调效果不佳且有丢失原有知识的风险。 3. 输出难以解释和验证,存在黑盒、不可控和幻觉等问题。 4. 容易泄露隐私训练数据。 5. 规模大,训练和运行成本高。 而 RAG 具有以下优点: 1. 数据库对数据的存储和更新稳定,不存在模型学不会的风险。 2. 数据库的数据更新敏捷,增删改查可解释,不影响原有知识。 3. 数据库内容明确、结构化,结合模型理解能力,降低大模型输出出错的可能。 4. 知识库存储用户数据,便于管控用户隐私数据,且可控、稳定、准确。 5. 数据库维护可降低大模型训练成本,新知识存储在数据库即可,无需频繁更新模型。
2025-02-20
RAG最新进展
RAG(检索增强生成)是由 Lewis 等人于 2020 年中期提出的一种大语言模型领域的范式。 其发展经历了以下阶段: 1. 2017 年创始阶段,重点是通过预训练模型吸收额外知识以增强语言模型,主要集中在优化预训练方法。 2. 大型语言模型如 GPT 系列在自然语言处理方面取得显著成功,但在处理特定领域或高度专业化查询时存在局限性,易产生错误信息或“幻觉”,特别是在查询超出训练数据或需要最新信息时。 3. RAG 包括初始的检索步骤,查询外部数据源获取相关信息后再回答问题或生成文本,此过程为后续生成提供信息,确保回答基于检索证据,提高输出准确性和相关性。 4. 在推断阶段动态检索知识库信息能解决生成事实错误内容的问题,被迅速采用,成为完善聊天机器人能力和使大语言模型更适用于实际应用的关键技术。 RAG 在多个基准测试中表现出色,如在 Natural Questions、WebQuestions 和 CuratedTrec 等中表现抢眼。用 MSMARCO 和 Jeopardy 问题进行测试时,生成的答案更符合事实、具体和多样,FEVER 事实验证使用后也有更好结果。基于检索器的方法越来越流行,常与 ChatGPT 等流行大语言模型结合使用提高能力和事实一致性,在 LangChain 文档中有相关使用例子。 同时,对增强生成检索的兴趣增长促使了嵌入模型质量的提高,传统 RAG 解决方案中的问题也得到解决。
2025-02-20
rag
RAG(RetrievalAugmented Generation,检索增强生成)是一种结合检索和生成能力的自然语言处理架构。 通用语言模型通过微调可完成常见任务,而更复杂和知识密集型任务可基于语言模型构建系统,访问外部知识源来实现。Meta AI 引入 RAG 来完成这类任务,它把信息检索组件和文本生成模型结合,可微调且内部知识修改高效,无需重新训练整个模型。 RAG 接受输入并检索相关支撑文档,给出来源,与原始提示词组合后送给文本生成器得到输出,能适应事实变化,让语言模型获取最新信息并生成可靠输出。 大语言模型(LLM)存在一些缺点,如无法记住所有知识尤其是长尾知识、知识易过时且不好更新、输出难以解释和验证、易泄露隐私训练数据、规模大导致训练和运行成本高。而 RAG 具有数据库存储和更新稳定、数据更新敏捷且不影响原有知识、降低大模型输出出错可能、便于管控用户隐私数据、降低大模型训练成本等优点。 在 RAG 系统开发中存在 12 大痛点及相应的解决方案,旨在帮助理解设计和实施 RAG 系统面临的复杂挑战,激发开发更强大且适用于生产环境的 RAG 应用。
2025-02-18
有什么提升 RAG 知识库问答的好的 prompt
以下是一些提升 RAG 知识库问答的好的 prompt 相关内容: RAG 在 Natural Questions、WebQuestions 和 CuratedTrec 等基准测试中表现出色,在使用 MSMARCO 和 Jeopardy 问题进行测试时,生成的答案更符合事实、具体且多样,FEVER 事实验证使用 RAG 后也有更好结果,说明 RAG 是可行方案,能增强知识密集型任务中语言模型的输出,基于检索器的方法常与 ChatGPT 等流行 LLM 结合提高能力和事实一致性,可在 LangChain 文档中找到相关例子。 RAG 能显著提高大模型在处理私域知识或垂直领域问答时的效果。其流程包括:上传文档(支持多种格式,会转换为 Markdown 格式)、文本切割、文本向量化(存入向量数据库)、问句向量化、语义检索匹配(匹配出与问句向量最相似的 top k 个)、提交 Prompt 至 LLM、生成回答返回给用户。RAG 研究范式分为基础 RAG、高级 RAG 和模块化 RAG。 高级 RAG 特点:支持多模态数据处理,增强对话性,具备自适应检索策略,能进行知识融合,扩展了基础 RAG 功能,解决复杂任务局限,在广泛应用中表现出色,推动自然语言处理和人工智能发展。 模块化 RAG 侧重于提供更高定制性和灵活性,将系统拆分成多个独立模块或组件,每个组件负责特定功能,便于根据不同需求灵活组合和定制。
2025-02-18
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
请你讲讲如何写提示词能与KIMI有效沟通
以下是关于如何写提示词与 KIMI 有效沟通的一些要点: 1. 不要期望设计一个完美的提示词就能得到理想答案,应将提示词视为一个相对完善的“谈话方案”,在与 KIMI 的对话中产生最终成果,并限缩自己思维中的模糊地带。 2. 多给 KIMI 几轮对话修正的余地,不要期望一次输入提示词就能得到想要的东西,因为很多时候自己刚开始也不清楚想要什么。 3. 可以参考以下步骤: 询问 KIMI“更好的提问”的方法论。 让 KIMI 分析提问适合的优化方法,并给出优化过程和结果。 将 KIMI 优化后的提问输入给特定的自动结构化框架,得到“提问优化助手”Prompt。 新建对话,先将“提问优化助手”发给 KIMI,再发送原始提问,得到结果。 再新建对话,让 KIMI 对比两份结果。 4. 在创作视频分镜头时,也可以借助 KIMI 写画面描述,甚至加上对音效的需求。同时,要尽可能精简人物对话,提炼重点。画面数量与台词长短有关,需平衡画面之间的联系。
2025-02-16
AI应用的挑战之一,数据,可以展开讲讲吗
在 AI 应用中,数据是至关重要但也面临诸多挑战: 1. 高质量数据短缺:传统互联网数据已难以满足需求,AI 模型需要更高质量的“前沿数据”,包括复杂推理过程、专业知识和人类思维模式等,以提升推理能力和整体性能。 2. 数据标注角色转变:从简单的画边界框变为需要证明复杂数学定理或批判性审查 AI 生成的多种解决方案。 3. 合成数据的应用与风险:合成数据成为解决真实数据获取难、隐私保护成本高等问题的途径,但也存在与真实数据分布不一致导致模型偏差、隐藏误导性模式影响模型可靠性等风险。 4. 数据与需求不匹配:产品从业者使用 AI 工具时,面临默认知识库和能力与需求不匹配的问题,且市场上 AI 工具大多功能相似、生成内容质量不稳定。 5. 选择和学习成本高:用户存在不知如何找到适用的 AI 工具、因产品同质化严重不知如何选择以及学习成本高等困扰。 6. 潜在的偏见和歧视:AI 训练依赖大量数据,若数据集存在偏见,可能在招聘等应用场景中复制甚至加剧对特定社会群体或性别的偏见,导致无意的歧视,带来法律责任。 7. 数据隐私问题:使用 AI 招聘系统收集大量个人数据,若被滥用会侵犯候选人隐私。
2024-12-16
有去了解哪些国内外的Agent产品?详细讲讲其中一个
国内外有多个 Agent 产品,以下为您详细介绍其中一些: 1. 扣子(coze.cn):是国内的新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成了丰富的插件工具,可拓展 Bot 的能力边界。 2. Coze(coze.com):海外版的 Agent 平台。 3. 百度 AppBuilder:百度推出的相关平台。 4. 阿里通义千问:具有一定特色和功能。 5. 智谱 AI:在 AI 领域有一定影响力。 此外,还有以下一些 Agent 构建平台: 1. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 2. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据自身需求打造产品能力。 3. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行设计良好的工作流。 4. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 5. 钉钉 AI 超级助理:依托于钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 在 ToC 领域,目前成体系的主要有以下几类产品: 1. 主打 AI 角色扮演赛道的产品,例如“猫箱”“剧本戏”“名人朋友圈”这类,在 LLM 基础上,在 prompt 上加了些特定角色定义。 2. 主打 AI 陪伴类的产品,例如“星野”“Talkie”“BubblePal”等,这类产品在 LLM 基础上,在 prompt 上加了些特定角色定义,且会在长短记忆上做出处理,以突出陪伴意义。随着陪伴时间越久,知识库沉淀的个性化记录越丰富,AI 也会越懂您。 3. 做 AI 搜索工具的产品,例如“秘塔”“360 搜索”等,这类产品多为 RAG,也有会在搜索内容基础上,把内容结构化,整出一个图谱或者脑图。 4. 单纯的做 AIGC 的产品,例如“可灵”“ai 写作手”“即梦”“md”等,借助 AI 的生成能力做出。 5. Agent 产品,目前只有头部的厂商在做,比如字节的扣子,支付宝的智能助理,百度的文心智能体,腾讯的元宝。
2024-09-04
请你给我讲讲中医和人工智能相结合的案例
中医与人工智能(AI)的结合是现代科技发展与传统医学知识融合的一个典型案例。以下是一些中医与AI结合的案例: 1. 中医药AI大模型共建:清华大学的两个院士团队,博奥晶方和水木分子,合作开发中医药AI大模型,旨在利用AI技术挖掘中医药的原创研发数据,推动中医药现代化和新药研发。 2. 智能中医管理系统:李梢教授团队利用UNIQ系统,结合临床病例数据,发现了胃癌“极早期”阶段,并通过中药干预可能阻断癌变,提升了中医药精准诊疗水平。 3. 中医辅助诊疗系统:通过图像智能识别、计算机视觉和自然语言处理技术,AI可以模拟中医的诊断过程,如通过舌象图像进行胃癌筛查和诊断,以及通过眼睛颜色、形状与疾病之间关系的分析进行临床诊断。 4. 中医教育与传承:AI技术帮助将知名医生的个性化诊断和治疗经验转化为标准化协议,提高了中医传承的效率,促进了中医药人才培养。 5. 中医药数据挖掘:AI技术在分析大规模中药处方数据集和识别药物之间的潜在模式方面发挥着重要作用,有助于优化处方和提高治疗效果。 6. 中药质量控制:利用深度学习和神经智能网络,AI可以智能识别中药材片,提高中药的标准化和质量稳定性。 7. 中医诊疗规则获取与模型设计:通过集成不同来源的诊疗规则,形成以证候要素为核心的集成诊疗规则,并利用图卷积神经网络和知识图谱构建可视化模型。 这些案例展示了AI技术在中医药领域的广泛应用,包括药物研发、疾病诊断、质量控制、数据挖掘和教育传承等。通过AI的帮助,中医药能够更高效地进行知识传承、疾病治疗和新药开发,同时也为中医药的现代化和国际化提供了新的途径。
2024-05-02
模型微调是怎么实现的
模型微调是一种迁移学习技术,常用于深度学习中。其基本思路是先有一个在大量数据上预训练的模型,已学会一些基本模式和结构,然后在特定任务数据上继续训练以适应新任务。 以下是关于模型微调的具体实现步骤: 1. 准备和上传训练数据。 2. 训练新的微调模型: LoRA 微调: 脚本见:。 具体实现代码见。 单机多卡的微调可通过修改脚本中的include localhost:0 来实现。 全量参数微调: 脚本见:。 具体实现代码见。 3. 加载微调模型: LoRA 微调:基于 LoRA 微调的模型参数见基于 Llama2 的中文微调模型,LoRA 参数需和基础模型参数结合使用。通过加载预训练模型参数和微调模型参数。 全量参数微调:调用方式同模型调用代码示例,只需修改其中的模型名称或保存路径。 微调的优点包括: 1. 比即时设计更高质量的结果。 2. 能够训练比提示中更多的例子。 3. 由于更短的提示而节省了 Token。 4. 更低的延迟请求。 微调目前仅适用于以下基础模型:davinci、curie、babbage 和 ada。 以下是两个帮助理解微调概念的例子: 1. 情感分类:先使用大量语料库预训练模型,使其学会基本语法和单词语义,再收集标注过的电影评论(积极或消极)继续训练模型,使其学会判断评论情感。 2. 图像分类:先使用大量图片(如 ImageNet 数据集)预训练模型,使其学会识别图片中的基本形状和纹理,再收集标注过的猫和狗的图片继续训练模型,使其学会区分猫和狗。
2025-02-19
如何构建自己领域的微调数据集
构建自己领域的微调数据集可以参考以下步骤: 1. 确定目标领域和应用需求:明确您希望模型在哪个细分领域进行学习和优化。 2. 数据收集:广泛收集与目标领域相关的数据。例如,若要训练二次元模型,需收集二次元优质数据;若要微调 Llama3 ,可参考相关文档获取数据集。 3. 数据标注:对收集的数据进行准确标注,以便模型学习到有效的特征。 4. 数据清洗:去除无效或错误的数据,提高数据质量。 5. 特殊处理:如为数据添加特殊 tag 等。 以 Stable Diffusion 为例,可收集如 833 张宝可梦数据,并按照特定步骤进行清洗、标注和添加特殊 tag 。对于 Llama3 ,获取数据集后上传到服务器,编写并执行微调代码即可进行微调。 在微调过程中,还需注意一些问题,如大型语言模型微调可能面临训练时间长、成本高等挑战,此时可考虑参数有效调优等创新方法。
2025-02-17
微调
微调(Finetuning)是一种迁移学习技术,常用于深度学习中。其基本思路是先有一个在大量数据上预训练过的模型,该模型已学会一些基本模式和结构,然后在特定任务数据上继续训练,使其适应新任务。 例如在情感分类中,可先使用大量语料库预训练模型学会基本语法和单词语义,再用标注过的电影评论继续训练以判断情感。在图像分类中,先使用大量图片预训练模型学会识别基本形状和纹理,再用标注的猫和狗图片继续训练以区分二者。 创建微调模型时,假设已准备好训练数据,可使用 OpenAI CLI 开始微调工作。需确定从哪个基本模型(如 ada、babbage、curie 或 davinci)开始,并可使用后缀参数自定义微调模型名称。运行命令会上传文件、创建微调作业、流式传输事件直至作业完成。每个微调工作默认从 curie 模型开始,模型选择会影响性能和成本。作业开始后可能需几分钟或几小时完成,若事件流中断可恢复。此外,还可列出现有作业、检索作业状态或取消作业。 微调的超参数方面,选择了适用于一系列用例的默认超参数,唯一需要的参数是训练文件。但调整超参数通常可产生更高质量输出的模型,可能需配置的内容包括:要微调的基本模型名称(如“ada”“babbage”“curie”“davinci”);训练模型的时期数(n_epochs,默认为 4);批量大小(batch_size,默认为训练集中示例数量的 0.2%,上限为 256);微调学习率乘数(learning_rate_multiplier,默认为 0.05、0.1 或 0.2);是否计算分类指标(compute_classification_metrics,默认为假)。配置这些超参数可通过 OpenAI CLI 上的命令行标志传递。
2025-01-11
微调是什么意思
微调(Finetuning)是一种迁移学习技术,常用于深度学习中。其基本思路是:先有一个在大量数据上预训练过的模型,该模型已学会一些基本模式和结构(如自然语言处理中学会基本语法和单词语义,图像识别中学会基本形状和纹理)。然后,在特定任务数据上继续训练这个模型,使其适应新的任务。 以下是两个例子帮助理解: 1. 情感分类:先使用大量语料库预训练模型,使其学会基本语法和单词语义。再收集标注过的电影评论(一部分积极,一部分消极),在这些评论上继续训练模型,使其学会判断评论情感。 2. 图像分类:先使用大量图片(如 ImageNet 数据集)预训练模型,使其学会识别图片中的基本形状和纹理。再收集标注过的图片(一部分是猫,一部分是狗),在这些图片上继续训练模型,使其学会区分猫和狗。 微调在 LLM 应用中,是在已经训练好的模型基础上进一步调整,让模型的输出更符合预期。Finetune、Finetuning 是常用的英文写法。微调是在较小的、针对特定任务的标注数据集上进一步训练已经预训练过的 LLM 的过程,可调整部分模型参数以优化其在特定任务或任务集上的性能。 微调可让您从 API 提供的模型中获得更多收益,如比即时设计更高质量的结果、能够训练比提示中更多的例子、由于更短的提示而节省 Token、更低的延迟请求。GPT3 已在大量文本上预训练,微调通过训练比提示中更多的示例来改进小样本学习,让您在大量任务中取得更好的结果。对模型进行微调后,您将不再需要在提示中提供示例,这样可以节省成本并实现更低延迟的请求。 微调涉及以下步骤: 1. 准备和上传训练数据。 2. 训练新的微调模型。 3. 使用您的微调模型。 微调目前仅适用于以下基础模型:davinci、curie、babbage 和 ada。这些是原始模型,在训练后没有任何说明(例如 textdavinci003)。您还可以继续微调微调模型以添加其他数据,而无需从头开始。建议使用 OpenAI 命令行界面,安装时需注意相关要求。
2025-01-11
调研一下AI安全治理这个方向的国内外的团队和人。包括AI安全治理的子方向,每一个子方向国内外有哪些科研院所的哪些团队在做相关方向的工作,以及这些团队有哪些骨干成员,他们有哪些观点。以及这个团队有哪些治理成果,尽量详细
以下是关于 AI 安全治理方向的国内外团队和人的相关调研: 国外团队和人员: OpenAI:首席科学家 Ilya 对模型安全较为关注,提出了通过“指令层次结构”来修复“忽略所有先前指令“攻击的方法,并已在 GPT40 Mini 中得到部署。 Anthropic:在多重越狱方面的工作表明了“警告防御”的潜力,在前面和后面添加警告文本,以警示模型不要被越狱。 Gray Swan AI 的安全专家:试用“断路器”,专注于重新映射有害表示,效果比标准拒绝训练更好。 图灵奖得主 Hinton:支持对 AI 监管,认为大模型及其驱动的 AI 必须引入安全性监管,防止其失控或对人类造成伤害,并在网上签署了联名公开信。 英国:创建了世界上第一个人工智能安全研究所 AISA,具有在部署前对高级模型进行评估、建立国家能力并开展研究、协调国际合作伙伴等核心功能,还发布了 Inspect 框架用于 LLM 安全评估,并宣布与美国等效机构签署谅解备忘录,计划在美国旧金山设立办事处。 国内团队和人员:目前调研内容中未提及国内相关团队和人员的具体信息。 在观点方面,Bengio、Hinton、姚期智等著名研究者认为大模型及其驱动的 AI 必须引入安全性监管,确保大模型是 Safety 的,防止其失控或对人类造成伤害,并签署了联名公开信表达对于 AI 失控的担忧,呼吁学术界和工业界对大模型进行监管。吴恩达和 Lecun 则认为模型的能力不足以使其脱离人类的限制。 治理成果方面,英国通过其高级研究与发明机构(ARIA)花费 5900 万英镑开发“守门员”,负责了解和减少在能源、医疗保健和电信等关键领域中其他人工智能代理的风险。英国政府还计划设立一个“AI 安全研究实验室”。美国能源部一直在利用其内部测试床评估人工智能可能对关键基础设施和能源安全带来的风险。LLM 测试初创公司 Haize Labs 与 Hugging Face 合作创建了首个红队抵抗组织基准,汇编了常用的红队数据集并根据模型评估它们的成功率。Scale 根据私人评估推出了自己的稳健性排行榜。
2025-02-20
我是少儿编程老师,现在我需要知道编程每个语言之间的区别,并绘制出一张思维导图给我详细介绍
很抱歉,目前没有关于编程各语言区别的详细内容来为您绘制思维导图。但一般来说,不同的编程语言在语法、应用场景、性能特点等方面存在差异。例如,Python 语法简洁,常用于数据科学和人工智能;Java 应用广泛,在企业级开发中表现出色;C++ 性能高效,常用于系统编程和游戏开发等。您可以通过在线编程学习网站、相关书籍以及技术论坛获取更详细准确的信息来绘制思维导图。
2025-02-19
有关deepseek的详细教程
以下是关于 DeepSeek 的详细教程: 1. 《胡凯翔:DeepSeek 为什么省钱》(https://waytoagi.feishu.cn/wiki/OzgnwiZrniBXASkhVBbcBR3Mnhh):介绍了 DeepSeek 相关的基本术语,阐述其省钱原因,包括高效硬件使用、创新训练方法、高效模型压缩、避免无效尝试等,还提及成本对比及创新蒸馏技术。接着从核心思想、技术实现方式(知识表示、温度调节)、训练过程(基本流程、关键点)、DeepSeek 的创新及有效性原因(信息压缩、概率分布学习、泛化能力)等方面详细讲述了蒸馏工作原理。 2. 《DeepSeek:从入门到精通》(https://waytoagi.feishu.cn/record/QAURr4CNGeJ5GIcvU0nc9X3dndg):由清华大学新闻与传播学院新媒体研究中心出品。详细阐述了 DeepSeek 的功能,包括智能对话、文本生成、代码生成、自然语言理解等,并探讨了如何使用 DeepSeek,包括推理模型与通用模型的区别、提示语设计策略以及如何从入门到精通。文章还介绍了提示语设计的核心技能、常见陷阱及应对方法,旨在帮助用户更好地掌握 AI 工具的使用,提升工作效率和创新能力。 3. 新手推荐使用 DeepSeek(2→3.2→4 这样路径),网址:https://www.deepseek.com/zh 。使用时很方便,国内能访问,网页登录便捷,目前完全免费。只需点击开始对话,左边选择代码助手即可。
2025-02-15
详细介绍下langchain
LangChain 是一个用于构建高级语言模型应用程序的框架,旨在简化开发人员使用语言模型构建端到端应用程序的过程。 它具有以下特点和优势: 1. 提供一系列工具、组件和接口,使基于大型语言模型(LLM)和聊天模型创建应用程序更轻松。 2. 核心概念包括组件和链,组件是模块化构建块,可组合创建强大应用,链是一系列组件或其他链的组合,用于完成特定任务。 3. 具有模型抽象功能,提供对大型语言模型和聊天模型的抽象,便于开发人员选择合适模型并利用组件构建应用。 4. 支持创建和管理提示模板,引导语言模型生成特定输出。 5. 允许开发人员定义处理步骤链,按顺序执行完成复杂任务。 6. 支持构建代理,能使用语言模型做决策并根据用户输入调用工具。 7. 支持多种用例,如特定文档问答、聊天机器人、代理等,可与外部数据源交互收集数据,还提供内存功能维护状态。 LangChain 是一个开源框架,为简化大模型应用开发而设计。它通过提供模块化的工具和库,允许开发者轻松集成和操作多种大模型,将更多精力投入到创造应用的核心价值上。其设计注重简化开发流程,支持广泛的模型,具备良好的可扩展性以适应业务需求变化。作为社区广泛支持的开源项目,拥有活跃的贡献者和持续更新,提供全面的文档和示例代码帮助新用户快速掌握。同时,在设计时充分考虑应用的安全性和用户数据的隐私保护,是多语言支持的灵活框架,适用于各种规模的项目和不同背景的开发者。 LangChain 官方手册:https://python.langchain.com/docs/get_started/introduction/
2025-02-14
如何详细学习coze
以下是关于学习 Coze 的详细内容: 新知识学习方法:推荐使用 Claude + Coze 的组合。Claude 是目前强大的 AI 大模型,每月 20 美元,性能出色。Coze 是一款 AI Agent 的衍生产品,其价值主要体现在跟进 AI Agent 工具发展情况、发现商业化机会以及制作产品 Demo 等方面。对于学习 RAG,可先通过 Claude 了解细节概念,再通过 Coze 搭建 Demo 并在实践中学习。在学习过程中创建了产品资料问答机器人等 4 个 Bot,相关资料可参考公开分享:。 数据库概念:在学习 AI Agent 过程中,记忆离不开数据库组件。本文从非编程人士角度讲解数据库概念和基本使用,不涉及传统的 SQL 语法,而是通过与 Excel 对比帮助理解,旨在让您更好地利用 ChatGPT 等工具辅助学习。同时预告了关于 AI 时代编程基础系列的大纲。 变现方式:本期 Coze 变现模板(多智能体版)课程大纲包括制作完成后的“变现网站”用户体验、开发者体验以及深入学习 Zion 等内容。未注册过 Zion 需按特定步骤注册并填写邀请码“coze”领取代金券;已注册 Zion 可通过填写表单申请代金券。工作人员将手动发券到账户,两种方式均可获得 VIP 券,后续可用该券建站,使用“coze 变现模板(多智能体版)”模板。
2025-02-13
你好,我想做一个用照片做视频的博主,请帮我构思一套详细的视频号起号的框架、流程、以及每一步骤的详细执行指导
很抱歉,目前没有关于用照片做视频的博主起号的相关内容。但我可以为您提供一个大致的框架和流程,以及每一步骤的简要执行指导供您参考: 框架: 1. 明确视频号定位:确定您的视频号是以何种风格、主题展示照片视频,例如旅行照片集、宠物照片故事等。 2. 内容策划:规划好要发布的照片系列,制定一个长期的内容计划。 3. 品牌塑造:包括起一个吸引人的账号名称、设计独特的头像和封面。 流程: 1. 账号注册与设置:选择一个易记且与主题相关的账号名,完善个人简介,突出您的特色和价值。 2. 素材准备:整理和筛选高质量的照片,并对其进行分类。 3. 视频制作:使用合适的软件将照片制作成精彩的视频,添加音乐、特效等元素增强吸引力。 4. 发布策略:选择合适的时间发布视频,保持一定的发布频率。 每一步骤的详细执行指导: 账号注册与设置: 账号名要简洁、有特色,能反映您的视频主题。 个人简介要清晰地介绍您的视频号定位、能为观众带来什么价值。 素材准备: 从大量照片中挑选出清晰、美观、有故事性的照片。 按照主题或时间顺序对照片进行分类,方便后续制作。 视频制作: 学习并熟练使用视频编辑软件,如剪映等。 选择适合照片风格的音乐,注意版权问题。 适当添加转场效果、文字说明等,提升视频的观赏性。 发布策略: 分析目标受众的活跃时间,例如晚上或周末。 初期可以每周发布 12 个视频,根据反馈逐渐调整频率。 希望以上内容对您有所帮助,祝您成功!
2025-02-08