直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

思维链技术什么

回答

思维链技术(Chain of Thought,简称 CoT)是让大模型能够涌现出一系列神奇能力的底层技术,在大模型的研发中备受关注。

其主要特点和作用包括:

  1. 旨在通过向大语言模型展示少量样例,并解释推理过程,让模型学会在生成答案时展示推理过程,引导其得到更准确的答案。
  2. 相当于将黑盒深度学习的多步推理过程的中间步骤拆开,解耦各个步骤的工作,简化每一步工作上模型的压力,在提高可解释性的同时提升模型性能。
  3. 利用了大语言模型在预测 Token 序列方面的优势,将其通常隐含的推理步骤转化为明确的、指导性的序列,增强模型产生基于逻辑推理输出的能力,特别是在复杂的解决问题场景下。
  4. 主要有零样本 CoT 和手动 CoT 两种变体。零样本 CoT 促使模型逐步解开问题,鼓励逐步阐明推理过程;手动 CoT 需要提供明确的、逐步的推理示例作为模板,更明确地引导模型朝向推理输出,但存在可扩展性和维护方面的挑战。
  5. 作为一种促进语言模型推理的方法,具有几个吸引人的特性:
    • 允许模型将多步骤问题分解为中间步骤,为需要更多推理步骤的问题分配额外计算。
    • 提供了一个可解释的窗口,观察模型的行为,便于调试推理路径。
    • 可用于数学文字问题、常识推理和符号操纵等任务,原则上适用于人类可以通过语言解决的任何任务。
    • 通过在少量提示的例子中包含思维链序列,可容易地在现成语言模型中引出思维链推理。

CoT 提出者 Jason Wei 表示,他的灵感来源于一本叫做《Waking up》的冥想之书。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

访谈:Jason Wei | 思维链灵感来源于冥想

在大模型的研发道路上,思维链、指令微调和智能涌现等关键思想备受关注。正是思维链技术(Chain of Thought)让大模型能够涌现出一系列神奇的能力,成为了现代大语言模型产生「涌现」的底层技术。思维链旨在通过向大语言模型展示少量的样例,并通过这些样例解释推理过程,让大语言模型学会在生成答案时展示推理过程,并引导其得到更准确的答案。相当于将黑盒深度学习的多步推理过程的中间步骤拆开,结耦了各个步骤的工作,简化了每一步工作上模型的压力,在提高可解释性的同时提升了模型性能。研究灵感往往来自某次偶然的一瞥惊鸿,可遇而不可求。谈起思维链的灵光乍现,CoT提出者Jason Wei表示,他的灵感来源是一本叫做《Waking up》的冥想之书,该书作者为美国无神论者、公共知识分子Sam Harris,从灵修(spirituality)的角度讲述了思维、意识和自我的关系。智源社区特别邀请到现任OpenAI科学家Jason Wei进行了独家专访,请他谈到了做研究的点点滴滴,以及在谷歌和OpenAI的工作经历。Jason Wei毕业于达特茅斯大学,在大模型研发领域拥有丰富的经验和杰出成就,在谷歌工作期间曾主导推广了大语言模型中包括思维链提示、指令微调和模型涌现在内一系列关键思想的诞生。

小七姐:精读翻译《提示词设计和工程:入门与高级方法》

在前面介绍的基础上,思维链(CoT)技术,如Google研究人员在“思维链提示词在大型语言模型中引出推理”[5]中所述,标志着在利用大型语言模型(LLM)的推理能力方面迈出了重要一步。这种技术利用了这样一个前提,即虽然LLM在预测Token序列方面表现出色,但它们的设计并不固有地促进显式推理过程。CoT将LLM通常隐含的推理步骤转化为明确的、指导性的序列,从而增强了模型产生基于逻辑推理的输出的能力,特别是在复杂的解决问题的背景下。这种方法主要表现为两种变体:1.零样本CoT:这种方法促使LLM逐步解开问题,鼓励逐步阐明其推理过程。2.手动CoT:这种更复杂的变体需要提供明确的、逐步的推理示例作为模板,从而更明确地引导模型朝向推理输出。尽管手动CoT效果显著,但其依赖于精心制作的示例,带来了可扩展性和维护方面的挑战。尽管手动CoT通常优于零样本CoT,但其有效性取决于提供的示例的多样性和相关性。制作这些示例的劳动密集型和潜在错误的过程为探索自动CoT[6]铺平了道路,后者旨在简化和优化示例生成过程,从而扩大CoT提示词在LLM中的适用性和效率。

小七姐:Chain-of-Thought Prompting 精读翻译

[title]小七姐:Chain-of-Thought Prompting精读翻译[heading2]思维链提示技术在解决复杂的推理任务(例如多步数学单词问题)时,请考虑自己的思维过程。通常将问题分解为中间步骤并解决每个步骤,然后再给出最终答案:“简给妈妈2朵花后,她有10朵......然后她给她爸爸3后,她会有7个......所以答案是7。本文的目标是赋予语言模型产生类似思维链的能力——一系列连贯的中间推理步骤,推导问题的最终答案。我们将证明,如果在示例中为少样本提示提供思维链推理的演示,那么大语言模型可以生成思维链。图1展示了一个模型为了解决一个数学文字问题而产生的思维链的例子,如果没有这个思维链,模型本来会得到错误答案。在这种情况下,思维链类似于解决方案,可以解释为一个解决方案,但我们仍然选择称其为思维链,以更好地捕捉它模仿逐步思考过程以得出答案的想法(另外,解题思路/解释通常出现在最终答案之后(Narang等人,2020年;Wiegreffe等人,2022年;Lampinen等人,2022年等))。思维链提示技术作为一种促进语言模型推理的方法具有几个吸引人的特性。1.首先,从原则上讲,思维链允许模型将多步骤问题分解为中间步骤,这意味着可以为需要更多推理步骤的问题分配额外的计算。2.其次,思维链提供了一个可解释的窗口,观察模型的行为,建议它可能是如何得出特定答案的,并提供机会去调试推理路径哪里出错了(尽管完全描述支持答案的模型的计算仍然是一个悬而未决的问题)。3.第三,思维链推理可用于诸如数学文字问题、常识推理和符号操纵等任务,并且可能适用(至少从原则上讲)于人类可以通过语言解决的任何任务。4.最后,通过在少量提示的例子中包含思维链序列,可以容易地在现成语言模型中引出思维链推理。

其他人在问
现在在生成思维导图方面做的最好的ai是哪个
以下是一些在生成思维导图方面表现出色的 AI 工具: 1. GitMind:免费的跨平台 AI 思维导图软件,支持多种模式,如提问、回答、自动生成等。 2. ProcessOn:国内思维导图与 AIGC 结合的工具,可利用 AI 生成思维导图。 3. AmyMind:轻量级在线 AI 思维导图工具,无需注册登录,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,能一键拓展思路,生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,输入需求即可由 AI 自动完成思维导图生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,有助于提升生产力。 此外,还有以下相关产品: 1. Mymap:打磨出色,图表种类多,能根据问题自动选择和询问合适的图表类型,速度快且信息准确。 2. AmyMind:特色是可将创建的思维导图变成 PPT 并下载编辑。
2024-11-14
推荐几个思维导图用的AI
以下是为您推荐的思维导图相关的 AI 工具: 1. GitMind:免费的跨平台 AI 思维导图软件,支持多种模式,如提问、回答、自动生成等。 2. ProcessOn:国内思维导图+AIGC 的工具,可利用 AI 生成思维导图。 3. AmyMind:轻量级在线 AI 思维导图工具,无需注册登录,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路,生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,输入需求即可由 AI 自动完成思维导图生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,有助于提升生产力。 此外,还有以下工具在绘制示意图方面表现出色: 1. Lucidchart:强大的在线图表制作工具,集成 AI 功能,可自动化绘制多种示意图,如流程图、思维导图、网络拓扑图等。具有拖放界面,易于使用,支持团队协作和实时编辑,有丰富的模板库和自动布局功能。官网:https://www.lucidchart.com/ 2. Microsoft Visio:专业的图表绘制工具,适用于复杂的流程图、组织结构图和网络图。其 AI 功能可帮助自动化布局和优化图表设计。集成 Office 365,方便与其他 Office 应用程序协同工作,有丰富的图表类型和模板,支持自动化和数据驱动的图表更新。官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware 3. Diagrams.net:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。支持本地和云存储(如 Google Drive、Dropbox),有多种图形和模板,易于创建和分享图表,可与多种第三方工具集成。官网:https://www.diagrams.net/ 另外,以下是一些其他相关的 AI 工具: 1. WhimsicalAI 思维导图工具:https://whimsical.com/aimind 基于人工智能的建议,即时生成新想法,快速获取信息,在头脑风暴时打破心理障碍,提升工作流程,比思维速度更快地构思。 2. Miro AI Miro 整合一系列 AI 功能:https://miro.com/ai/ 使用思维导图创意生成功能,自动生成广阔、多分支的思维导图;使用“总结便签”功能将大量便签压缩成一个;通过简单地编写文本来创建代码;使用图像生成从文本中创建图像。从想法中生成用户故事。 3. Kajabi 一系列 AI 营销工具:https://kajabi.com/aicreatorhu 使用免费的 AI 工具轻松构建您的业务,这些工具可以构建您的课程、创建课程和构建营销活动——因此您可以立即启动并销售。 4. PM Cardio 5 秒内解读心电图:https://www.powerfulmedical.c PMcardio 是一款由人工智能驱动的、获得 IIb 类医疗设备认证的产品,可以帮助您像专业心脏病学家一样准确诊断和治疗 38 种心血管疾病。
2024-11-10
AI的提示词思维是什么
AI 的提示词思维是指在与 AI 进行交互时,通过精心设计和组织的提示词来引导 AI 生成更准确、有用和符合期望的输出。以下是一些关于 AI 提示词思维的方面: 在 AI 绘画中,常用的风格提示词包括点彩派、克劳德莫奈、桁缝艺术、局部解剖、彩墨纸本、涂鸦、伏尼契手稿、书页、真实的、3D 风格、复杂的、真实感、国家地理、超写实主义、电影股的、建筑素描、对称肖像、清晰的面部特征、室内设计、武器设计、次表面散射、游戏场景图、角色概念艺术等。 在法律领域,AI 可以基于商标法等相关条款和案例法,根据特定的提示词指令,如为商标侵权案件、专利侵权案件、劳动合同纠纷案件、知识产权许可诉讼等制定诉讼策略,包括对权利的分析、侵权行为评估、证据搜集建议、抗辩点以及和解或调解策略等。 在办公场景中,以“英语口语提升教练”的提示词工程为例,当 AI 未能按期望用英语回复时,可运用补全和续写思维,如让 AI 误以为已在对话并以特定英语语句开头接着往下“补全”,从而成功使其用英语回复。这是因为不同的 AI 大模型上下文学习和逻辑分析能力不同,使用者和开发者要有“补全对话”的思维认知,在大模型无法正确工作时“强行扭正”其工作方向。
2024-10-27
人共智能导论思维导图
以下是为您整理的关于人工智能相关的内容: 1. 头脑风暴常用的 20 个 prompt:包括 Brainwriting Prompt、Reverse Brainstorming Prompt、Mind Mapping 等。 2. 构建外脑/智变时代的个人知识管理:从哲学角度思考知识被 AI 重塑后人的意义,认为超级智能将是人类的外脑,人类独特的个性等将与智能个体融合成为化身,共同汇聚成智能时代的新知识网络。 3. 生成式人工智能在教学中的应用:涉及多媒体、虚拟现实、移动设备等方面,涵盖全面发展个性化学习、协作学习、创新能力等内容,还包括数字校园、智慧课堂、在线社区等场景,以及培养元认知能力、创新思维等能力,以及人机协同、因材施教等理念。
2024-10-20
人工智能导论思维导图
以下是为您提供的人工智能导论思维导图相关内容: 与思维导图相关的 AI 工具有: 1. GitMind:免费的跨平台 AI 思维导图软件,支持多种模式,可通过 AI 自动生成思维导图。 2. ProcessOn:国内思维导图与 AIGC 结合的工具,能利用 AI 生成思维导图。 3. AmyMind:轻量级在线 AI 思维导图工具,无需注册登录,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路、生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,输入需求后由 AI 自动完成思维导图生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,有助于提升生产力。 总的来说,这些工具都能通过 AI 技术自动生成思维导图,提高制作效率,为知识工作者带来便利。但请注意,内容由 AI 大模型生成,请仔细甄别。
2024-10-18
生成关于“人工智能导论”的思维导图
以下是为您生成的关于“人工智能导论”的思维导图相关内容: 与思维导图相关的 AI 工具: 1. GitMind:免费跨平台,支持多种模式,可通过 AI 自动生成思维导图。 2. ProcessOn:国内思维导图+AIGC 工具,能利用 AI 生成思维导图。 3. AmyMind:轻量级在线,无需注册登录,支持自动生成节点。 4. Xmind Copilot:基于 GPT 的助手,可一键拓展思路、生成文章大纲。 5. TreeMind:“AI 人工智能”工具,输入需求可自动生成思维导图。 6. EdrawMind:提供 AI 工具,包括头脑风暴功能,提升生产力。 总的来说,这些工具都能通过 AI 技术提高思维导图制作效率,为知识工作者带来便利。
2024-10-18
如何将AI与机械技术结合做自媒体
以下是一些将 AI 与机械技术结合做自媒体的案例和方法: 创作方面: 社群的每日资讯:涵盖品牌推广、产品信息、行业动态、用户互动、品牌文化、品牌活动、行业知识、兴趣爱好等内容。 写科普内容:包括目标用户、科普内容、生活问题、医疗类型等,需注意通俗性和专业名词的运用。 剧本或脚本写作:重点在于讲述故事,引发观众情感共鸣,体验情感冲突和发展。 创意营销文本素材和生成创意营销素材:考虑目标受众、品牌定位、产品优势、服务独特性、情感因素等。 研究方面: 信息搜集:可利用 ChatGPT 做品牌项目的二手信息搜集。 拆解爆款内容:分四步进行,包括建立爆款库、让 ChatGPT 理解拆解角度、提出修改建议、要求特定风格修改。 分发方面:从品牌内容分发角度考虑,为智能家居设备设计产品介绍视频脚本,包含音效、音乐、画面、声音等。 沟通方面:小团队与甲方沟通时,可借助 GPT 优化语气,调整公司合同、协议等,还能用 GPT+MJ 给甲方做分镜并获得认可。 您可以参考以上内容,结合自身特点和需求,探索将 AI 与机械技术结合做自媒体的有效途径。
2024-11-15
2023年大模型发展有什么重要技术
2023 年大模型发展的重要技术包括以下方面: 模型发布:百川智能发布 Baichuan2—Turbo,字节云雀大模型等。 涉及领域:涵盖通用、医疗、汽车、教育、金融、工业、文化/零售/交通等多个行业。 关键进展:从 22 年 11 月 ChatGPT 的惊艳面世,到 23 年 3 月 GPT4 作为“与 AGI(通用人工智能)的第一次接触”,再到 23 年末多模态大模型的全面爆发。 多模态大模型的应用: 优点:适应性极好,方便适应各种奇葩需求;对算法要求降低,大部分功能由大模型提供,特别是非结构化信息处理;API 访问方式简化了边缘设备要求,方便在多种设备适配。 缺点:推理时长是最大障碍,传统目标检测或人脸识别优化后能达到 100 300ms,而大模型动则需要 10 秒的延时,限制了许多场景;模型的幻象和错误率较高,在多链路复杂应用中迅速变得不可行;在大多数生产模式下,仍需使用云服务数据中心,存在隐私问题;商业私有化部署是刚需,当下开源模型与 GPT4 有代差。
2024-11-14
Ai技术现在的发展状况
AI 技术的发展状况如下: 发展历程: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现机器学习算法如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前前沿技术点: 1. 大模型:如 GPT、PaLM 等。 2. 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:例如元学习、一次学习、提示学习等。 5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。 6. 机器人学:涵盖强化学习、运动规划、人机交互等。 7. 量子 AI:包含量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 学习路径: 偏向技术研究方向: 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 偏向应用方向: 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 需要注意的是,无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。
2024-11-09
AI技术发展状态
AI 技术的发展状态如下: 发展历程: 早期阶段(1950s 1960s):专家系统、博弈论、机器学习初步理论。 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理。 统计学习时期(1990s 2000s):机器学习算法(决策树、支持向量机、贝叶斯方法等)。 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等。 当前前沿技术点: 大模型(Large Language Models):GPT、PaLM 等。 多模态 AI:视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 自监督学习:自监督预训练、对比学习、掩码语言模型等。 小样本学习:元学习、一次学习、提示学习等。 可解释 AI:模型可解释性、因果推理、符号推理等。 机器人学:强化学习、运动规划、人机交互等。 量子 AI:量子机器学习、量子神经网络等。 AI 芯片和硬件加速。 对于新手学习 AI,建议: 持续学习和跟进:AI 是快速发展的领域,新成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 使用 AI 做事时需要注意: AI 是一种工具,并不总是正确的工具。要考虑其弱点,仔细思考是否适合计划应用的目的。 要了解许多道德问题。AI 可能被用于侵犯版权、作弊、窃取他人工作或操纵。特定 AI 模型的构建方式以及谁从其使用中受益,通常是复杂且不特别清楚的问题。最终,使用者有责任以道德的方式使用这些工具。
2024-11-09
非技术背景的产品经理如何快速掌握AI相关知识
对于非技术背景的产品经理,要快速掌握 AI 相关知识,可以从以下几个方面入手: 1. 理解产品核心技术:了解基本的机器学习算法原理,有助于更好地理解 AI 产品的核心技术,从而做出更合理的产品决策。 2. 与技术团队有效沟通:掌握一定的算法知识,能够与开发团队进行更有效的沟通,减少信息不对称带来的误解。 3. 评估技术可行性:在产品规划阶段,评估某些功能的技术可行性。了解算法知识可以帮助做出更准确的判断。 4. 把握产品发展方向:AI 技术发展迅速,了解算法前沿可以更好地把握产品的未来发展方向。 5. 提升产品竞争力:了解算法可以帮助发现产品的独特优势,提出创新的产品特性,从而提升产品的竞争力。 6. 增强数据分析能力:很多 AI 算法都涉及到数据处理和分析,掌握相关知识可以提升数据分析能力。 在实际应用中,比如在商业化问答场景中,非技术从业者需要了解一些落地的配置,如问答机器人的配置包括 AI 模型、提示词、知识库等。 此外,在成为 AI 摊主方面,不同的人群有不同的优势。技术背景丰富的人具备扎实的技术基础,产品开发与管理经验丰富的人能推动产品落地与优化,AI 爱好者与学习者渴望提升技能,内容创作与营销能力强的人能将 AI 技术与商业化需求结合。
2024-11-06
非技术背景的产品经理如何快速上手AI
对于非技术背景的产品经理快速上手 AI ,可以参考以下建议: 1. 从基础小任务开始: 让 AI 按照最佳实践写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,学会必备的调试技能。 若使用 o1mini ,可在提示词最后添加“请生成 create.sh 脚本,运行脚本就能直接创建插件所需要的所有文件。请教我如何运行脚本。”(Windows 机器则是 create.cmd),它会为您生成代码并给出提示,方便一次性生成多个目录和文件。 2. 明确项目需求: 通过和 AI 的对话,逐步明确项目需求。 让 AI 帮助梳理出产品需求文档,包含影响技术方案选择的细节,后续开发时每次新起聊天就把文档发给 AI 并告知在做第几点功能。 此外,在将 AI 大模型能力接入微信等应用场景时,非技术从业者需要注意解决模型存在幻觉、胡乱回答的问题。在配置问答机器人时,要关注左侧的 AI 模型、提示词、知识库这三处配置。 对于 AI 产品经理,个人划分仅供娱乐和参考: 1. 入门级:能通过 WaytoAGI 等开源网站或一些课程了解 AI 概念,使用 AI 产品并尝试动手实践应用搭建。 2. 研究级:有技术研究和商业化研究两个路径,能根据需求场景选择解决方案,或利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用级:有成功落地应用的案例并产生商业化价值。 总之,AI 产品经理要懂得技术框架,不一定要了解技术细节,而是对技术边界有认知,最好能知道一些优化手段和新技术的发展。产品经理要关注的还是场景、痛点、价值。
2024-11-06