以下是关于自学 AI 的一些建议:
此外,DeepSeek R1 引入了纯强化学习(RL),不依赖大量人类标注数据,而是让 AI 通过自我探索和试错来学习。在“冷启动”阶段,仅通过少量(数千条)人工精选的思维链数据进行初步引导,建立起符合人类阅读习惯的推理表达范式。随后,主要依靠强化学习,在奖励系统的反馈下(只对结果准确率与回答格式进行奖励),自主探索推理策略,不断提升回答的准确性,实现自我进化。
以下是一些 AI 术语: |术语 ID|原文|译文|领域|易混淆|缩写|不需要提醒| |-|-|-|-|-|-|-| |ROW()-1|Self-Gated|自门控|AI||| |ROW()-1|Self-Organizing Map|自组织映射网|AI||| |ROW()-1|Self-Taught Learning|自学习|AI|1|| |ROW()-1|Self-Training|自训练|AI|1|| |ROW()-1|Semantic Gap|语义鸿沟|AI|1|| |ROW()-1|Semantic Hashing|语义哈希|AI|1|| |ROW()-1|Semantic Segmentation|语义分割|AI||| |ROW()-1|Semantic Similarity|语义相似度|AI||| |ROW()-1|Semi-Definite Programming|半正定规划|AI||| |ROW()-1|Semi-Naive Bayes Classifiers|半朴素贝叶斯分类器|AI||| |ROW()-1|Semi-Restricted Boltzmann Machine|半受限玻尔兹曼机|AI|||
|术语ID|原文|译文|领域|易混淆|缩写|不需要提醒||-|-|-|-|-|-|-||ROW()-1|Self-Gated|自门控|AI|||||ROW()-1|Self-Organizing Map|自组织映射网|AI|||||ROW()-1|Self-Taught Learning|自学习|AI|1||||ROW()-1|Self-Training|自训练|AI|1||||ROW()-1|Semantic Gap|语义鸿沟|AI|1||||ROW()-1|Semantic Hashing|语义哈希|AI|1||||ROW()-1|Semantic Segmentation|语义分割|AI|||||ROW()-1|Semantic Similarity|语义相似度|AI|||||ROW()-1|Semi-Definite Programming|半正定规划|AI|||||ROW()-1|Semi-Naive Bayes Classifiers|半朴素贝叶斯分类器|AI|||||ROW()-1|Semi-Restricted Boltzmann Machine|半受限玻尔兹曼机|AI||||
而DeepSeek R1则引入了纯强化学习(RL),不依赖大量的人类标注数据,而是让AI通过自我探索和试错来学习:DeepSeek R1在“冷启动”阶段,仅通过少量(数千条)人工精选的思维链数据进行初步引导,建立起符合人类阅读习惯的推理表达范式。随后,便主要依靠强化学习,在奖励系统的反馈下(只对结果准确率与回答格式进行奖励),自主探索推理策略,不断提升回答的准确性,实现自我进化。准确率奖励:用于评估AI提供的最终答案是否正确,以此为AI提供答案准确度的反馈。格式奖励:强制结构化输出,让模型把思考过程置于<think></think>标签之间,以便人类观察模型的推理过程。正如Alpha Zero只训练了三天,就以100比0的战绩完胜Alpha Go Lee(战胜李世石的版本)。Alpha Go(老):监督学习+强化学习。学习人类棋谱,也更接近人类职业棋手的风格,继承了人类的局限。Alpha Zero(新):完全摒弃人类数据的纯强化学习。从零开始自我博弈,不受限于人类经验,具有创造性的下棋风格。大模型AI在纯强化学习(RL)下同样也展现出了超出人类研究员想象的成长潜力:“我们只需要简单的为其提供正确的激励措施,它就会自主开发高级的问题解决策略,RL有可能解锁新的人工智能水平。”*只不过Alpha Zero的强化学习更加专精棋类。而DeepSeek R1在训练中,更注重学习推理的底层策略,培养通用推理能力,使其能够实现跨领域的知识迁移运用和推理解答。
了解AI基本概念:首先,建议阅读「[从这里启程](https://waytoagi.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=blkjooAlLFNtvKJ2)」部分,熟悉AI的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍AI的历史、当前的应用和未来的发展趋势。开始AI学习之旅:在「[入门:AI学习路径](https://waytoagi.feishu.cn/wiki/ZYtkwJQSJiLa5rkMF5scEN4Onhd?table=tblWqPFOvA24Jv6X&view=veweFm2l9w)」中,你将找到一系列为初学者设计的课程。这些课程将引导你了解生成式AI等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如Coursera、edX、Udacity)上的课程,你可以按照自己的节奏学习,并有机会获得证书。选择感兴趣的模块深入学习:AI领域广泛(比如图像、音乐、视频等),你可以根据自己的兴趣选择特定的模块进行深入学习。我建议你一定要掌握提示词的技巧,它上手容易且很有用。实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出你的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎你实践后的分享。体验AI产品:与现有的AI产品进行互动是学习AI的另一种有效方式。尝试使用如ChatGPT、Kimi Chat、智谱、文心一言等AI聊天机器人,了解它们的工作原理和交互方式。通过与这些AI产品的对话,你可以获得对AI在实际应用中表现的第一手体验,并激发你对AI潜力的认识。