Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

深度学习

Answer

深度学习是一个源于新方法和策略的领域,旨在克服梯度消失问题以生成深层非线性特征层次,从而能够训练具有数十层非线性层次特征的体系结构。2010 年早期的研究表明,结合 GPUs 和激活函数能提供更好的梯度流以训练深层结构,此后人们对深度学习的兴趣日益增长。

深度学习不仅与学习深度非线性层次特征有关,还与学习检测序列数据中非常长的非线性时间依赖性有关。长短时记忆循环神经网络允许网络收集过去几百个时间步的活动以做出准确预测,自 2013 年以来其使用量迅速增长,与卷积网络一起构成了深度学习的两大成功案例之一。

在分层特征学习中,提取多层非线性特征传递给分类器进行预测。由于无法从几层中学习复杂特性,需叠加深层次非线性特征,有研究表明人脑也有类似机制。虽然分层特征学习在深度学习之前就被使用,但此前的架构面临梯度消失问题,导致性能较差。

Geoffrey Hinton 一步步把“深度学习”从边缘课题变成了 Google 等网络巨头仰赖的核心技术。早在 1960 年代高中时期,Hinton 就对大脑工作原理的相关理论着迷,此后在求学期间继续探索神经网络。经过三十多年的努力,深度学习成为学术界热门课题,Hinton 和包括 Yann LeCun、Yoshua Bengio 在内的团队在互联网上大有名气,他们为 Google、Facebook 等工作,使用深度学习技术改进语音识别、图像标记等在线工具,众多网络巨头也对其着迷。在剑桥大学学习期间,Hinton 发现科学家们未真正理解大脑,神经如何学习和计算是他关心的问题。

Content generated by AI large model, please carefully verify (powered by aily)

References

深度学习(1)核心概念

“深度学习”一词源于新的方法和策略,这些方法和策略旨在通过克服梯度消失的问题来生成这些深层的非线性特征层次,以便我们可以训练具有数十层非线性层次特征的体系结构。在2010年早期,有研究表明,结合GPUs和[激活函数](https://developer.nvidia.com/zh-cn/blog/deep-learning-nutshell-core-concepts/#activation-function)提供更好的梯度流,足以在没有重大困难的情况下训练深层结构。从这里开始,人们对深入学习的兴趣与日俱增。深度学习不仅与学习深度非线性层次特征有关,还与学习检测序列数据中非常长的非线性时间依赖性有关。虽然大多数其他处理顺序数据的算法只有最后10个时间步的内存,[长短时记忆](https://developer.nvidia.com/blog/parallelforall/deep-learning-nutshell-sequence-learning#LSTM)[循环神经网络](https://developer.nvidia.com/blog/parallelforall/deep-learning-nutshell-sequence-learning#recurrent-neural-networks)(由Sepp Hochreiter和Jürgen-Schmidhuber在1997年发明)允许网络收集过去几百个时间步的活动,从而做出准确的预测。虽然LSTM网络在过去10年中大多被忽视,但自2013年以来,LSTM网络的使用量迅速增长,与卷积网络一起构成了深度学习的两大成功案例之一。

深度学习(1)核心概念

在分层[特征学习](https://developer.nvidia.com/zh-cn/blog/deep-learning-nutshell-core-concepts/#feature-learning)中,我们提取多层非线性特征并将其传递给一个分类器,该分类器将所有特征组合起来进行预测。我们感兴趣的是将这些非常深层次的非线性特征叠加起来,因为我们无法从几层中学习复杂的特性。从数学上可以看出,对于图像来说,单个图层的最佳特征是边缘和斑点,因为它们包含了我们可以从单个非线性变换中提取的大部分信息。为了生成包含更多信息的特征,我们不能直接对输入进行操作,但是我们需要再次转换我们的第一个特征(边缘和斑点),以获得包含更多信息的更复杂的特征,以区分类。有研究表明,人脑做的是完全相同的事情:在视觉皮层接收信息的第一层神经元对特定的边缘和斑点很敏感,而视觉管道下游的大脑区域则对更复杂的结构(如脸部)敏感。虽然分层特征学习在领域深度学习存在之前就被使用了,但是这些架构面临着诸如消失[梯度](https://developer.nvidia.com/blog/parallelforall/deep-learning-nutshell-history-training#stochastic-%E6%A2%AF%E5%BA%A6-descent)问题,其中梯度变得太小,无法为非常深的层提供学习信号,因此,与浅层学习算法(如支持向量机)相比,这些体系结构的性能较差。

Geoffrey Hinton 是这个人,一步步把“深度学习”从边缘课题变成Google等网络巨头仰赖的核心技术

王晨推荐早在1960年代,Geoffrey Hinton的高中时期,就有一个朋友告诉他,人脑的工作原理就像全息图一样。创建一个3D全息图,需要大量的记录入射光被物体多次反射的结果,然后将这些信息存储进一个庞大的数据库中。大脑储存信息的方式居然与全息图如此类似,大脑并非将记忆储存在一个特定的地方,而是在整个神经网络里传播。Hinton为此深深的着迷。对Hinton来说,这是他人生的关键,也是他成功的起点。“我非常兴奋,”他回忆到,“那是我第一次真正认识到大脑是如何工作的”。在高中时代谈话的鼓舞之下,Hinton在他的求学期间,在剑桥大学以及爱丁堡大学继续他的神经网络的探索。在80年代早期,他就参与了一个雄心勃勃的关于使用计算机的软硬件来模拟大脑的研究,这形成了早期的AI的一个分支,也就是我们现在所说的“深度学习”。三十多年的努力,深度学习已成为学术界炙手可热的课题。现如今,Hinton和他的深度学习小团队,包括纽约大学的Yann LeCun教授,蒙特利尔大学的Yoshua Bengio教授,在互联网上已然大有名气。作为多伦多大学的教授和研究员,Hinton也同时为Google工作,使用深度学习技术来改进语音识别,图像标记和其他在线工具。LeCun也在Facebook从事类似的工作。AI风靡全球,微软,IBM,百度和许多网络巨头都为之着迷。在剑桥大学的心理学专业的本科学习当中,Hinton发现,科学家们并没有真正理解大脑。人类大脑有数十亿个神经细胞,它们之间通过神经突触相互影响,形成极其复杂的相互联系。然而科学家们并不能解释这些具体的影响和联系。神经到底是如何进行学习以及计算的,对于Hinton,这些正是他所关心的问题。

Others are asking
深度介绍一下机器人行业全球top5的企业
很抱歉,目前知识库中没有关于机器人行业全球 top5 企业的相关内容。但据常见的行业报道和分析,以下是一些在机器人领域具有重要影响力的企业: 1. 发那科(Fanuc):在工业机器人领域拥有广泛的产品线和先进的技术。 2. 安川电机(Yaskawa Electric):以高性能的工业机器人和运动控制系统闻名。 3. 库卡(KUKA):提供多种工业机器人解决方案。 4. ABB:在工业自动化和机器人领域具有深厚的技术积累。 5. 史陶比尔(Stäubli):在工业机器人和纺织机械等领域表现出色。 需要注意的是,机器人行业的排名可能会随着时间和市场变化而有所不同。
2025-01-07
深度学习是什么意思?
深度学习是一种源于新方法和策略的技术,旨在通过克服梯度消失问题来生成深层的非线性特征层次,从而能够训练具有数十层非线性层次特征的体系结构。 深度学习不仅与学习深度非线性层次特征有关,还与学习检测序列数据中非常长的非线性时间依赖性有关。例如,长短时记忆循环神经网络允许网络收集过去几百个时间步的活动,从而做出准确的预测。 深度学习是一种参照人脑神经网络和神经元的方法,由于具有很多层所以称为“深度”。神经网络可以用于监督学习、无监督学习、强化学习等。 自 2010 年早期,结合 GPUs 和激活函数提供更好的梯度流,足以在没有重大困难的情况下训练深层结构,人们对深度学习的兴趣与日俱增。自 2013 年以来,长短时记忆网络的使用量迅速增长,与卷积网络一起构成了深度学习的两大成功案例之一。
2024-12-24
机械学习和深度学习的关系
机械学习和深度学习的关系如下: 机器学习是指机器自动从资料中找一个公式,而深度学习是一种机器学习技能。深度学习基于类神经网络,具有非常大量参数的函数。在 AI 的范畴中,机器学习和深度学习都属于实现让机器展现智慧这一目标的方法和技术。
2024-12-19
chatGPT是基于什么深度学习的方法?
ChatGPT 是美国 OpenAI 公司开发的一款基于大型语言模型(Large Language Model,简称 LLM)的对话机器人。它基于深度学习的方法,其中深度学习是机器学习的一个子领域,简单理解就是采用像深度神经网络这样有深度的层次结构进行机器学习,其主要特点是具有更多的神经元,层次更多、连接方式更复杂,需要更庞大的计算能力加以支持,能够自动提取特征。
2024-12-08
chatGPT是基于什么深度学习的方法?
ChatGPT 是美国 OpenAI 公司开发的一款基于大型语言模型(Large Language Model,简称 LLM)的对话机器人。它基于深度学习的方法,其中深度学习是机器学习的一个子领域,简单理解就是采用像深度神经网络这样有深度的层次结构进行机器学习。其主要特点是具有更多的神经元,层次更多、连接方式更复杂,需要更庞大的计算能力加以支持,能够自动提取特征。
2024-12-08
AI是怎样进行深度学习的
AI 的深度学习是一种参照人脑神经网络和神经元的方法。神经网络具有很多层,所以称为“深度”。 深度学习中的神经网络可以用于多种学习方式,包括监督学习、无监督学习和强化学习。 监督学习使用有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归任务。 无监督学习所使用的数据没有标签,算法自主发现规律,经典任务如聚类,例如让模型将一堆新闻文章根据主题或内容特征分成相似的组。 强化学习是从反馈中学习,以最大化奖励或最小化损失,类似于训练小狗。 2017 年 6 月,谷歌团队发表的论文《Attention is All You Need》首次提出了 Transformer 模型,它完全基于自注意力机制来处理序列数据,无需依赖循环神经网络或卷积神经网络。Transformer 比循环神经网络更适合处理文本的长距离依赖性。
2024-12-04
怎么学习AI
以下是关于新手学习 AI 的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 对于中学生学习 AI 的建议: 从编程语言入手学习,如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等,探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 学习 AI 基础知识,包括基本概念、发展历程、主要技术如机器学习、深度学习等,以及在教育、医疗、金融等领域的应用案例。 参与 AI 相关的实践项目,参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 关注 AI 发展的前沿动态,关注权威媒体和学者,思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-18
如何投喂素材学习
以下是关于投喂素材学习的方法: 1. 推特博主的英语老师制作了一个 GPT 工作流,基于个人日常需求生成定制素材。 2. 具体使用方法: 先把特定的 prompt 喂给 ChatGPT(建议开一个新的对话专门用来学习英文)。 ChatGPT 会扮演您的美国好朋友,当您输入英文和中文表达,它会返回更地道的表达,并对俚语部分加粗,以助学习和记忆(如将“将 App 提交到应用商店,我用了 send out,ChatGPT 改成了 push”)。 针对您发送的话题,ChatGPT 会举一反三,结合欧美流行内容给出更多例子,帮助您更好理解和记忆(如 ChatGPT 提供了一个美剧更新的例子,教会新表达 buzz)。 当您输入“Hey GPT,run the end of day task.”,ChatGPT 会输出当天的对话回顾,进行复习,并建议 3 个推荐的任务,强化记忆。 3. 建议使用方式: 开一个窗口,复制 prompt。 手机端打开这条历史记录。 点右上角的🎧耳机图标,开始打电话。 打电话既能练口语又能练听力。 结束之后看回顾,有助于阅读。 群友也写了一个类似的版本,并在讯飞上做了尝试,效果不错。
2025-01-18
学习AI的步骤
以下是学习 AI 的步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,因其上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 此外,雪梅 May 的学习经验表明: 学习路径可以是迈出第一步→大量的学习输入→疯狂的模仿→开始自己创造→学的越来越宽越来越杂→积累的量变产生质变→开始分享。 特别是学习 Coze 的路径:输入→模仿→自发创造。 虽然费曼学习法告诉我们,学习最好的方式是教会别人,但一开始学习 AI 时,自学和输入为主也是可行的。如果能量和勇气足够,可以更早地开始输出倒逼输入。一切弯路都值得走,不需要给自己太大压力,只要迈开脚步,就是进步。
2025-01-18
我是小白,想要学习AI,从哪开始
对于小白想要学习 AI,您可以从以下几个方面开始: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅:在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。同时,掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品:与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,您还可以参考《雪梅 May 的 AI 学习日记》,比如学习模式可以是输入→模仿→自发创造。在学习过程中,您可以去 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新的内容。而且,学习资源大多是免费开源的。需要注意的是,学习状态很重要,能学多少算多少,不必有心理压力。
2025-01-17
如何学习AI
以下是新手学习 AI 的方法: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2025-01-17
学习AI编程
以下是关于学习 AI 编程的一些建议和相关内容: 1. 借助 AI 学习编程的关键: 打通学习与反馈循环,从 Hello World 起点开始,验证环境、建立信心、理解基本概念,形成“理解→实践→问题解决→加深理解”的学习循环。 使用流行语言和框架,如 React、Next.js、TailwindCSS。 先运行再优化,小步迭代,一次解决一个小功能。 借助 AI 生成代码后请求注释或解释,帮助理解代码。 遇到问题三步走:复现、精确描述、回滚。要记住,AI 是强大的工具,但仍需人工主导,掌握每次可运行的小成果才能实现持续提升。原文: 2. 齐码蓝的观点: 作者构建了一个 AI 编程 Master GPTs,您可以让它根据不同的对话 hash id 进行 git 命令式操作,如 branch、tag、fork 等。例如,根据对话 ID 创建分支、打 tag 等。用 GPT4 构建了个 GPTs:AI 编程 Master(文末有链接)。 3. 和 Cursor AI 一起学 Python 编程: 课程内容包括 Python 是什么、Cursor 使用、notebook 远程编程。 熟悉 Cursor 界面,包括安装和设置,指导下载安装 Cursor 编辑器,了解界面布局和基本功能。 编写第一个程序,使用 Cursor 编写一个打印“你好,世界!”的简单程序,体验 AI 辅助功能,如代码自动补全和错误提示。 使用进行远程编程,包括注册和登录,帮助注册 Bohrium 账户并登录在线编程平台,在线编写和运行代码,在 Bohrium 上编写同样的“你好,世界!”程序,演示如何在云端运行代码并查看输出。 教学目标是了解 Python 对于人文学科的意义,掌握 Cursor 和 Jupyter Notebook 编程环境的基本使用,能够在本地和云端运行简单的 Python 代码,体验 AI 技术如何辅助编程和学习。
2025-01-17