Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

什么是深度神经网络

Answer

深度神经网络是机器学习文献中的一类模型,受到生物神经网络的启发。一般来说,深度神经网络可分为以下几类:

  1. 前馈神经网络:这是实际应用中最常见的类型。第一层是输入,最后一层是输出。若有多个隐藏层,则称为“深度”神经网络。各层神经元的活动是前一层活动的非线性函数。
  2. 循环网络:在其连接图中有定向循环,可能具有复杂动态,训练较难,但更具生物真实性。

深度神经网络具有以下特点和应用:

  1. 可以计算一系列改变样本相似性的变换,几乎能应用于任何从输入到输出空间复杂映射的机器学习问题。
  2. 能够用于模拟大脑工作方式、了解并行计算风格以及解决实际问题。

在其发展过程中,如感知机的出现推动了机器学习的问世,展示了其对简单形状分类的学习能力。神经网络本质上是多层感知机,早期只有输出层,而典型应用如分辨手写数字。

同时,在深度神经网络的研究中,还涉及到如深度玻尔兹曼机、受限玻尔兹曼机、深度信念网络等相关内容。但使用反向传播等方法存在需要有标签的训练数据、学习时间不理想、可能陷入局部最小等问题。

Content generated by AI large model, please carefully verify (powered by aily)

References

入门 | 机器学习研究者必知的八个神经网络架构

神经网络是机器学习文献中的一类模型。例如,如果你参加了Coursera的机器学习课程,很可能会学到神经网络。神经网络是一套特定的算法,它彻底改变了机器学习领域。他们受到生物神经网络的启发,目前深度神经网络已经被证实效果很好。神经网络本身是一般的函数逼近,这就是为什么它们几乎可以应用于任何从输入到输出空间复杂映射的机器学习问题。以下是说服你学习神经计算的三个理由:了解大脑是如何工作的:它非常大且很复杂,一旦破坏就会脑死亡,所以我们需要使用计算机模拟。了解受神经元及其适应性连接启发的并行计算风格:这种风格与序列计算截然不同。使用受大脑启发的新颖学习算法来解决实际问题:即使不是大脑的实际工作方式,学习算法也非常有用。在完成吴恩达的Coursera机器学习课程后,我开始对神经网络和深度学习产生兴趣,因此寻找最好的网上资源来了解这个主题,并找到了Geoffrey Hinton的机器学习神经网络课程。如果你正在做深度学习的工程或想要踏入深度学习/机器学习的领域,你应该参加这个课程。Geoffrey Hinton毫无疑问是深度学习领域的教父,在课程中给出了非凡的见解。在这篇博客文章中,我想分享我认为任何机器学习研究人员都应该熟悉的八个神经网络架构,以促进他们的工作。一般来说,这些架构可分为三类:1.前馈神经网络这是实际应用中最常见的神经网络类型。第一层是输入,最后一层是输出。如果有多个隐藏层,我们称之为「深度」神经网络。他们计算出一系列改变样本相似性的变换。各层神经元的活动是前一层活动的非线性函数。2.循环网络循环网络在他们的连接图中定向了循环,这意味着你可以按照箭头回到你开始的地方。他们可以有复杂的动态,使其很难训练。他们更具有生物真实性。

入门 | 机器学习研究者必知的八个神经网络架构

在普通玻尔兹曼机中,单元的随机更新需要连续。有一个特殊的体系结构允许更有效的交替并行更新(层内没有连接,没有跳层连接)。这个小批量程序使玻尔兹曼机的更新更加并行。这就是所说的深度玻尔兹曼机(DBM),一个缺失很多连接的普通玻尔兹曼机。2014年,Salakhutdinov和Hinton为他们的模型提出了一个升级版,称之为受限玻尔兹曼机(RBM)。他们通过限制连通性使推理和学习变得更容易(隐藏单元只有一层,隐藏单元之间没有连接)。在RBM中,当可见单元被钳位时只需要一步就能达到热平衡。另一个有效的小批量RBM学习程序是这样的:对于正相位,首先将可见单元的数据矢量钳位。然后计算所有可见和隐藏单元对的<ViHj>的确切值。对于每个连接的单元对,对小批量中的所有数据<ViHj>求平均。对于负相位,也保留一组「幻想粒子」(就是一对(Vi,Hj)形成的系统?)。然后交替并行更新几次每个幻想粒子中的所有单元。对于每一个连接的单位对,所有幻想粒子ViHj求平均。7.深度信念网络反向传播被认为是人工神经网络中的标准方法,用于在处理一批数据之后计算每个神经元的误差贡献。但是,使用反向传播存在一些重要的问题。首先,它需要有标签的训练数据;而几乎所有的数据都没有标签。其次,学习时间不够理想,这意味着隐藏层数多的网络很慢。第三,它可能会陷入局部最小的局面,所以对于深度网络来说,它们还差得很远。

深度|神经网络和深度学习简史(第一部分):从感知机到BP算法

这个过程很简单,产生了一个简单的结果:一个输入线性函数(加权和),正如线性回归被非线性激活函数「压扁」了一样(对带权重求和设定阈值的行为)。当函数的输出值是一个有限集时(例如逻辑函数,它只有两个输出值True/1和False/0),给带权重的和设置阈值是没问题的,所以问题实际上不在于要对任何输入数据集生成一个数值上连续的输出(即回归类问题),而在于对输入数据做好合适的标签(分类问题)。康奈尔航天实验室的Mark I感知机,第一台感知机的硬件罗森布拉特用定制硬件的方法实现了感知机的想法(在花哨的编程语言被广泛使用之前),展示出它可以用来学习对20×20像素输入中的简单形状进行正确分类。自此,机器学习问世了——建造了一台可以从已知的输入输出对中得出近似函数的计算机。在这个例子中,它只学习了一个小玩具般的函数,但是从中不难想象出有用的应用,例如将人类乱糟糟的手写字转换为机器可读的文本。很重要的是,这种方法还可以用在多个输出值的函数中,或具有多个类别的分类任务。这对一台感知机来说是不可能完成的,因为它只有一个输出,但是,多输出函数能用位于同一层的多个感知机来学习,每个感知机接收到同一个输入,但分别负责函数的不同输出。实际上,神经网络(准确的说应该是「人工神经网络(ANN,Artificial Neural Networks)」)就是多层感知机(今天感知机通常被称为神经元)而已,只不过在这个阶段,只有一层——输出层。所以,神经网络的典型应用例子就是分辨手写数字。输入是图像的像素,有10个输出神经元,每一个分别对应着10个可能的数字。在这个案例中,10个神经元中,只有1个输出1,权值最高的和被看做是正确的输出,而其他的则输出0。

Others are asking
如何学习对抗神经网络
以下是关于学习对抗神经网络的相关内容: 图像生成方面:Google 有一个 AI 入门课程,介绍扩散模型,课程地址为 https://www.cloudskillsboost.google/course_templates/541,相关视频学习可参考 https://youtu.be/J0AuVBxzui0 。扩散模型是 Google Cloud 上许多先进图像生成模型和工具的基础,课程会介绍其背后理论及在 Vertex AI 上的训练和部署。图像生成领域有多种方法,如变分自动编码器将图像编码为压缩形式再解码回原始大小;生成对抗模型(GAN)让两个神经网络相互对抗,一个生成图像,一个鉴别真伪;自回归模型将图像视为一系列像素来生成。 主要人工智能技术概览:生成对抗网络是一种深度学习模型,由生成器和判别器构成。生成器生成虚拟数据,判别器判断数据真假,二者不断训练竞争以提高生成器生成真实数据的能力,广泛应用于图像、声音、文本等领域。 进化史:生成对抗网络(GAN)是深度学习领域的重要里程碑,诞生于 2014 年,可帮助神经网络用更少数据学习,生成更多合成图像,用于识别和创建更好的神经网络。GAN 由两个神经网络玩猫捉老鼠的游戏,一个创造假图像,一个判断真假。它有助于创建图像和现实世界的软件模拟。
2025-01-26
神经网络相关书籍推荐
以下是为您推荐的神经网络相关书籍: 1. 《这就是 ChatGPT》:作者被称为“在世的最聪明的人”,研究神经网络几十年,创作了 Mathematica、Wolfram 等备受推崇的软件。该书的导读序是美团技术学院院长刘江老师回顾了整个 AI 技术发展的历史,对于了解 AI、大语言模型计算路线的发展,起到提纲挈领的作用。 2. 关于神经网络信念网络方面的研究文献: Gail A.Carpenter and Stephen Grossberg.1988.The ART of Adaptive Pattern Recognition by a SelfOrganizing Neural Network.Computer 21,3,7788. H.Bourlard and Y.Kamp.1988.Autoassociation by multilayer perceptrons and singular value decomposition.Biol.Cybern.59,45,291294. P.Baldi and K.Hornik.1989.Neural networks and principal component analysis:learning from examples without local minima.Neural Netw.2,1,5358. Hinton,G.E.&Zemel,R.S.,Autoencoders,Minimum Description Length and Helmholtz Free Energy.,in Jack D.Cowan;Gerald Tesauro&Joshua Alspector,ed.,‘NIPS’,Morgan Kaufmann,,pp.310. Ackley,D.H.,Hinton,G.E.,&Sejnowski,T.J.,147169. LeCun,Y.,Chopra,S.,Hadsell,R.,Ranzato,M.,&Huang,F..A tutorial on energybased learning.Predicting structured data,1,0. Neal,R.M.,71113. Hinton,G.E.,Dayan,P.,Frey,B.J.,&Neal,R.M.,11581161. 此外,您还可以参考“三本神经科学书籍”,原文地址:https://web.okjike.com/originalPost/64f2b8ff0c915376a20c5d61 作者:
2025-01-14
卷积神经网络模型原理
卷积神经网络(CNN)通常由卷积层、池化层和全连接层叠加构成。在卷积过程中,卷积层中的卷积核依次与输入图像的像素做卷积运算来自动提取图像中的特征。卷积核尺寸一般小于图像,并以一定的步长在图像上移动得到特征图。步长设置越大,特征图尺寸越小,但过大步长会损失部分图像特征。此外,池化层作用于产生的特征图上,能保证 CNN 模型在不同形式的图像中识别出相同物体,同时减少模型对图像的内存需求,其最大特点是为 CNN 模型引入了空间不变性。
2024-12-19
神经网络
神经网络是机器学习文献中的一类模型,受到生物神经网络的启发,是一种特定的算法,能应用于从输入到输出空间复杂映射的各类机器学习问题。 神经网络的发展历程如下: 早期,康奈尔航天实验室的 Mark I 感知机是第一台感知机的硬件,罗森布拉特用定制硬件的方法实现了感知机的想法,展示出它可对简单形状进行正确分类,自此机器学习问世。 神经网络本质上是多层感知机,在早期只有一层输出层。例如分辨手写数字时,输入是图像像素,有 10 个输出神经元,分别对应 10 个可能的数字,权值最高的和被视为正确输出。 神经网络的架构主要分为三类: 前馈神经网络:这是实际应用中最常见的类型。第一层是输入,最后一层是输出。若有多个隐藏层,则称为“深度”神经网络。各层神经元的活动是前一层活动的非线性函数。 循环网络:在连接图中有定向循环,可按箭头回到起始点。其动态复杂,训练难度大,但更具生物真实性。 Geoffrey Hinton 对神经网络的发展做出了重要贡献。早在 80 年代初期,他和同事开展研究时,因电脑性能限制成果有限,且当时 AI 主流研究方向不同,处境艰难。但他们坚持下来,到 2004 年创立了 Neural Computation and Adaptive Perception 项目。随着时间推移和计算机能力发展,神经网络更加快速、灵活、高效和可扩展。 神经网络可用于解决分类和回归等问题,在多个输出值的函数或具有多个类别的分类任务中,多输出函数能用位于同一层的多个感知机来学习。
2024-11-01
AIGC的底层科学原理是神经网络吗?
AIGC 的底层科学原理包含神经网络。 神经网络是一种模仿生物神经网络的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。它由大量的人工神经元联结进行计算,是一种自适应系统,具备学习功能。 在 AI 领域,神经网络是一种重要的技术。深度学习就是一种参照人脑结构,包含神经网络和神经元的方法(因层数较多而称为深度)。神经网络可以用于监督学习、无监督学习、强化学习等多种学习方式。 同时,Transformer 模型的出现也对 AIGC 产生了重要影响,它完全基于自注意力机制处理序列数据,比循环神经网络更适合处理文本的长距离依赖性。
2024-10-30
神经网络和深度学习简史
神经网络和深度学习有着丰富的发展历史: 1. 1958 年感知机神经网络诞生。 2. 70 年代经历了人工智能寒冬。 3. 1986 年 BP 算法让神经网络再度流行。 4. 尽管取得了一些成功,但在人工智能寒冬期间,用于神经网络研究的资金很少,人工智能一词近乎成为伪科学的代名词。 5. 1997 年,Hochreiter 和 Schmidhuber 为递归神经网络开发了长短期记忆(LSTM),但在当时被忽视。 6. 随着计算机变得更快和图形处理单元(GPU)的引入,神经网络逐渐与支持向量机相竞争。 7. 训练大型、深层网络存在梯度消失问题,解决方法包括逐层预训练,如 Schmidhuber 于 1992 年为递归神经网络开发的预训练方法,以及 Hinton 和 Salakhutdinov 于 2006 年为前馈网络开发的预训练方法。1997 年提出的长短期记忆(LSTM)也是解决递归神经网络中梯度消失问题的方案之一。
2024-10-23
我需要你给我生成一些提示词,我会给你我想的想法。《》以内的是想法。《我想写一篇影视解说的文案,写作的视角以我,第一人称的视角来写。想要风格偏幽默风趣一点,就像跟朋友在讲述一样,可以模仿鲁迅先生的手法。而且还想把影片的剧情内容写出来,从开篇到电影的结尾,如果有需要保留原片的地方,请把原片的画面场景以及时间段描述出来。要求这篇文案要附上我自己的内心独白,以此引人深思!请你深度思考后,在做答复!要求字数不少于5000字。》请问我该如何写提示词?请你整理好提示词后发给我
以下是为您生成的一些提示词,希望对您有所帮助: 影视解说文案提示词 1. 以第一人称幽默风趣的口吻,像与朋友讲述般,描绘影片从开篇到结尾的精彩剧情,融入自己的内心独白,模仿鲁迅先生的手法,展现独特的视角和深刻的思考。 2. 用轻松幽默的语言,以我的视角详述影片情节,穿插搞笑的评论和内心想法,借鉴鲁迅先生的讽刺技巧,使解说引人入胜。 3. 以亲切自然的叙述方式,如同与好友聊天,讲述影片故事,从开头至结束,结合鲁迅先生的文风,加入个人的情感起伏和独特见解。 DALL·E 相关提示词 1. 绘画:提及颜料种类、画布纹理和笔触形状/纹理(列表)。 2. 数字:注明使用的软件、阴影技术和多媒体方法(列表)。 3. 基于详细提示使用 DALL·E 3 生成图像,让创意鲜活起来,为提示的每个元素做出大胆有趣的选择。 4. 遵循提示指南,提出四个全新的简单概念,而非完整提示,从上次给出的建议中获取灵感。 请注意,默认方面比率为正方形(1:1),默认风格为摄影,包括相机设置、摄影类型和设备。同时,避免违反服务条款的词汇或概念,不侵犯版权,不使用暗示性或露骨的图像,强调符合 G 级评级的元素。
2025-02-06
那深度学习是监督学习、无监督学习还是强化学习呢?又或者他们四个是并列的?
深度学习是一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习和强化学习。监督学习是使用有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归。无监督学习是学习没有标签的数据,算法自主发现规律,经典任务如聚类。强化学习是从反馈中学习,以最大化奖励或最小化损失,类似训小狗。所以深度学习与监督学习、无监督学习、强化学习不是并列关系,而是其应用的一种方式。
2025-01-21
机器学习的子领域包括: 监督学习,常用算法如线性回归、决策树、支持向量机(SVM)。 无监督学习,如聚类、降维等算法。 强化学习,那深度学习是哪一种啊
深度学习是机器学习的一个子领域。 在机器学习中,深度学习是一种利用深度神经网络来学习数据特征和模式的方法。 深度学习的特点包括: 1. 具有复杂的网络结构,如前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)等。 2. 能够自动从大量数据中提取高级特征。 深度学习在图像识别、语音识别、自然语言处理等领域取得了显著的成果。
2025-01-21
按你这个分类,机器学习和深度学习是并列的?
机器学习和深度学习不是并列的关系,而是包含关系。 机器学习是人工智能的一个子领域,其核心是让计算机通过对数据的学习来提高性能,不是直接编程告诉计算机如何完成任务,而是提供大量数据让机器找出隐藏模式或规律,进而预测新的、未知的数据。 深度学习是机器学习的一个子领域,它尝试模拟人脑的工作方式,创建人工神经网络来处理数据。这些神经网络包含多个处理层,深度学习模型能够学习和表示大量复杂的模式,在图像识别、语音识别和自然语言处理等任务中表现出色。 总之,深度学习是机器学习的一个分支,二者存在包含与被包含的关系。
2025-01-21
深度学习跟机器学习有啥区别呀?能不能举个通俗易懂的例子
深度学习和机器学习的区别主要体现在以下几个方面: 1. 学习方式:机器学习通常需要人工选择和设计特征,而深度学习能够自动从数据中学习特征。 2. 模型结构:机器学习模型相对简单,深度学习则使用多层的神经网络,结构更复杂。 3. 数据处理能力:深度学习能够处理更大量和更复杂的数据模式。 例如,在图像识别任务中,如果使用机器学习,可能需要人工提取图像的颜色、形状等特征,然后基于这些特征进行分类。但在深度学习中,神经网络可以自动从大量的图像数据中学习到有效的特征表示,从而实现更准确的分类。 机器学习是人工智能的一个子领域,让计算机通过数据学习来提高性能,不是直接编程告诉计算机如何完成任务,而是提供数据让机器找出隐藏模式或规律,然后用这些规律预测新的未知数据。 深度学习是机器学习的一个子领域,模拟人脑工作方式,创建人工神经网络处理数据,包含多个处理层,能学习和表示大量复杂模式,在图像识别、语音识别和自然语言处理等任务中非常有效。 大语言模型是深度学习在自然语言处理领域的应用之一,目标是理解和生成人类语言,需要在大量文本数据上训练,如 ChatGPT、文心一言。同时,大语言模型具有生成式 AI 的特点,不仅能理解和分析数据,还能创造新的独特输出。
2025-01-21
深度学习跟机器学习有啥区别呀
深度学习和机器学习的区别主要体现在以下几个方面: 1. 范畴:机器学习是人工智能的一个子领域,深度学习则是机器学习的一个子集。 2. 工作方式:机器学习通过输入数据训练模型,让计算机在没有明确编程的情况下学习。深度学习模拟人脑工作方式,创建人工神经网络处理数据。 3. 处理模式:机器学习模型可以是监督的或无监督的,监督模型使用标记的数据学习并预测未来值,无监督模型专注于发现原始数据中的模式。深度学习使用人工神经网络,能处理更复杂的模式,神经网络可使用标记和未标记的数据,实现半监督学习。 4. 应用效果:深度学习在图像识别、语音识别和自然语言处理等任务中表现出色,因为其能学习和表示大量复杂的模式。 例如,大语言模型是深度学习在自然语言处理领域的应用,其不仅能理解和分析数据,还能创造新的独特输出,如 ChatGPT、文心一言等。
2025-01-21