Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

贝叶斯网络

Answer

贝叶斯网络:

  • 在 1985 年“ A Learning Algorithm for Boltzmann Machines”中,玻尔兹曼机器类似于神经网络,其单元在给定相连单元值和权重的情况下能计算自身概率,取值为 1 或 0,是随机的,遵循概率分布而非决定性方式。玻尔兹曼机器部分与概率分布有关,其分布决定了数学和推理方法,是一种基于能量的模型实例,适用于基于能量的学习理论框架。一个简单的信念,或者说贝叶斯网络,玻尔兹曼机器基本上就是如此,但有着非直接/对称联系和可训练式权重,能够学习特定模式下的概率。
  • 在深度学习领域的讨论中,有人是贝叶斯主义者,喜欢贝叶斯非参数方法。当时神经网络因无法证明相关数学定理而被边缘化,但有人从一开始就被神经网络吸引。
Content generated by AI large model, please carefully verify (powered by aily)

References

深度 | 神经网络和深度学习简史(第二部分):BP算法之后的又一突破——信念网络

[title]深度|神经网络和深度学习简史(第二部分):BP算法之后的又一突破——信念网络[heading1]神经网络迎来信念网络事实上,在成为1986年讨论反向传播学习算法这篇有重大影响力论文的合作者之前,Hinton在研究一种神经网络方法,可以学习1985年「 A Learning Algorithm for Boltzmann Machines」中的概率分布。玻尔兹曼机器就是类似神经网络的网络,并有着和感知器(Perceptrons)非常相似的单元,但该机器并不是根据输入和权重来计算输出,在给定相连单元值和权重的情况下,网络中的每个单元都能计算出自身概率,取得值为1或0。因此,这些单元都是随机的——它们依循的是概率分布而非一种已知的决定性方式。玻尔兹曼部分和概率分布有关,它需要考虑系统中粒子的状态,这些状态本身基于粒子的能量和系统本身的热力学温度。这一分布不仅决定了玻尔兹曼机器的数学方法,也决定了其推理方法——网络中的单元本身拥有能量和状况,学习是由最小化系统能量和热力学直接刺激完成的。虽然不太直观,但这种基于能量的推理演绎实际上恰是一种基于能量的模型实例,并能够适用于基于能量的学习理论框架,而很多学习算法都能用这样的框架进行表述。一个简单的信念,或者说贝叶斯网络——玻尔兹曼机器基本上就是如此,但有着非直接/对称联系和可训练式权重,能够学习特定模式下的概率。

访谈:Ilya | 2023年11月长篇访谈

[title]访谈:Ilya | 2023年11月长篇访谈[heading2]Ilya自己在深度学习领域的研究经历主持人:我们从最初的深度学习开始讨论。在AlexNet出现之前,深度学习中没有任何东西真正有效。然后考虑到当时的环境,你们下了一个非常独特的赌注。是什么促使你朝这个方向发展?Ilya:在那个黑暗时代,人工智能并不是一个人们抱有希望的领域,人们根本不习惯任何形式的成功。由于没有取得任何成功,因此引发了很多争论,不同的思想流派对机器学习和人工智能应该如何发展有不同的争论。有人热衷于老式人工智能的知识表示。有些人是贝叶斯主义者,他们喜欢贝叶斯非参数方法。有人喜欢图形模型,有人喜欢神经网络。这些人被边缘化,因为神经网络不具备无法证明关于他们的数学定理的特性。如果你不能证明某件事的定理,那就意味着你的研究不好。但是,我从一开始就被神经网络所吸引,因为我觉得这些都是小大脑,谁在乎你是否能证明关于它们的任何定理,因为我们正在训练小大脑,也许它们会变成,也许它们有一天会做某事。我们之所以能够做到AlexNet,是两三个因素的结合。第一个因素是,这是在GPU开始用于机器学习之后不久。人们有一种直觉,认为这是一件好事,但当时人们并不像今天那样确切地知道GPU的用途。他们想,让我们玩一下那些又酷又快的计算机,看看我们能用它们做什么。它特别适合神经网络。所以这绝对对他们有帮助。我非常幸运,因为意识到神经网络的原因是因为它们太小了。就像如果你尝试用神经网络解决视觉任务一样,它有大约一千个神经元,它能做什么?它什么也做不了。你的学习有多好以及其他一切并不重要。但如果你有一个更大的神经网络,它将做出前所未有的事情。主持人:是什么让你有这样的直觉?

教程 | 可视化CapsNet,详解Hinton等人提出的胶囊概念与原理

[title]教程|可视化CapsNet,详解Hinton等人提出的胶囊概念与原理选自freecodecamp作者:Nick Bourdakos机器之心编译参与:Pedro、思源尽管卷积神经网络已经做出了令人惊艳的成绩,但还是存在着一些根本性问题。是时候开始思考新的解决方案和改进了。现在就让我们一起来了解一下胶囊网络(capsules networks)。在之前的文章中我曾简要地讨论过胶囊网络(https://hackernoon.com/capsule-networks-are-shaking-up-ai-heres-how-to-use-them-c233a0971952)是如何解决一些传统问题的。在过去的几个月里,我一直沉浸在各种各样的胶囊网络里。我觉得现在是时候一起更加深入地探索胶囊网络的实际运作方式了。为了让后面的讨论更加容易,我开发了一款与胶囊网络实现配套的可视化工具,它能够让您看到网络的每一层是如何工作的。这些内容都可以在GitHub上找到(https://github.com/bourdakos1/CapsNet-Visualization)。如下所示是CapsNet的结构。如果您现在还不理解每个部分的具体含义,不必担心。我会尽我所能一层一层地进行详细讨论。part 0:网络输入胶囊网络(CapsNet)的输入是提供给神经网络的真实图片。在这个例子中输入的图片长宽都为28个像素。一张图片实际上有3个维度用来存储不同颜色通道的信息。因为是灰度图,而用作示例的图片仅仅有一个颜色通道。大家所熟悉的大多数图片都有3或4个通道用来存储红-绿-蓝和可能用于存储灰度或透明度的额外通道。

Others are asking
卷积神经网络
卷积神经网络,也称卷积网络(术语“神经”具有误导性),使用卷积层来过滤输入以获取有用信息。卷积层具有学习的参数,能自动调整滤波器以提取对应任务的最有用信息,例如在一般目标识别中过滤对象形状信息,在鸟类识别中提取颜色信息。通常多个卷积层用于在每一层之后过滤图像以获得越来越多的抽象信息。 卷积网络通常也使用池层,以获得有限的平移和旋转不变性,还能减少内存消耗,从而允许使用更多的卷积层。 最近的卷积网络使用初始模块,它使用 1×1 卷积核来进一步减少内存消耗,同时加快计算速度。 1998 年,Yann LeCun 和他的合作者开发了 LeNet 的手写数字识别器,后来正式命名为卷积神经网络。它在前馈网中使用反向传播,被用于读取北美地区约 10%的支票。卷积神经网络可用于从手写数字到 3D 物体的与物体识别有关的所有工作。 在 ImageNet 2012 年的 ILSVRC 竞赛中,来自多个机构的先进计算机视觉小组将已有的最好计算机视觉方法应用于包含约 120 万张高分辨率训练图像的数据集。
2025-03-02
使用AI写网络小说,并且通过网络小说平台发布赚钱的可行性及步骤
使用 AI 写网络小说并通过网络小说平台发布赚钱是具有一定可行性的,以下是相关步骤: 一、准备阶段 1. 确定目标读者群体,了解他们的喜好和需求,以便创作出更符合市场的作品。 2. 选择适合的 AI 写作工具,例如 ChatGPT 等。 二、写作阶段 1. 利用 AI 工具生成小说的初步框架和情节,包括角色设定、故事发展等。 2. 对 AI 生成的内容进行修改和完善,使其更具逻辑性、吸引力和独特性。 三、发布阶段 1. 选择合适的网络小说平台,了解其发布规则和要求。 2. 按照平台规定注册账号,并提交小说作品。 四、运营推广阶段 1. 积极与读者互动,回复评论和留言,根据读者反馈改进作品。 2. 利用社交媒体等渠道宣传自己的小说,提高知名度和影响力。 需要注意的是,虽然 AI 可以提供帮助,但最终的作品质量仍取决于作者的修改和完善。同时,不同的网络小说平台可能有不同的审核标准和版权政策,需要仔细了解和遵守。
2025-02-27
SVM与神经网络的区别是啥
SVM(支持向量机)和神经网络在以下方面存在区别: 1. 原理和模型结构: SVM 基于寻找能够最大化分类间隔的超平面来进行分类或回归任务。 神经网络则是通过构建多层神经元组成的网络结构,通过神经元之间的连接权重和激活函数来学习数据的特征和模式。 2. 数据处理能力: SVM 在处理小样本、高维度数据时表现较好。 神经网络通常更适合处理大规模数据。 3. 模型复杂度: SVM 相对较简单,参数较少。 神经网络结构复杂,参数众多。 4. 对特征工程的依赖: SVM 对特征工程的依赖程度较高。 神经网络能够自动从数据中学习特征。 5. 应用场景: 在图像识别、语音识别、机器翻译等领域,神经网络占据主导地位。 SVM 在一些特定的小数据集或特定问题上仍有应用。
2025-02-26
SVM与前馈神经网络的区别是什么
SVM(支持向量机)和前馈神经网络在以下方面存在区别: 数据处理方式:SVM 主要基于特征工程,而前馈神经网络可以自动从大量数据中学习特征。 模型结构:SVM 是一种线性分类器的扩展,具有相对简单的结构;前馈神经网络具有更复杂的多层结构。 应用场景:在图像识别、语音识别、语音合成、机器翻译等领域,早期常使用 SVM 结合特征工程,而现在神经网络逐渐占据主导地位。例如,图像识别中,早期由特征工程和少量机器学习(如 SVM)组成,后来通过使用更大数据集和在卷积神经网络结构空间中搜索,发现了更强大的视觉特征;语音识别中,以前涉及大量预处理和传统模型,现在几乎只需要神经网络;语音合成中,历史上采用各种拼接技术,现在 SOTA 类型的大型卷积网络可直接产生原始音频信号输出;机器翻译中,之前常采用基于短语的统计方法,而神经网络正迅速占领统治地位。
2025-02-26
前馈神经网络、循环网络、对称连接网络区别是什么,当前大语言模型属于前面说的哪种网络架构,为什么这种网络架构流行
前馈神经网络、循环网络和对称连接网络的区别如下: 1. 前馈神经网络:这是实际应用中最常见的神经网络类型。第一层是输入,最后一层是输出。若有多个隐藏层,则称为“深度”神经网络。各层神经元的活动是前一层活动的非线性函数,通过一系列变换改变样本相似性。 2. 循环网络:在连接图中存在定向循环,意味着可以按箭头回到起始点。它们具有复杂的动态,训练难度较大,但更具生物真实性。目前如何高效地训练循环网络正受到广泛关注,它是模拟连续数据的自然方式,相当于每个时间片段具有一个隐藏层的深度网络,且在每个时间片段使用相同权重和输入,能长时间记住隐藏状态信息,但难以训练其发挥潜能。 3. 对称连接网络:有点像循环网络,但单元之间的连接是对称的(在两个方向上权重相同)。比起循环网络,对称连接网络更易分析。没有隐藏单元的对称连接网络被称为“Hopfield 网络”,有隐藏单元的则称为玻尔兹曼机。 当前的大语言模型通常基于 Transformer 架构,它属于前馈神经网络的一种变体。这种架构流行的原因包括:能够处理长序列数据、并行计算效率高、具有强大的特征提取和表示能力等。
2025-02-25
神经网络从架构上有哪几种类型,当前流行的大语言模型用哪种类型神经网络,为什么这种神经网络架构更为流行
神经网络从架构上主要有以下几种类型: 1. 马尔科夫链:用于文本生成。 2. 循环神经网络(RNN):可应用于文本生成。 3. 长短时记忆网络(LSTMs):在文本生成等领域发挥作用。 4. Transformer:当今最流行的模型大多基于此架构,包括流行的大型语言模型,如 GPT3、GPTJ 或 BERT 等。 5. Encoderonly:适用于自然语言理解任务,如分类和情感分析,代表模型是 BERT。 6. Encoderdecoder:同时结合 Transformer 架构的 encoder 和 decoder 来理解和生成内容,用例包括翻译和摘要,代表是 Google 的 T5。 7. Decoderonly:更擅长自然语言生成任务,众多 AI 助手采用此结构。 当前流行的大语言模型,如 GPT3、ChatGPT 等,多采用 Decoderonly 架构的神经网络。这种架构更为流行的原因在于:它更擅长自然语言生成任务,能够根据用户输入生成相应的内容。同时,Transformer 架构具有延长的注意力广度,能够更好地处理长序列数据,提高模型的性能和表现。
2025-02-25