Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

神经活动中内在思想的逻辑演算

Answer

以下是关于您提到的“神经活动中内在思想的逻辑演算”的相关内容:

在神经网络和深度学习的发展历程中,沃伦·麦卡洛克(Warren McCulloch)和沃尔特·皮兹(Walter Pitts)曾表明,把二进制输入值加起来,并在和大于一个阈值时输出 1,否则输出 0 的神经元模型,可以模拟基本的或/与/非逻辑函数。这为后续对神经活动中内在思想的研究奠定了基础。

同时,在相关研究中,弗兰克·罗森布拉特(Frank Rosenblatt)构想了感知机,它作为简化的数学模型解释大脑神经元如何工作。感知机取一组二进制输入值,将每个输入值乘以一个连续值权重,并设立一个阈值,如果这些加权输入值的和超过这个阈值,就输出 1,否则输出 0 。

此外,1986 年提出的构想让人们广泛理解了应该如何训练多层神经网络解决复杂学习问题,使得神经网络得以回归和发展。

参考文献:

  • Christopher D.Manning. (2015). Computational Linguistics and Deep Learning Computational Linguistics, 41(4), 701–707.↩
  • F.Rosenblatt. The perceptron, a perceiving and recognizing automaton Project Para. Cornell Aeronautical Laboratory, 1957.↩
  • W.S.McCulloch and W.Pitts. A logical calculus of the ideas immanent in nervous activity. The bulletin of mathematical biophysics, 5(4):115–133, 1943.↩
  • The organization of behavior: A neuropsychological theory. D.O.Hebb. John Wiley And Sons, Inc., New York, 1949 ↩
  • B.Widrow et al. Adaptive ”Adaline” neuron using chemical ”memistors”. Number Technical Report 1553-2. Stanford Electron. Labs., Stanford, CA, October 1960.↩
  • “New Navy Device Learns By Doing”, New York Times, July 8, 1958.↩
  • Perceptrons. An Introduction to Computational Geometry. MARVIN MINSKY and SEYMOUR PAPERT. M.I.T. Press, Cambridge, Mass., 1969.↩
  • Linnainmaa, S. (1970). The representation of the cumulative rounding error of an algorithm as a Taylor expansion of the local rounding errors. Master’s thesis, Univ. Helsinki.↩
Content generated by AI large model, please carefully verify (powered by aily)

References

深度|神经网络和深度学习简史(第一部分):从感知机到BP算法

[title]深度|神经网络和深度学习简史(第一部分):从感知机到BP算法[heading1]人工智能冬天的复苏文章特别谈到了Minsky在《感知机》中讨论过的问题。尽管这是过去学者的构想,但是,正是这个1986年提出的构想让人们广泛理解了应该如何训练多层神经网络解决复杂学习问题。而且神经网络也因此回来了!第二部分,我们将会看到几年后,《Learning internal representations by error propagation》探讨过的BP算法和其他一些技巧如何被用来解决一个非常重要的问题:让计算机识别人类书写。(待续)参考文献Christopher D.Manning.(2015).Computational Linguistics and Deep Learning Computational Linguistics,41(4),701–707.↩F.Rosenblatt.The perceptron,a perceiving and recognizing automaton Project Para.Cornell Aeronautical Laboratory,1957.↩W.S.McCulloch and W.Pitts.A logical calculus of the ideas immanent in nervous activity.The bulletin of mathematical biophysics,5(4):115–133,1943.↩The organization of behavior:A neuropsychological theory.D.O.Hebb.John Wiley And Sons,Inc.,New York,1949 ↩B.Widrow et al.Adaptive ”Adaline” neuron using chemical ”memistors”.Number Technical Report 1553-2.Stanford Electron.Labs.,Stanford,CA,October 1960.↩“New Navy Device Learns By Doing”,New York Times,July 8,1958.↩Perceptrons.An Introduction to Computational Geometry.MARVIN MINSKY and SEYMOUR PAPERT.M.I.T.Press,Cambridge,Mass.,1969.↩Linnainmaa,S.(1970).The representation of the cumulative rounding error of an algorithm as a Taylor expansion of the local rounding errors.Master’s thesis,Univ.Helsinki.↩

深度|神经网络和深度学习简史(第一部分):从感知机到BP算法

[title]深度|神经网络和深度学习简史(第一部分):从感知机到BP算法[heading1]虚假承诺的荒唐显然这里话题是神经网络,那我们前言里为何要扯线性回归呢?呃,事实上线性回归和机器学习一开始的方法构想,弗兰克·罗森布拉特(Frank Rosenblatt)的感知机,有些许相似性。Perceptron心理学家Rosenblatt构想了感知机,它作为简化的数学模型解释大脑神经元如何工作:它取一组二进制输入值(附近的神经元),将每个输入值乘以一个连续值权重(每个附近神经元的突触强度),并设立一个阈值,如果这些加权输入值的和超过这个阈值,就输出1,否则输出0(同理于神经元是否放电)。对于感知机,绝大多数输入值不是一些数据,就是别的感知机的输出值。但有一个额外的细节:这些感知机有一个特殊的,输入值为1的,「偏置」输入,因为我们能补偿加权和,它基本上确保了更多的函数在同样的输入值下是可计算的。这一关于神经元的模型是建立在沃伦·麦卡洛克(Warren McCulloch)和沃尔特·皮兹(Walter Pitts)工作上的。他们曾表明,把二进制输入值加起来,并在和大于一个阈值时输出1,否则输出0的神经元模型,可以模拟基本的或/与/非逻辑函数。这在人工智能的早期时代可不得了——当时的主流思想是,计算机能够做正式的逻辑推理将本质上解决人工智能问题。另一个图表,显示出生物学上的灵感。激活函数就是人们当前说的非线性函数,它作用于输入值的加权和以产生人工神经元的输出值——在罗森布拉特的感知机情况下,这个函数就是输出一个阈值操作

构建外脑 / 智变时代的个人知识管理

[title]构建外脑/智变时代的个人知识管理[heading2]1.大脑之外[heading3]1.2 ExoBrain的概念为了更好的表述这种在大脑之外,利用软件工具还有大语言模型相关的技术,来扩展我们记忆和智力的新机制或者系统,我将其称之为ExoBrain -外脑。后文都用中文外脑来表述ExoBrain。配图01:ExoBrain Concept语言模型是心智界面对话是最简洁的人机界面,ChatGPT的流行让真正的人机对话成为了可能,现在Google的[Bard](https://bard.google.com/?ref=indigox.me),Anthropic的[Claude](https://claude.ai/?ref=indigox.me)还有inflection的[Pi.ai](https://pi.ai/?ref=indigox.me)都卷入了这场智能入口之争。这些语言模型除了可以用它们储备的全人类的知识库来响应我们的任何问题之外,还能够快速理解复杂的文档,生成想法甚至驱动其它的软件来自动化的完成任务,语言模型就是我们的心灵副驾(Mind Copilot),自然语言输入,自然语言输出。语言代表了人类的智能,当我们思考的时候实际上是在进行内心独白和基于语言的逻辑推理。同样,我们用和LLM之间的对话来实现快速理解,记忆唤起、想法连接和驱动外部软件自动完成工作,LLM就像一个智能引擎一样成为了我们和外脑之间的心智界面。容易唤醒的数字记忆

Others are asking
我想看到国内在coze平台上的一些AI agent的开放源,怎么才能看到
以下是一些国内的 Agent 构建平台及 Coze 平台的相关信息: Agent 构建平台: Coze:是新一代一站式 AI Bot 开发平台,集成丰富插件工具,涵盖从基础文本处理到高级机器学习功能,还有众多符合平民生活化的插件,如新闻资讯、天气预报、出行必备、生活便利等方面的插件。 Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景方面表现出色。 要查看 Coze 平台上的 AI agent 开源内容,您可以通过以下途径尝试:在相关的技术社区、开源代码托管平台(如 GitHub 等)上进行搜索,或者关注 Coze 平台的官方网站及开发者论坛获取相关信息。但需注意,开源内容的获取可能受到平台规定和开发者授权的限制。
2025-01-12
神经网络需要哪些硬件设施才能搭建起来
搭建神经网络通常需要以下硬件设施: 1. 图形处理单元(GPU):如英伟达的 GTX 580 GPU,其具有大量快速小内核,适合矩阵乘法和高内存带宽,能显著提高训练速度。 2. 专用芯片:如 ASIC 芯片、neuromorphic chips 等,更易于在芯片上实现神经网络的指令集,适用于低能耗的智能设备。 此外,搭建神经网络的硬件设施还具有以下特点和优势: 1. 同质化计算:典型的神经网络主要由矩阵乘法和线性整流函数(ReLu)两种操作组合而成,相比传统软件的指令更简单,核心代码(如矩阵乘法)的正确性和性能验证更容易。 2. 对芯片更友好:指令集小,在芯片实现上更轻松,能改变低能耗智能设备的应用场景。 3. 常量级的运行时间:每次前向迭代的计算量高度一致,不存在手写复杂 C++代码中的各种执行分支,能避免未预料的无限循环。 4. 常量级的内存消耗:几乎无需动态分配内存,减少与硬盘的 swap 和内存泄漏的可能。 5. 高度可移植:一连串的矩阵乘法操作更容易在各种计算机环境下运行。
2025-03-23
结合北京房山区文化、地标建筑、生态景观等内容,设计房山区中小学数学节 LOGO,要求巧妙融合数学元素(如几何图形、数学公式、数学符号等)与 AI 元素(如神经网络图案、代码片段、智能机器人形象等),生动诠释 “数学 + AI=?” 的主题内涵。
以下是为您整合的相关内容: 北京具有丰富多样的特色元素,包括经典地标如万里长城、天安门广场、故宫角楼、天坛等,见证了历史变迁;宜居生活方面,有独特的美食如豆汁儿、脆皮烤鸭、老北京炸酱面,以及充满京腔的日常生活;潮流文化新地标如国家博物馆、胡同里的新老交融、环球影城、798 等;未来科技方面,有西二旗的上班族日常、北大化学系科研 vlog、世界机器人大会等。 在海报设计方面,若对 AI 回答有疑问可再搜索确认,对于想用的项目要确认与北京的关系及能否使用;兔爷、戏曲金句等北京有名元素可用,金句可分化。做海报时可借鉴三思老师毛绒玩具美食系列,先找参考、做头脑风暴。比赛征集内容有四个赛道,若做系列海报,围绕金句或偏向北京非遗项目做系列较简单。用 AI 制作海报时,如制作北京地标糖葫芦风格海报,可用集梦 2.1 模型,以天坛等建筑为画面中心,注意材质、抽卡选图和细节处理。 对于设计房山区中小学数学节 LOGO,您可以考虑将房山区的特色文化、地标建筑、生态景观与数学元素(如几何图形、数学公式、数学符号等)和 AI 元素(如神经网络图案、代码片段、智能机器人形象等)相结合。例如,以房山区的著名建筑为主体,融入数学图形进行变形设计,同时添加一些代表 AI 的线条或图案,以生动诠释“数学 + AI=?”的主题内涵。
2025-03-18
卷积神经网络
卷积神经网络,也称卷积网络(术语“神经”具有误导性),使用卷积层来过滤输入以获取有用信息。卷积层具有学习的参数,能自动调整滤波器以提取对应任务的最有用信息,例如在一般目标识别中过滤对象形状信息,在鸟类识别中提取颜色信息。通常多个卷积层用于在每一层之后过滤图像以获得越来越多的抽象信息。 卷积网络通常也使用池层,以获得有限的平移和旋转不变性,还能减少内存消耗,从而允许使用更多的卷积层。 最近的卷积网络使用初始模块,它使用 1×1 卷积核来进一步减少内存消耗,同时加快计算速度。 1998 年,Yann LeCun 和他的合作者开发了 LeNet 的手写数字识别器,后来正式命名为卷积神经网络。它在前馈网中使用反向传播,被用于读取北美地区约 10%的支票。卷积神经网络可用于从手写数字到 3D 物体的与物体识别有关的所有工作。 在 ImageNet 2012 年的 ILSVRC 竞赛中,来自多个机构的先进计算机视觉小组将已有的最好计算机视觉方法应用于包含约 120 万张高分辨率训练图像的数据集。
2025-03-02
SVM与神经网络的区别是啥
SVM(支持向量机)和神经网络在以下方面存在区别: 1. 原理和模型结构: SVM 基于寻找能够最大化分类间隔的超平面来进行分类或回归任务。 神经网络则是通过构建多层神经元组成的网络结构,通过神经元之间的连接权重和激活函数来学习数据的特征和模式。 2. 数据处理能力: SVM 在处理小样本、高维度数据时表现较好。 神经网络通常更适合处理大规模数据。 3. 模型复杂度: SVM 相对较简单,参数较少。 神经网络结构复杂,参数众多。 4. 对特征工程的依赖: SVM 对特征工程的依赖程度较高。 神经网络能够自动从数据中学习特征。 5. 应用场景: 在图像识别、语音识别、机器翻译等领域,神经网络占据主导地位。 SVM 在一些特定的小数据集或特定问题上仍有应用。
2025-02-26
SVM与前馈神经网络的区别是什么
SVM(支持向量机)和前馈神经网络在以下方面存在区别: 数据处理方式:SVM 主要基于特征工程,而前馈神经网络可以自动从大量数据中学习特征。 模型结构:SVM 是一种线性分类器的扩展,具有相对简单的结构;前馈神经网络具有更复杂的多层结构。 应用场景:在图像识别、语音识别、语音合成、机器翻译等领域,早期常使用 SVM 结合特征工程,而现在神经网络逐渐占据主导地位。例如,图像识别中,早期由特征工程和少量机器学习(如 SVM)组成,后来通过使用更大数据集和在卷积神经网络结构空间中搜索,发现了更强大的视觉特征;语音识别中,以前涉及大量预处理和传统模型,现在几乎只需要神经网络;语音合成中,历史上采用各种拼接技术,现在 SOTA 类型的大型卷积网络可直接产生原始音频信号输出;机器翻译中,之前常采用基于短语的统计方法,而神经网络正迅速占领统治地位。
2025-02-26
前馈神经网络、循环网络、对称连接网络区别是什么,当前大语言模型属于前面说的哪种网络架构,为什么这种网络架构流行
前馈神经网络、循环网络和对称连接网络的区别如下: 1. 前馈神经网络:这是实际应用中最常见的神经网络类型。第一层是输入,最后一层是输出。若有多个隐藏层,则称为“深度”神经网络。各层神经元的活动是前一层活动的非线性函数,通过一系列变换改变样本相似性。 2. 循环网络:在连接图中存在定向循环,意味着可以按箭头回到起始点。它们具有复杂的动态,训练难度较大,但更具生物真实性。目前如何高效地训练循环网络正受到广泛关注,它是模拟连续数据的自然方式,相当于每个时间片段具有一个隐藏层的深度网络,且在每个时间片段使用相同权重和输入,能长时间记住隐藏状态信息,但难以训练其发挥潜能。 3. 对称连接网络:有点像循环网络,但单元之间的连接是对称的(在两个方向上权重相同)。比起循环网络,对称连接网络更易分析。没有隐藏单元的对称连接网络被称为“Hopfield 网络”,有隐藏单元的则称为玻尔兹曼机。 当前的大语言模型通常基于 Transformer 架构,它属于前馈神经网络的一种变体。这种架构流行的原因包括:能够处理长序列数据、并行计算效率高、具有强大的特征提取和表示能力等。
2025-02-25
中国AI投资逻辑
中国 AI 投资存在以下逻辑: 1. 大规模算力投资:会使公司转变为重资产模式,在瞬息万变的科技市场中可能对公司估值产生不利影响,进而影响投资人收益。获取和使用高性能算力成本高昂,是重大决策。 2. 投资圈现象:许多投资人给大模型创业者看似矛盾的策略,如招募名校人才、组织产品发布会、推出产品、进行下一轮融资,但避免购买算力。多数创业公司选择规避算力风险抬高估值,这可能成为突破的绊脚石,类似荷兰郁金香泡沫,当风口过去,真实收入将成关键。 3. 行业趋势:2024 年,AI 仍是最强吸金赛道。国内 AI 行业融资总金额增加但事件数下降,马太效应明显,资本更青睐热点和高成熟度赛道。智能驾驶在细分赛道中表现突出,AI+教育、游戏、医疗等赛道投资总额增长。政策方面,政府积极推进,国家队频繁出手投资。 4. 发展历程:OpenAI 坚持大模型方向成功,前瞻性投资算力为其奠定基础,其成功是战略眼光和长期投入的结果,背后是惊人的资源调动。中国企业工程优化能力强,人们对国内大模型快速应用充满期待。
2025-03-27
教我工作流的底层逻辑跟如何入门学习工作流
工作流的底层逻辑及入门学习方法如下: 工作流通常由多个节点构成,节点是其基本单元,本质上是包含输入和输出的函数。常见的节点类型包括: 1. LLM(大语言模型):使用输入参数和提示词生成处理结果。 2. Code(代码):通过 IDE 编写代码处理输入参数,并返回输出值。 3. Knowledage(知识库):根据输入参数从关联知识库中召回数据,并返回。 4. Condition(条件判断):ifelse 逻辑节点,用于设计工作流内的分支流程,根据设置条件运行相应的分支。 5. Variable(获取变量):从 Bot 中获取变量作为参数在工作流中使用。 6. Database(数据库):在工作流中使用提前配置在 Bot 数据库中的数据。 以下是一些入门学习工作流的示例和资源: 1. 对于生成绿幕素材和绿幕素材抠图的工作流,您可以下载工作流文件拖入 ComfyUI 中自动加载,然后对照相关说明进行学习。工作流链接:https://pan.quark.cn/s/01eae57419ce 提取码:KxgB 2. 对于 Glif 图像流制作冰淇淋甜品地标,您可以按照以下步骤学习: 1 分钟交作业:点击网址 https://glif.app/@jianStuart/glifs/cly85fy2i000cqe87zcu72i5l ,选一张主体区分度高且主体为地标的图,上传图片并点击相应按钮,多点几次选一张满意的即可。 5 分钟学习制作:点击顶上的“build”按钮,点击“+”加号,选择“img input”,再点下面的“+”加号,选“image generator”,把提示词放进节点,打开“advanced controls”,修改参数,勾选“Enable input image”并改参数。 3. 对于 Coze 平台的工作流,官方有现成的教程参考: 海外参考文档:https://www.coze.com/docs/zh_cn/use_workflow.html 国内参考文档:https://www.coze.cn/docs/guides/use_workflow 国内版本还提供了一些示例,建议跟着实操一遍,如: 搜索新闻:https://www.coze.cn/docs/guides/workflow_search_news 使用 LLM 处理问题:https://www.coze.cn/docs/guides/workflow_use_llm 生成随机数:https://www.coze.cn/docs/guides/workflow_use_code 搜索并获取第一个链接的内容:https://www.coze.cn/docs/guides/workflow_get_content 识别用户意图:https://www.coze.cn/docs/guides/workflow_user_intent
2025-03-24
我想写一部都市玄幻小说,已经有了简单的大纲。请问使用哪款AI工具?又没有 AI味。快速的写出真人作者的小说意境。并且上下逻辑清晰30万的长篇小说。列出免费工具。
以下为您推荐两款可用于写都市玄幻小说的免费 AI 工具及相关方法: 1. Coze: 工作流核心节点: 用 Bing 搜索标题相关的内容。 用程序将搜索结果结构化(不熟悉程序的可忽略或直接复制文中的代码)。 用大模型草拟大纲,包括标题、主旨、世界观、主要角色、小说背景、情节概要。 再用大模型来写文章。 输出文章内容。 2. 与 AI 交互写作(如南瓜博士的经验): 确定主题:不写科幻,用非常规视角,如以猫为第一人称写爱情小说。与 AI 讨论主题,挑选 AI 提供的调味料,明确主题。 构思情节:先刻画人物,如喜欢书店店员艾拉这个人物,使其更丰满,再设计故事线。 希望这些工具和方法能对您创作小说有所帮助。
2025-03-19
你好,我想训练一个自己的专属模型,比如说基于网页里面的问卷调查,我有答题的逻辑,网页的问卷调查项目每天都有非常多的不同的地方,但是又有相通的地方,我想让AI在我的逻辑之上能自我迭代自动答题,我该怎么办
如果您想基于网页问卷调查训练一个能在您的逻辑之上自我迭代自动答题的专属模型,有以下两种常见的技术方案: 1. 训练专有大模型: 优点:效果最好。 缺点:成本高,训练和维护需要大量计算资源和专业知识;更新模型知识难度大,需要重新训练或微调,过程复杂耗时。 2. 利用 RAG(检索增强生成)技术: 例如选择 Baichuan27BChat 模型作为底模,配置模型本地路径和提示模板。在 Train 页面里选择 sft 训练方式,加载定义好的数据集,根据数据集大小和收敛情况设置学习率和训练轮次。使用 FlashAttention2 可减少显存需求、加速训练速度;显存小的朋友可减少 batch size 并开启量化训练,内置的 QLora 训练方式好用。但需要用到 xformers 的依赖。根据聊天记录规模大小,训练时间少则几小时,多则几天。 此外,还有学生训练专属植物分类 AI 模型的案例供您参考。在北京市新英才学校的跨学科选修课“生化 E 家”中,老师和学生共同收集校园内不同树叶的照片,在 OpenInnoLab里找到图像分类训练工具,建立植物分类模型,加入大量数据集进行训练,再用图像化编程将其套在程序里,形成简单的识别工具。在这个过程中,老师通过生活体验与学生讨论图像分类原理,学生从体验到实践操作,在不进行大量代码编程的情况下能够训练 AI 模型,并了解模型训练准确度与数据的关系。
2025-03-14
不能用APP思维、传统数字平台思维去做大模型创业和人工智能创业,二者在底层逻辑和商业模式等方面完全不同
大模型创业和人工智能创业与 APP 思维、传统数字平台思维在底层逻辑和商业模式等方面存在显著差异。大模型和人工智能创业更注重数据的深度处理、算法的优化创新以及对复杂问题的解决能力。相比之下,APP 思维通常侧重于用户界面和功能的设计,以满足特定的用户需求;传统数字平台思维则更多关注平台的搭建和用户流量的获取与运营。在大模型和人工智能领域,技术的突破和创新是关键,需要投入大量资源进行研发,并且要面对更高的技术门槛和不确定性。而 APP 和传统数字平台的创业相对更侧重于市场推广和用户体验的优化。总之,不能简单地用 APP 思维和传统数字平台思维来指导大模型和人工智能创业。
2025-03-07
AGI底层逻辑
AGI(通用人工智能)的底层逻辑包含以下方面: 在公众传播层面,相关名词常被混用,但底层是 Transformer 结构。Transformer 底层是 function loss 损失函数,是一个大参数(千亿级别)的回归方程。其通过回归方程的 Function loss 拟合 A 到 B 的 mapping 关系,实现数据集的压缩与还原。在一定 prompt condition 情况下,Transformer 能 repeat 曾经出现过的数据内容,从而实现“生成”能力。大语言模型在两个数据集压缩后,能解释两个数据集之间地带的“连续”能力。部分人觉得 LLM(大语言模型)具有 AGI 潜力,但 LeCun 反对。同时,大语言模型与 Alpha Go 存在差异,Alpha Go 是一个增强学习模型,学习结果会调整模型自身参数,具有推理能力,而大语言模型在这块很弱。Transformer 决定 LLM 是一个生成式模型。
2025-03-07