Chat with Wiki - 传统AI、大模型、AGI的区别

Answer

传统 AI、大模型、AGI 存在以下区别：

传统 AI：

语音技能 NLU 通常通过一系列规则、分词策略等训练而成。
运作逻辑规律可观测，具有 if-else 式的逻辑性。

大模型：

凭借海量数据在向量空间中学习知识的关联性。
运作逻辑难以观测，脱离了 if-else 的层面。
Transformer 是其底层结构，是一个大参数（千亿级别）的回归方程，底层是 function loss 损失函数，能在一定 prompt condition 情况下，repeat 曾经出现过的数据内容，实现“生成”能力。
大语言模型是一个 perfect memory，repeat 曾经出现的内容。与 Alpha Go 相比，Alpha Go 是增强学习模型，有推理能力，而大语言模型这块很弱。

AGI（通用人工智能）：

部分人觉得 LLM（大语言模型）具有 AGI 潜力，但 LeCun 反对。
目前对于能否到达 AGI 阶段尚不明确。

在公众传播层面：

AIGC 指用 Stable Diffusion 或 Midjourney 生成图像内容，后来泛指用 AI 生成音乐、图像、视频等内容。
LLM 指 NLP 领域的大语言模型，如 ChatGPT。
GenAI 是生成式人工智能模型，国内官方政策文件使用这个词相对科学，涵盖了 LLM 和 AIGC。
公众传播一般会混用上述名词，但底层是 transformer 结构。

Content generated by AI large model, please carefully verify (powered by aily)

References

乌嘉文：大模型应用层

作者：Garman邬嘉文原文：https://mp.weixin.qq.com/s/b7Cctfgb4w5LCCBrSYIlrg[heading2]Transformer决定边界[content]在CES 2024，李飞飞在争论LLM和AIGC名称不能混用，吴恩达觉得在公众传播没关系。李飞飞觉得难以接受，个人猜测是它模糊了大模型的本质。在公众传播层面：AIGC：指用Stable Diffusion或Midjourney生成图像内容，后来泛指用AI生成音乐、图像、视频等内容。LLM：指NLP领域的大语言模型，如ChatGPT。GenAI：生成式人工智能模型，国内官方政策文件使用这个词相对科学，涵盖了LLM和AIGC。AGI：指通用人工智能，部分人觉得LLM具有AGI潜力，LeCun反对。公众传播一般会混用上述名词，但底层是transformer结构。（stable diffusion原采用LDM+UNet，后来改为DiT）而transformer底层是function loss损失函数Transformer是一个大参数（千亿级别）的回归方程。回归方程的Function loss拟合A to B mapping关系，实现数据集的压缩与还原。Transformer是在一定prompt condition情况下，repeat曾经出现过的数据内容，实现“生成”能力。大语言模型的智能体验在两个数据集压缩后，能解释两个数据集之间地带的“连续”能力。（Ilya）所以大语言模型是一个perfect memory，repeat曾经出现的内容。它与Alpha Go差异：Alpha Go是一个增强学习模型，学习结果会调整模型自身参数Alpha Go有推理能力，但大语言模型这块很弱。Transformer决定LLM是一个生成式模型。

邬嘉文：大模型应用层

非技术背景，一文读懂大模型（长文）

在深入了解了AI的运作原理，并盘了众多当前市面上AI的落地产品之后，我们不妨重新回到最开始的问题。此次AI大模型究竟引发了怎样的变革？在思考这个问题之前，我想先分享下去年刚接触大模型时，困扰我的一个问题。即大模型与当下的智能语音技能的NLU存在什么差异？此前，我也曾涉足过一些语音产品的设计逻辑，知道语音技能链路其实就是把声音转为ASR，再对文本进行NLU理解，然后映射到对应的语音技能表中，最后让程序依据相应的语音技能指令完成逻辑。乍看起来，大模型能实现的，通过语音技能似乎也能达成，那我们引入大模型的意义在哪里呢？抱着这样的疑问，我尝试去理解了大模型的原理。当我在初步理解大模型的原理之后，我发现二者还是存在本质性的差别的。差别在于，后者的语音技能NLU仅是通过一系列规则、分词策略等训练而成的产物。而且NLU的运作逻辑规律都是可观测的，具有if-else式的逻辑性。而大模型，则是凭借海量的数据，在向量空间中学习知识的关联性从而形成的，其运作逻辑难以观测，已然脱离了if-else的层面。所以，我们再度审视这个问题，此次的AI变革到底带来了什么？汪华老师在前不久的分享中，对于此次AI变革的量级提出了观点：他认为这次AI的变革量级，100%能够抵达第一个阶段，即与移动互联网处于同一级别；50%有可能发展至第二个阶段，即与蒸汽机的出现同量级；至于能否到达第三个阶段，即AGI，尚不明确。在这一点上，我的看法与他一致。因为我觉得，AI此次带来的变革，已然脱离了传统互联网基于if-else的最底层逻辑，这几乎等同于重塑了互联网，这不就相当于蒸汽机级别般的变革吗？