AGI 是“Artificial General Intelligence”的缩写,意思是通用人工智能,指能够像人类一样思考、学习和执行多种任务的人工智能系统。目前 AI 分为 ANI 和 AGI,ANI(artificial narrow intelligence 弱人工智能)得到巨大发展,但 AGI 还没有取得巨大进展。ANI 只可做一件事,如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等,而 AGI 能做任何人类可以做的事。部分人觉得 LLM 具有 AGI 潜力,LeCun 反对。在公众传播层面,AIGC 指用 Stable Diffusion 或 Midjourney 生成图像内容,后来泛指用 AI 生成音乐、图像、视频等内容;LLM 指 NLP 领域的大语言模型,如 ChatGPT;GenAI 是生成式人工智能模型,国内官方政策文件使用这个词相对科学,涵盖了 LLM 和 AIGC。
作者:Garman邬嘉文原文:https://mp.weixin.qq.com/s/b7Cctfgb4w5LCCBrSYIlrg[heading2]Transformer决定边界[content]在CES 2024,李飞飞在争论LLM和AIGC名称不能混用,吴恩达觉得在公众传播没关系。李飞飞觉得难以接受,个人猜测是它模糊了大模型的本质。在公众传播层面:AIGC:指用Stable Diffusion或Midjourney生成图像内容,后来泛指用AI生成音乐、图像、视频等内容。LLM:指NLP领域的大语言模型,如ChatGPT。GenAI:生成式人工智能模型,国内官方政策文件使用这个词相对科学,涵盖了LLM和AIGC。AGI:指通用人工智能,部分人觉得LLM具有AGI潜力,LeCun反对。公众传播一般会混用上述名词,但底层是transformer结构。(stable diffusion原采用LDM+UNet,后来改为DiT)而transformer底层是function loss损失函数Transformer是一个大参数(千亿级别)的回归方程。回归方程的Function loss拟合A to B mapping关系,实现数据集的压缩与还原。Transformer是在一定prompt condition情况下,repeat曾经出现过的数据内容,实现“生成”能力。大语言模型的智能体验在两个数据集压缩后,能解释两个数据集之间地带的“连续”能力。(Ilya)所以大语言模型是一个perfect memory,repeat曾经出现的内容。它与Alpha Go差异:Alpha Go是一个增强学习模型,学习结果会调整模型自身参数Alpha Go有推理能力,但大语言模型这块很弱。Transformer决定LLM是一个生成式模型。
作者:小鱼干了发布时间:2023-06-29 23:45原文地址:https://mp.weixin.qq.com/s/ycDWZ8W46DrsyeNShC1-wA微信扫一扫关注该公众号[heading1]先热个身[content]chatGPT:是由致力于AGI的公司OpenAI研发的一款AI技术驱动的NLP聊天工具,于2022年11月30日发布,目前使用的是GPT-4的LLM。额!~chatGPT我听过,也知道是啥,但你这个解释我直接给我干懵了,套娃呢,解释藏我不认识的单词是不!~AI:人工智能(Artificial Intelligence)AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统NLP:自然语言处理(Natural Language Processing),就是说人话LLM:大型语言模型(Large Language Model),数据规模很大,没钱你搞不出来的,大烧钱模型。这段解释chatGPT的释义,一句话就把关于AIGC的几个常见名词都涵盖了,不愧是去年火到我卖地瓜的二姨都知道的“鸡屁屉”。一个字!绝!
AI分为ANI和AGI,ANI得到巨大发展但是AGI还没有取得巨大进展。ANI,artificial narrow intelligence弱人工智能。这种人工智能只可做一件事,如智能音箱,网站搜索,自动驾驶,工厂与农场的应用等。AGI,artificial general intelligence,做任何人类可以做的事[heading5]机器学习[content]监督学习,从A到B,从输入到输出。为什么近期监督学习会快速发展,因为现有的数据快速增长,神经网络规模发展以及算力快速发展。[heading5]什么是数据?[content]数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。如何获取数据,一,手动标注,二,观察行为,三,网络下载。使用数据的方法,如果开始搜集数据,可以马上将数据展示或者喂给某个AI团队,因为大多数AI团队可以反馈给IT团队,说明那种类型数据需要收集,以及应该继续构建那种类型的IT基础框架。数据不一定多就有用,可以尝试聘用AI团队要协助梳理数据。有时数据中会出现,不正确,缺少的数据,这就需要有效处理数据。数据同时分为结构化数据与非结构化数据。结构化数据可以放在巨大的表格中,人们理解图片,视频,文本很简单,但是这种非结构化数据机器处理起来更难一些。