Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

判别式与生成式

Answer

生成式模型和判别式模型在底层模式上存在普遍性和差异性。

生成式模型方面:

  • 核心之一在于采用更高效的 token 化,language 或 code 作为 token 化的承载媒介,是人类认知推理、链接物理世界、抽象化表达的重要且广泛的概念化空间。
  • 例如在 GAN 中,生成器不断生成逼真的假图像,与判别器互相博弈优化。
  • 常见的生成式模型包括 GAN、Flow-based models(其在 AIGC 时代的作用未充分显现)、VAE(是 Stable Diffusion 模型的核心结构之一)等。

判别式模型方面:

  • 在“判别侧”即模型输出“Y”侧对于生成式模型来说属于其子集,某种程度上不仅是“Y”,模型输入“X”侧及任务本身也属于生成式模型的子集。

通过学习台湾大学李宏毅教授的《生成式 AI 导论 2024》课程,可以更全面地了解生成式 AI 的基本概念、发展历程、技术架构、应用场景等内容,包括生成式模型的基本结构、训练方法、评估指标,生成式对话的概念、系统架构和关键技术,预训练语言模型的发展、优缺点及在生成式 AI 中的应用,以及生成式 AI 面临的挑战和未来发展趋势。

Content generated by AI large model, please carefully verify (powered by aily)

References

融合RL与LLM思想,探寻世界模型以迈向AGI/ASI的第一性原理反思和探索「RL×LLM×WM>AI4S>AGI>ASI」

Think:这里可以稍微停下来思考一下生成式模型和判别式模型在底层模式的普遍性和差异性。在这里,个人认为“生成式”的核心之一在于采用了更高效的token化,而language亦或是code作为token化的承载媒介,是人类认知推理、链接物理世界、抽象化表达的最重要且涵盖范围十分广泛的概念化空间。而某种程度上,判别式模型在“判别侧”即模型输出“Y”侧对于生成式模型来说亦属于其子集(其实不光是“Y”,模型输入“X”侧且任务本身亦属于其子集--这里指的是用于模型推理过程的某种信息变换X→Y的整体模式),因此也就为大多数人所认为的LLM会取代或替代传统模型提供了理论的可能,即人们常说的:Token is all you need!

教程:深入浅出完整解析Stable Diffusion(SD)核心基础知识 - 知乎

我们可以将GAN中的生成器比喻为印假钞票的犯罪分子,判别器则被当作警察。犯罪分子努力让印出的假钞看起来逼真,警察则不断提升对于假钞的辨识能力。二者互相博弈,随着时间的进行,都会越来越强。在图像生成任务中也是如此,生成器不断生成尽可能逼真的假图像。判别器则判断图像是gt gt图像,还是生成的图像。二者不断博弈优化,最终生成器生成的图像使得判别器完全无法判别真假。关于Flow-based models,其在AIGC时代的作用还未显现,可以持续关注。最后,VAE将在本文后面的章节详细讲解,因为正是VAE将输入数据压缩至Latent隐空间中,故其成为了SD模型的核心结构之一。

学习笔记:《生成式AI导论2024》 李宏毅

当我写下这个标题之后,还没开始上课,小西就帮我写了一份学习笔记,有点无聊哈哈,但是方便一览全局一、课程介绍这是台湾大学李宏毅教授的生成式AI课程,主要介绍了生成式AI的基本概念、发展历程、技术架构和应用场景等内容。课程共分为12讲,每讲约2小时。二、学习目标通过学习本课程,掌握生成式AI的基本概念和常见技术,能够使用相关框架搭建简单的生成式模型,了解生成式AI的发展现状和未来趋势。三、学习内容什么是生成式AI生成式AI的定义和分类生成式AI与判别式AI的区别生成式AI的应用领域生成式模型生成式模型的基本结构和训练方法生成式模型的评估指标常见的生成式模型及其优缺点生成式对话生成式对话的基本概念和应用场景生成式对话系统的架构和关键技术基于生成式模型的对话生成方法预训练语言模型预训练语言模型的发展历程和关键技术预训练语言模型的优缺点预训练语言模型在生成式AI中的应用生成式AI的挑战与展望生成式AI面临的挑战和解决方法生成式AI的未来发展趋势和研究方向四、学习资源教材:《生成式AI导论2024》,李宏毅

Others are asking
判别式CNN到生成式大模型的发展
判别式 CNN 到生成式大模型的发展经历了以下几个阶段: 1. 早期发展(2014 年以前):最初的文生图尝试集中在将简单文本描述转化为图像。这些早期方法依赖于基本的图像处理技术和简单的模型,效果有限,生成的图像质量通常不高。 2. 深度学习的崛起(2014 年2018 年):随着深度学习的发展,尤其是卷积神经网络(CNN)的成功应用,文生图模型开始采用神经网络来改进图像生成的质量和多样性。在这一时期,如 GAN(生成对抗网络)及其变体层出不穷,开始被用于文生图任务,展示了生成更逼真图像的潜力。 3. 引入 Transformer(2019 年2021 年):Transformer 架构,原本在 NLP 领域取得巨大成功,开始被应用于文生图模型,提高模型处理复杂文本和生成高质量图像的能力。如 OpenAI 的 DALLE 模型,采用了 Transformer 结构来生成与文本描述匹配的图像,成为这一时期的标志性进展。与此同时,以 DDPM 为代表的工作,为 Diffusion Model 奠定了理论基础,众多基于 Transformer 和 Diffusion Model 的研究成果从 2021 下半年开始如雨后春笋般涌现。
2024-04-16
吴恩达有《面向所有人的生成式 AI 入门课程 Generative AI for Everyone》下载资源
以下是吴恩达《面向所有人的生成式 AI 入门课程 Generative AI for Everyone》的相关资源: B 站: 学习笔记: 飞书: 下的相关课程
2025-02-07
李宏毅《生成式人工智能导论》课件
以下是关于李宏毅《生成式人工智能导论》的相关信息: 课程目录: 1. 第 0 讲:课程说明(2024 年 2 月 24 日) 2. 第 1 讲:生成式 AI 是什么?(2024 年 2 月 24 日) 3. 第 2 讲:今日的生成式人工智慧厉害在哪里?从「工具」变为「工具人」(2024 年 3 月 3 日) 4. 第 3 讲:训练不了人工智慧?你可以训练你自己—神奇咒语与提供更多资讯(2024 年 3 月 3 日) 5. 第 4 讲:训练不了人工智慧?你可以训练你自己—拆解问题与使用工具(2024 年 3 月 10 日) 6. 待更新…… 第 0 讲课程说明的要点: 1. 知道:有能力自己开发、何时需要自己开发、何时可以用现成的人工智能。 2. 目标:了解生成式 AI 背后的原理和更多可能性,作为你魔术师的开始。包括体验用生成式 AI 打造应用、体验训练自己的生成式 AI 模型。同时提到负面体验,如大模型训练花时间(以周为单位)、结果不可控。 3. 影响模型能力的指标很多,常规会看参数的量级来评估,量级指数级增长,FOMO,如 2019 年 GPT2.0 15b 参数,2024 年 GPT3.5 70b 参数。 附录: 1. 课程介绍:这是台湾大学李宏毅教授的生成式 AI 课程,主要介绍生成式 AI 的基本概念、发展历程、技术架构和应用场景等内容。课程共 12 讲,每讲约 2 小时。 2. 学习目标:掌握生成式 AI 的基本概念和常见技术,能够使用相关框架搭建简单的生成式模型,了解生成式 AI 的发展现状和未来趋势。 3. 学习内容:包括什么是生成式 AI、生成式模型、生成式对话、预训练语言模型、生成式 AI 的挑战与展望等方面。 4. 学习资源:教材《生成式 AI 导论 2024》,参考书籍《深度学习》,在线课程李宏毅的生成式 AI 课程,开源项目 OpenAI GPT3、字节跳动的云雀等。 5. 学习方法。 课程地址:https://www.youtube.com/watch?v=AVIKFXLCPY8
2025-01-16
生成式AI
生成式 AI 是一种能够生成新内容的人工智能技术,其内容可以是多模态的,包括文本、图像、音频、视频等。 Gen AI/Generative AI 是“生成式人工智能”的正式称呼,它和 AIGC 有所不同。AIGC 指的是由人工智能生成的内容的创作方式,是 Generative AI 的应用结果。 ChatGPT 是 OpenAI 推出的,早期是一种模型,目前逐渐演变成一种可以兼容多种 GPT 模型的聊天应用(服务)。 生成式 AI 可以应用于广泛的场景,例如文档摘要、信息提取、代码生成、营销活动创建、虚拟协助、呼叫中心机器人等。 其工作方式包括训练阶段和应用阶段。训练阶段通过从大量现有内容中学习生成基础模型,应用阶段基础模型可用于生成内容和解决一般性问题,也可使用特定领域新数据集进一步训练以解决特定问题。 在工具方面,如 Google Cloud 的 Vertex AI 是端到端机器学习开发平台,Generative AI Studio 允许快速制作原型和自定义生成式 AI 模型,Model Garden 可发现和交互基础及第三方开源模型。 以 Midjourney 为代表的工具在图形领域,可根据用户提供的文本描述生成高度相关和创造性的图像,这种通过文本命令获得图像的方式叫 Prompting,是全新形态的人机交互。其背后的原理涉及数据、映射和扩散三个概念。首先是数据,包括获取各种图像存档和创建特定数据集以获得足够基础来特征化物体、风格或概念。其次是映射,AI 使用算法识别和提取图片关键视觉特征。最后是扩散,AI 能通过创造性扩散过程探索和创造新的视觉表达形式。
2025-01-02
什么是生成式ai?
生成式 AI 是一种人工智能技术,能够生成新的、未曾存在的内容,这些内容可以是多模态的,包括文本(例如文章、报告、诗歌等)、图像(例如绘画、设计图、合成照片等)、音频(例如音乐、语音、环境声音等)、视频(例如电影剪辑、教程、仿真等)。 生成式 AI 可以应用于广泛的场景,例如文档摘要、信息提取、代码生成、营销活动创建、虚拟协助、呼叫中心机器人等。 其工作方式包括训练阶段和应用阶段。在训练阶段,通过从大量现有内容(文本、音频、视频等)中学习进行训练,得到一个“基础模型”。在应用阶段,基础模型可用于生成内容并解决一般性问题,还可使用特定领域的新数据集进一步训练以解决特定问题,从而得到一个量身定制的新模型。 AIGC 又称为生成式 AI,意为人工智能生成内容,例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等都属于 AIGC 的应用。 Gen AI/Generative AI 是“生成式人工智能”的正式称呼,它是一种能够生成新内容的人工智能技术,比如文本、图像、音乐等。而 AIGC 指的是由人工智能生成的内容的创作方式,实际上是 Generative AI 的应用结果。
2025-01-02
欧盟人工智能法案对我国在生成式人工智能方面立法的启示。
欧盟人工智能法案对我国在生成式人工智能方面立法具有以下启示: 1. 立法理念方面:我国与欧盟在人工智能立法上有共通之处,如风险分级管理、高风险项目的“备案”“评估”“透明”等原则,在我国相关法律法规中已有所体现,欧盟法案对我国立法工作具有重要参考意义。 2. 特殊领域监管方面: 算法推荐、深度合成、生成式人工智能是我国规制人工智能的具体领域。欧盟法案对这些领域的某些产品或服务有特殊回应,一定程度上印证了我国特别监管的必要性。 对于深度合成,欧盟法案强化了系统使用主体信息透明度的要求,与我国相关规定有一致性,但我国规定更全面,不过存在规定交叉重复适用的问题。 对于生成式人工智能,欧盟法案将其视为“基础模型”的一种类型,并规定了额外义务,我国相关规定在义务上更为全面。 3. 监管体系方面: 中国针对不同涉及算法的互联网信息服务,以落实主体责任为基本落脚点,将“服务提供者”作为相关义务的履行主体。 欧盟《人工智能法案》首先确立以风险为基准的人工智能治理框架,通过对人工智能系统进行评估划分风险层级,并匹配不同责任措施和差异化监管,进一步界定了各类主体的义务。
2024-12-31
结合欧盟《人工智能法案》和我国《生成式人工智能服务管理暂行办法》的对照,论述欧盟人工智能法案对我国在生成式人工智能方面立法的启示。
欧盟《人工智能法案》对我国在生成式人工智能方面立法的启示主要体现在以下几个方面: 1. 监管框架出发点:中国针对不同的涉及算法的互联网信息服务,以落实主体责任作为基本落脚点,将“服务提供者”作为相关义务的履行主体。而欧盟《人工智能法案》首先确立以风险为基准的人工智能治理框架,通过对人工智能系统进行评估,划分为不同风险层级,并匹配不同的责任措施和差异化监管。 2. 风险分类分级监管与算法安全评估:在我国,相关指导意见和法规已提出风险防控和算法分级分类安全管理的要求,以及对生成式人工智能服务的分类分级监管要求。欧美在这方面的路径和方法虽有争议,但总体上对我国仍具借鉴意义。
2024-12-31