Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

判别式与生成式

Answer

生成式模型和判别式模型在底层模式上存在普遍性和差异性。

生成式模型方面:

  • 核心之一在于采用更高效的 token 化,language 或 code 作为 token 化的承载媒介,是人类认知推理、链接物理世界、抽象化表达的重要且广泛的概念化空间。
  • 例如在 GAN 中,生成器不断生成逼真的假图像,与判别器互相博弈优化。
  • 常见的生成式模型包括 GAN、Flow-based models(其在 AIGC 时代的作用未充分显现)、VAE(是 Stable Diffusion 模型的核心结构之一)等。

判别式模型方面:

  • 在“判别侧”即模型输出“Y”侧对于生成式模型来说属于其子集,某种程度上不仅是“Y”,模型输入“X”侧及任务本身也属于生成式模型的子集。

通过学习台湾大学李宏毅教授的《生成式 AI 导论 2024》课程,可以更全面地了解生成式 AI 的基本概念、发展历程、技术架构、应用场景等内容,包括生成式模型的基本结构、训练方法、评估指标,生成式对话的概念、系统架构和关键技术,预训练语言模型的发展、优缺点及在生成式 AI 中的应用,以及生成式 AI 面临的挑战和未来发展趋势。

Content generated by AI large model, please carefully verify (powered by aily)

References

融合RL与LLM思想,探寻世界模型以迈向AGI/ASI的第一性原理反思和探索「RL×LLM×WM>AI4S>AGI>ASI」

Think:这里可以稍微停下来思考一下生成式模型和判别式模型在底层模式的普遍性和差异性。在这里,个人认为“生成式”的核心之一在于采用了更高效的token化,而language亦或是code作为token化的承载媒介,是人类认知推理、链接物理世界、抽象化表达的最重要且涵盖范围十分广泛的概念化空间。而某种程度上,判别式模型在“判别侧”即模型输出“Y”侧对于生成式模型来说亦属于其子集(其实不光是“Y”,模型输入“X”侧且任务本身亦属于其子集--这里指的是用于模型推理过程的某种信息变换X→Y的整体模式),因此也就为大多数人所认为的LLM会取代或替代传统模型提供了理论的可能,即人们常说的:Token is all you need!

教程:深入浅出完整解析Stable Diffusion(SD)核心基础知识 - 知乎

我们可以将GAN中的生成器比喻为印假钞票的犯罪分子,判别器则被当作警察。犯罪分子努力让印出的假钞看起来逼真,警察则不断提升对于假钞的辨识能力。二者互相博弈,随着时间的进行,都会越来越强。在图像生成任务中也是如此,生成器不断生成尽可能逼真的假图像。判别器则判断图像是gt gt图像,还是生成的图像。二者不断博弈优化,最终生成器生成的图像使得判别器完全无法判别真假。关于Flow-based models,其在AIGC时代的作用还未显现,可以持续关注。最后,VAE将在本文后面的章节详细讲解,因为正是VAE将输入数据压缩至Latent隐空间中,故其成为了SD模型的核心结构之一。

学习笔记:《生成式AI导论2024》 李宏毅

当我写下这个标题之后,还没开始上课,小西就帮我写了一份学习笔记,有点无聊哈哈,但是方便一览全局一、课程介绍这是台湾大学李宏毅教授的生成式AI课程,主要介绍了生成式AI的基本概念、发展历程、技术架构和应用场景等内容。课程共分为12讲,每讲约2小时。二、学习目标通过学习本课程,掌握生成式AI的基本概念和常见技术,能够使用相关框架搭建简单的生成式模型,了解生成式AI的发展现状和未来趋势。三、学习内容什么是生成式AI生成式AI的定义和分类生成式AI与判别式AI的区别生成式AI的应用领域生成式模型生成式模型的基本结构和训练方法生成式模型的评估指标常见的生成式模型及其优缺点生成式对话生成式对话的基本概念和应用场景生成式对话系统的架构和关键技术基于生成式模型的对话生成方法预训练语言模型预训练语言模型的发展历程和关键技术预训练语言模型的优缺点预训练语言模型在生成式AI中的应用生成式AI的挑战与展望生成式AI面临的挑战和解决方法生成式AI的未来发展趋势和研究方向四、学习资源教材:《生成式AI导论2024》,李宏毅

Others are asking
判别式CNN到生成式大模型的发展
判别式 CNN 到生成式大模型的发展经历了以下几个阶段: 1. 早期发展(2014 年以前):最初的文生图尝试集中在将简单文本描述转化为图像。这些早期方法依赖于基本的图像处理技术和简单的模型,效果有限,生成的图像质量通常不高。 2. 深度学习的崛起(2014 年2018 年):随着深度学习的发展,尤其是卷积神经网络(CNN)的成功应用,文生图模型开始采用神经网络来改进图像生成的质量和多样性。在这一时期,如 GAN(生成对抗网络)及其变体层出不穷,开始被用于文生图任务,展示了生成更逼真图像的潜力。 3. 引入 Transformer(2019 年2021 年):Transformer 架构,原本在 NLP 领域取得巨大成功,开始被应用于文生图模型,提高模型处理复杂文本和生成高质量图像的能力。如 OpenAI 的 DALLE 模型,采用了 Transformer 结构来生成与文本描述匹配的图像,成为这一时期的标志性进展。与此同时,以 DDPM 为代表的工作,为 Diffusion Model 奠定了理论基础,众多基于 Transformer 和 Diffusion Model 的研究成果从 2021 下半年开始如雨后春笋般涌现。
2024-04-16
各个国家对生成式人工智能所持态度
以下是各个国家对生成式人工智能所持的态度: 欧洲:《欧盟人工智能法案》获得批准并正式生效,成为世界上第一个全面采用人工智能监管框架的地区。执行将分阶段进行,对“不可接受的风险”的禁令将于 2025 年 2 月生效。 美国:政府官员对生成式人工智能技术表现出兴趣,在评估其带来的机会的同时,也警示潜在风险。政府机构开始就相关问题征求公众意见,预计未来几个月内将有更多行动。例如,白宫宣布将采取更多措施加强美国的人工智能研究、开发和部署。此外,美国对中国实施了更严格的出口管制和投资限制。 中国:是第一个开始制定生成式人工智能监管框架的国家,从 2022 年开始陆续出台全面指南,如今审查机构正在介入。持续生产 SOTA 模型,由国家互联网信息办公室监督。政府希望模型避免给政治问题提供“错误”答案,发布模型前须提交测试以校准拒绝率。禁止访问 Hugging Face 等国外网站,但官方批准的“主流价值观语料库”可作为训练数据源。 在移动端应用领域,尽管硅谷被视为 AI 核心地带,但世界各地都在积极构建相关产品。在生成式 AI 网页端和移动端产品的开发方面,不同地区的分布有所不同。例如,超过 30%的生成式 AI 网页端产品起源于美国湾区,而在移动应用开发者中,仅有 12%的团队设立于此。同样,超过一半的顶级生成式 AI 网页端产品在美国开发,而不到 1/3 的移动端应用源自美国本土。在全球范围内,包括亚洲(如中国、印度、韩国等)、大洋洲(如澳大利亚)、欧洲(如英国、法国、德国等)、中东(如以色列、土耳其等)的许多国家和地区都在参与生成式 AI 的发展。
2024-12-26
生成式 AI 的人机协同
生成式 AI 的人机协同主要分为以下 3 种产品设计模式: 1. Embedding(嵌入式):人类完成大多数工作。 2. Copilot(副驾驶):人类和 AI 协同工作。 3. Agent(智能代理):AI 完成大多数工作。 在 Agentic Workflow 中,不同角色的 Agent 可使用 Multiagent Collaboration 的方法,按照任务要求自主规划选择工具、流程进行协作完成任务。例如产品经理角色,其诉求可通过 Agents 拆解成多个独立任务,遵循不同工作流,生成大体符合期望的输出结果,再进行修改达到可用阶段。 从原子能力层思考,可抽象化拆解大模型的底层能力,如翻译、识别、提取、格式化等,所有这些都围绕“输入”“处理”“输出”“反馈”几个词,构建最底层的信息处理逻辑,如同四个齿轮相互衔接运转,从需求输入到结果输出,围绕信息加速推动。 此外,搜索引擎作为互联网基础设施和入口,与基于大模型的聊天机器人在解决问题的目标上根本一致。自 ChatGPT 发布,其问答形式被认为将对传统搜索引擎带来颠覆。 在智能时代,软件应从简洁开始,逐渐变成无所不在的助理或智能体,辅助甚至直接完成任务,人机协作重点在于目标与结果,AI 劳动力的终极目标是完全自动化并融入人类社会。 在教育领域,ChatGPT 掀起生成式人工智能浪潮,教育圈受到影响。人机协同共创人机混合智能,培养高阶通识能力、跨学科创新思维、协作与互动,涉及知识获取与处理、多模态多样化内容、伦理辨析与讨论等方面,形成了多种教育模式和理念的发展与融合。
2024-12-26
有没有这些生成式人工智能的url
以下是一些与生成式人工智能相关的 URL: 生成式人工智能简介的视频学习地址: https://youtu.be/G2fqAlgmoPo 中文版本推荐: 生成式人工智能如何改变创意工作相关的框架:NVIDIA 的 2024 年人工智能现状报告链接: 英文解读链接:
2024-12-24
现在市面上面有什么好用的生成式人工智能吗?
目前市面上有许多好用的生成式人工智能,以下为您列举部分: 在文本和图像生成方面,有 OpenAI 的 GPT3(用于文本)、DALLE2(用于图像)、Whisper(用于语音),以及 Midjourney(在艺术竞赛中表现出色)等。 在创建可信角色方面,有 Charisma.ai、Convai.com、Inworld.ai 等,它们旨在为具有情感和自主权的 3D 角色提供动力,并提供工具以便创作者给角色设定目标。 一体化平台方面,Runwayml.com 较为成功,它在一个单一的软件包中汇集了一系列广泛的创作者工具。 在企业应用方面,Menlo Ventures 投资组合公司中的 Sana(企业搜索)、Eve(法律研究副驾驶)和 Typeface(内容生成 AI)等都是早期突破性的代表。 此外,还有 Google 的 BERT 和 LaMDA、Facebook 的 OPT175B 和 BlenderBot 等。同时,有数百公司正在构建通用聊天机器人,如 Replika 和 Anima 等。但需要注意的是,这些模型的训练通常需要大量数据和计算能力,大多数公司难以从头开始训练自己的此类模型。
2024-12-24
生成式人工智能或者专门的书籍教程是什么意思?这种人工智能有什么用?现在市面上有免费的吗?要是没有免费的我去翻外网也可以
生成式人工智能是一种能够创建新内容的人工智能技术。以下是关于生成式人工智能的一些详细信息: 课程方面: 台湾大学李宏毅教授的生成式 AI 课程,主要介绍了其基本概念、发展历程、技术架构和应用场景等内容。课程共 12 讲,每讲约 2 小时。通过学习该课程,可掌握基本概念和常见技术,能使用相关框架搭建简单模型,了解发展现状和未来趋势。学习内容包括: 1. 什么是生成式 AI:定义和分类,与判别式 AI 的区别,应用领域。 2. 生成式模型:基本结构和训练方法,评估指标,常见模型及其优缺点。 3. 生成式对话:基本概念和应用场景,系统架构和关键技术,基于模型的对话生成方法。 4. 预训练语言模型:发展历程和关键技术,优缺点,在生成式 AI 中的应用。 5. 生成式 AI 的挑战与展望:面临的挑战和解决方法,未来发展趋势和研究方向。 改变创意工作方面: 生成式人工智能在创意工作中发挥着重要作用。例如,生成模型经过训练后,可针对特定内容领域进行“微调”,催生了用于生物医学、法律、法语等的专用模型,以及适用于不同目的的 GPT3 等。NVIDIA 的 BioNeMo 是用于在超级计算规模上训练、构建和部署大型语言模型的框架,适用于生成化学、蛋白质组学和 DNA/RNA 等内容。但使用生成式人工智能仍需人工参与,人类要输入提示让其创建内容,创造性的提示会产生创造性的输出,“即时工程师”可能成为新职业。该领域已出现 DALLE 2 图像提示书和提示市场。 学习资源: 1. 教材:《生成式 AI 导论 2024》,李宏毅。 2. 参考书籍:《深度学习》,伊恩·古德费洛等。 3. 在线课程:李宏毅的生成式 AI 课程。 4. 开源项目:OpenAI GPT3、字节跳动的云雀等。 学习方法:根据课程内容和资源,制定适合自己的学习计划,多实践、多思考。 目前市面上有部分免费的生成式人工智能资源,但也有收费的。需要注意的是,未经许可翻外网可能存在法律风险,请您谨慎选择。
2024-12-24
如何掌握生成式AI
以下是关于掌握生成式 AI 的一些建议: 课程学习: 可以学习台湾大学李宏毅教授的生成式 AI 课程,该课程主要介绍了生成式 AI 的基本概念、发展历程、技术架构和应用场景等内容,共分为 12 讲,每讲约 2 小时。 通过学习本课程,能够掌握生成式 AI 的基本概念和常见技术,能够使用相关框架搭建简单的生成式模型,了解生成式 AI 的发展现状和未来趋势。 学习内容: 了解什么是生成式 AI,包括其定义、分类,以及与判别式 AI 的区别和应用领域。 学习生成式模型的基本结构、训练方法、评估指标,以及常见模型的优缺点。 掌握生成式对话的基本概念、应用场景、系统架构和关键技术,以及基于生成式模型的对话生成方法。 熟悉预训练语言模型的发展历程、关键技术、优缺点及其在生成式 AI 中的应用。 知晓生成式 AI 面临的挑战和解决方法,以及未来发展趋势和研究方向。 学习资源: 教材:《生成式 AI 导论 2024》,李宏毅。 参考书籍:《深度学习》,伊恩·古德费洛等。 在线课程:李宏毅的生成式 AI 课程。 开源项目:OpenAI GPT3、字节跳动的云雀等。 学习方法: 了解 AI 基本概念:首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 开始 AI 学习之旅:在「」中,你将找到一系列为初学者设计的课程。这些课程将引导你了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如 Coursera、edX、Udacity)上的课程,你可以按照自己的节奏学习,并有机会获得证书。 选择感兴趣的模块深入学习:AI 领域广泛(比如图像、音乐、视频等),可以根据自己的兴趣选择特定的模块进行深入学习。建议一定要掌握提示词的技巧,它上手容易且很有用。 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。在知识库提供了很多大家实践后的作品、文章分享。 体验 AI 产品:与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,可以获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。
2024-12-18