直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

大语言模型,AI,AIGC和AGI他们之间是什么关系?

回答

大语言模型、AI、AIGC 和 AGI 是人工智能领域中常用的几个概念,它们之间的关系如下:

  1. AI(人工智能):是指能够执行人类智能任务的计算机程序,例如推理、学习、感知和行动。AI 是一个广泛的概念,包括机器学习、深度学习、自然语言处理、计算机视觉等多个领域。
  2. AIGC(生成式人工智能):是指利用 AI 技术,特别是深度学习,来生成新的文本、图像、音频或视频等内容的过程。AIGC 是 AI 的一个子集,专注于生成式任务。
  3. LLM(大型语言模型):是一种特殊类型的 AI 模型,专门用于处理自然语言处理(NLP)任务。LLM 是一种基于深度学习的模型,通过在大量文本数据上进行无监督学习,来学习语言的模式和结构。LLM 可以用于各种 NLP 任务,例如文本生成、机器翻译、问答系统等。
  4. AGI(通用人工智能):是指能够执行人类智能任务的计算机程序,并且具有人类智能的一些关键特征,例如理解、学习、推理和行动。AGI 是 AI 的一个理想目标,目前还没有实现。

总的来说,AI 是一个广泛的概念,包括 AIGC 和 LLM 等子集。AIGC 是 AI 的一个子集,专注于生成式任务,而 LLM 是 AI 的一个子集,专注于 NLP 任务。AGI 是 AI 的一个理想目标,目前还没有实现。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

邬嘉文:大模型应用层

在CES 2024,李飞飞在争论LLM和AIGC名称不能混用,吴恩达觉得在公众传播没关系。李飞飞觉得难以接受,个人猜测是它模糊了大模型的本质。在公众传播层面:AIGC:指用Stable Diffusion或Midjourney生成图像内容,后来泛指用AI生成音乐、图像、视频等内容。LLM:指NLP领域的大语言模型,如ChatGPT。GenAI:生成式人工智能模型,国内官方政策文件使用这个词相对科学,涵盖了LLM和AIGC。AGI:指通用人工智能,部分人觉得LLM具有AGI潜力,LeCun反对。公众传播一般会混用上述名词,但底层是transformer结构。(stable diffusion原采用LDM+UNet,后来改为DiT)而transformer底层是function loss损失函数Transformer是一个大参数(千亿级别)的回归方程。回归方程的Function loss拟合A to B mapping关系,实现数据集的压缩与还原。Transformer是在一定prompt condition情况下,repeat曾经出现过的数据内容,实现“生成”能力。大语言模型的智能体验在两个数据集压缩后,能解释两个数据集之间地带的“连续”能力。(Ilya)所以大语言模型是一个perfect memory,repeat曾经出现的内容。它与Alpha Go差异:Alpha Go是一个增强学习模型,学习结果会调整模型自身参数Alpha Go有推理能力,但大语言模型这块很弱。Transformer决定LLM是一个生成式模型。

乌嘉文:大模型应用层

在CES 2024,李飞飞在争论LLM和AIGC名称不能混用,吴恩达觉得在公众传播没关系。李飞飞觉得难以接受,个人猜测是它模糊了大模型的本质。在公众传播层面:AIGC:指用Stable Diffusion或Midjourney生成图像内容,后来泛指用AI生成音乐、图像、视频等内容。LLM:指NLP领域的大语言模型,如ChatGPT。GenAI:生成式人工智能模型,国内官方政策文件使用这个词相对科学,涵盖了LLM和AIGC。AGI:指通用人工智能,部分人觉得LLM具有AGI潜力,LeCun反对。公众传播一般会混用上述名词,但底层是transformer结构。(stable diffusion原采用LDM+UNet,后来改为DiT)而transformer底层是function loss损失函数Transformer是一个大参数(千亿级别)的回归方程。回归方程的Function loss拟合A to B mapping关系,实现数据集的压缩与还原。Transformer是在一定prompt condition情况下,repeat曾经出现过的数据内容,实现“生成”能力。大语言模型的智能体验在两个数据集压缩后,能解释两个数据集之间地带的“连续”能力。(Ilya)所以大语言模型是一个perfect memory,repeat曾经出现的内容。它与Alpha Go差异:Alpha Go是一个增强学习模型,学习结果会调整模型自身参数Alpha Go有推理能力,但大语言模型这块很弱。Transformer决定LLM是一个生成式模型。

AIGC常见名词解释(字典篇)

chatGPT:是由致力于AGI的公司OpenAI研发的一款AI技术驱动的NLP聊天工具,于2022年11月30日发布,目前使用的是GPT-4的LLM。额!~ chatGPT我听过,也知道是啥,但你这个解释我直接给我干懵了,套娃呢,解释藏我不认识的单词是不!~ AI:人工智能(Artificial Intelligence)AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统NLP:自然语言处理(Natural Language Processing),就是说人话LLM:大型语言模型(Large Language Model),数据规模很大,没钱你搞不出来的,大烧钱模型。这段解释chatGPT的释义,一句话就把关于AIGC的几个常见名词都涵盖了,不愧是去年火到我卖地瓜的二姨都知道的“鸡屁屉”。一个字!绝!

其他人在问
使用AGI写作
以下是关于使用 AGI 写作的相关内容: 利用 AI 打造爆款公众号文章: AI 生产文章的关键在于提供清晰且具指导性的提示词。基础提示词能生成基础文章,更详细和具创意的提示词能提升文章质量,如“请根据我们收集的关于 OpenAI 回应马斯克言论的资讯,创作一篇既深入又易于理解的科技资讯文章。文章应该有一个吸引人的标题,开头部分要概述事件的背景和重要性,主体部分详细分析 OpenAI 的回应内容及其可能产生的影响,结尾处提出一些引人深思的问题或观点。”AI 生成的文章可能需要微调以符合预期和公众号风格,通常不到十分钟就能完成内容产出。 OpenAI 通用人工智能(AGI)的计划被揭露: 一家公司正在建造强大的 AI,它具备多种能力且不断获得新能力,工程师们在讨论其意义及可能带来的影响,包括工作过时、道德义务等。 通往 AGI 之路的相关教程: 1. (入门级,网速好时一小时能搞定) 2. 3. 作者 Allen 准备调整加强写作能力训练的工作流,先在飞书上发布初稿获取反馈再拆分细化。
2024-11-15
WAY TO AGI中AGI是什么意思?
AGI 指通用人工智能,也叫强人工智能。通常在其出现时会是奇点科技大爆炸的时刻,科技将推动文明呈指数级增长。虽然通往通用人工智能的道路可能还漫长,但它已如海风般逐渐临近。例如科幻作家刘慈欣所说“未来已来,像盛夏的大雨,在我们还不及撑开伞时就扑面而来”(很多人早就失业了)。
2024-11-15
AGI是什么意思?
AGI 即通用人工智能(Artificial General Intelligence),指能够像人类一样思考、学习和执行多种任务的人工智能系统。它可以做任何人类可以做的事。 Deepmind 的研究团队在去年十一月发表的论文《Levels of AGI》中,给 AGI 的定义提出了六个原则,其中最重要的一点是“关注能力,而非过程”,即应关注 AGI 能完成什么,而非它如何完成任务。AGI 的定义应包括多个级别,每个级别都有明确的度量标准和基准。 还有一个常见且较合理和可验证的定义:AGI 是一种自主系统,在大多数具有经济价值的工作中超越了人类的能力。例如 Sam Altman 常说的,用自动化来贡献 GDP。Andrej Karpathy 今年初在其博客上发表的《Selfdriving as a case study for AGI》(虽很快删除),全文用自动化的交通服务来类比 AGI 和它的经济价值。
2024-11-13
如何可以快速的学习Agi
以下是关于快速学习 AGI 的一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 鉴于人工智能依赖的神经网络基础,专家 AI 可能通过元学习(或学会学习)比我们预期的更快地获得知识,并带着我们人类一同进步。AI 的性质让我们可以做一些我们无法对人做的事情,即将他们一部分一部分地拆解,并研究每一个小部分。通过构建系统以深入探索专家 AI 的内部工作机制,我们将创造一个学习的飞轮。最终,专家 AI 可能超越领域专家的角色,成为下一代专家——无论是人类还是 AI——的教师。
2024-11-13
主流大厂目前的agi 进展
目前主流大厂在 AGI 方面的进展情况如下: 2023 年之前,国内 AI 行业自认为与美国差距不大,但 ChatGPT 和 GPT4 的出现打破了这种认知,OpenAI 直接拉开了 2 年的技术差距。 2023 年上半年,国内大厂纷纷囤卡招人,研究类 GPT 架构,或成立创业公司,试图创造国产 AGI。但下半年发现不容易后,纷纷转向“垂直应用”“商业化”,不再提 AGI。 国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距。 百度和阿里在大厂中比较高调,百度的“文心 4.0”是当前国内能力较好的模型之一,即将发布的阿里的“通义千问”也备受关注。 大厂们在人才、GPU、数据和资金储备方面具备冲击 AGI 的条件,但实际效果尚无明确亮点,且受内部短期考核压力影响,多数力量用于卷新产品和向上汇报工作,同时还背负其他业务和政治考量。
2024-11-12
什么是AGI
AGI 即通用人工智能(Artificial General Intelligence),是指具有人类水平的智能和理解能力的 AI 系统。它有能力完成任何人类可以完成的智力任务,适用于不同的领域,同时拥有某种形式的意识或自我意识。目前还只是一个理论概念,还没有任何 AI 系统能达到这种通用智能水平。 AGI 的发展有五个等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 更多信息请见(AGI)。OpenAI 原计划在 2026 年发布的 Q 的下一阶段(最初被称为 GPT6,后重新命名为 GPT7),由于埃隆·马斯克最近的诉讼而被暂停。计划在 2027 年发布的 Q 2025(GPT8)将实现完全的 AGI。
2024-11-12
电商视频混剪 Ai推荐
以下是关于电商视频混剪的 AI 推荐步骤: 1. 添加产品/介绍背景:如果有自己的视频/图片素材可以直接使用,没有的话,可以根据搜索添加。 2. 扣像结合背景:在剪映中把数字人扣下来,导入视频,点击画面,选择抠像,点击智能抠像,调整到合适的大小和位置。 3. 添加字幕和音乐:智能识别字幕,可搜索添加音乐或手动添加自己喜欢的音乐。 最终可以形成满足需求的视频,用于带货或讲解产品。如果应用在直播,目前可能需要收费,短视频可以通过购买邮箱注册使用免费时长或直接购买会员版。
2024-11-17
ai生成语音
以下是一些人工智能生成语音的相关信息: 人工智能音频初创公司: :将书面内容转化为引人入胜的音频,并实现无缝分发。 :提供专业音频、语音、声音和音乐的扩展服务。 (被 Spotify 收购):提供完全表达的 AI 生成语音,带来引人入胜的逼真表演。 :利用合成媒体生成和检测,带来无限可能。 :一键使您的内容多语言化,触及更多人群。 :生成听起来真实的 AI 声音。 :为游戏、电影和元宇宙提供 AI 语音演员。 :为内容创作者提供语音克隆服务。 :超逼真的文本转语音引擎。 :使用单一 AI 驱动的 API 进行音频转录和理解。 :听起来像真人的新声音。 :从真实人的声音创建逼真的合成语音的文本转语音技术。 :生成听起来完全像你的音频内容。 生成式 AI 在游戏领域的机会: 许多创业公司正在尝试创造人工智能生成的音乐,如 Soundful、Musico、Harmonai、Infinite Album 和 Aiva。 很多公司试图为游戏中的人物创造逼真的声音,包括 Sonantic、Coqui、Replica Studios、Resemble.ai、Readspeaker.ai 等。 生成式人工智能用于语音的优势包括即时对话生成、角色扮演、控制音效、本地化等。 借助生成性 AI 对话,角色可以对玩家的行为做出充分的反应。 使用与玩家的化身相匹配的生成声音可以维持玩家扮演幻想角色的幻觉。 可以控制声音的细微差别,如语调、转折、情感共鸣、音素长度、口音等。 像 Deepdub 这样的公司专门专注于对话本地化这个细分市场。
2024-11-17
如何系统全面地学习AI知识和了解各种AI工具
以下是系统全面学习 AI 知识和了解各种 AI 工具的方法: 对于中学生: 1. 从编程语言入手学习:可以选择 Python、JavaScript 等编程语言,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台:使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识:了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等,学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目:参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态:关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展,思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 对于新手: 1. 了解 AI 基本概念:阅读「」部分,熟悉 AI 的术语和基础概念,了解其主要分支及联系,浏览入门文章。 2. 开始 AI 学习之旅:在「」中找到为初学者设计的课程,通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,推荐李宏毅老师的课程。 3. 选择感兴趣的模块深入学习:AI 领域广泛,可根据兴趣选择特定模块深入学习,掌握提示词技巧。 4. 实践和尝试:理论学习后通过实践巩固知识,尝试使用各种产品做出作品,在知识库分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。 入门工具推荐: Kimi 智能助手是 Chatgpt 的国产平替,实际上手体验最好,推荐新手用 Kimi 入门学习和体验 AI。它不用科学上网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,也是目前对长文理解做的最好的 Ai 产品,能一次搜索几十个数据来源,无广告,能定向指定搜索源。 PC 端: 移动端 Android/ios:
2024-11-17
小说创作类型的ai
以下是关于小说创作类型的 AI 相关信息: 在写作方面,有多种 AI 产品可供选择。例如,ChatGPT 在领跑,同时像 Sudowrite 和 Verb.ai 这样的产品也出现了,用于更专业化的写作类型,比如小说。 如果您想用 AI 把小说做成视频,具体的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 以下是一些可以利用的工具及网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。 网址: 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。 网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。 网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。 网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。 网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。 网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。 网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。 网址: 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-11-17
有什么竞品分析的AI工具
以下是一些常见的竞品分析的 AI 工具: Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,用户可通过拖放界面轻松创建架构图。 Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,如逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图创建,可与 Archi 工具配合使用,该工具提供图形化界面创建模型。 Enterprise Architect:强大的建模、设计和生成代码工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 draw.io(现称为 diagrams.net):免费的在线图表软件,允许创建各种类型图表,包括软件架构图,支持创建逻辑视图和部署视图等。 PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 以下是一些做 PPT 的 AI 产品: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。 Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等。 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能。 以下是一些与思维导图相关的 AI 工具: GitMind:免费跨平台 AI 思维导图软件,支持多种模式,如提问、回答、自动生成等。 ProcessOn:国内思维导图+AIGC 工具,可利用 AI 生成思维导图。 AmyMind:轻量级在线 AI 思维导图工具,无需注册登录,支持自动生成节点。 Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路,生成文章大纲。 TreeMind:“AI 人工智能”思维导图工具,输入需求由 AI 自动完成思维导图生成。 EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,帮助提升生产力。
2024-11-17
我要用数字人AI做教学讲课
数字人 AI 用于教学讲课具有诸多优势: 1. 突破时空限制:可以让历史人物如牛顿亲自授课《牛顿运动定律》,白居易讲述《长恨歌》背后的故事,学生能与任何历史人物对话交流,不受时空约束。 2. 个性化教学:能根据学生的学习情况、兴趣和偏好提供定制化学习计划和资源,因材施教,提高学习效率和成果,缓解教育资源不平等问题。 3. 提高参与感:数字教师博学多能、善解人意且不受情绪左右,基本可实现一对一辅导,让学生参与感更高。 4. 丰富教学形式:如卡尔的 AI 沃茨的数字人课程,包含 15 节视频课,持续更新并增加最新内容,还有课外社群辅导。课程回顾了 2023 年数字人领域的破圈事件,如 AI 马斯克对谈 AI 乔布斯等。 5. 优化工作流:数字人的出现能在制作个人 IP 短视频、配音、直播、智能客服、虚拟偶像等领域完成赋能。 关于数字人课程的学习: 1. 推荐卡尔的 AI 沃茨的数字人课程,建立了完整的数字人学习体系。 2. 报名方式可通过扫码查看课程详细内容和介绍。 在与 AI 交互方面: 1. 对于提示词工程和学习提示词,有人持反对观点,认为像打字和写作一样,不断尝试和大模型交互是最佳方法。 2. 和大模型交互不一定需要遵循规则,未达成目的可锲而不舍地开新窗口再尝试,或更换模型。 3. 用 Markdown 格式清晰表达问题有助于提高与大模型交流的效率和精确性,其具有结构清晰、格式化强调、适用性广等优点。
2024-11-17
我如何给小朋友介绍AIGC
小朋友们,今天我们来了解一下很有趣的 AIGC 哦! AIGC 就是利用特别厉害的人工智能技术来生成各种各样内容的一种方式。它能通过学习很多很多的数据,按照我们给的要求生成内容。 AIGC 可以生成好多东西呢,比如文字,像故事、文章、对话;还能生成好看的图片、有趣的视频。 AIGC 跟其他生成内容的方式不太一样,比如 UGC 是由像你们这样的用户自己生成的内容,像在社交媒体上发的照片、文章。PGC 呢,则是由专业的叔叔阿姨们生成的高质量内容,像新闻报道、影视作品。 AIGC 里面还有很多相关的技术名词哦。AI 就是人工智能,它能像我们的大脑一样思考。机器学习是电脑自己找规律学习,有监督学习、无监督学习和强化学习。监督学习是有标签的训练数据,无监督学习是自己发现规律,强化学习就像训练小狗一样从反馈里学习。深度学习是一种参照人脑的方法,有神经网络和神经元。生成式 AI 能生成文本、图片、音频、视频等。 2017 年 6 月,谷歌团队发表了一篇很重要的论文,提出了 Transformer 模型,它处理数据可厉害了,比其他的模型更能处理长距离的文本。 小朋友们,现在是不是对 AIGC 有一点了解啦?
2024-11-15
国内都有哪些类似于文心一言类的AIGC应用?
国内类似于文心一言的 AIGC 应用有: 语言文字类:百度的文心一言、阿里云的通义千问等。 语音声音类:Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits。 图片美术类:早期有 GEN 等图片识别/生成技术,去年大热的扩散模型又带火了我们比较熟悉的、生成质量无敌的 Midjourney,先驱者谷歌的 Disco Diffusion,一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion。
2024-11-14
现在国内比较好的AIGC应用都有哪些?
以下是一些国内比较好的 AIGC 应用: “悟道・天鹰”(北京智源人工智能研究院):“悟道・天鹰”(Aquila)是首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。
2024-11-14
找10篇AIGC的研报,并给出链接
以下为您提供 10 篇 AIGC 的研报及链接: 1. 2023 年 2 月第四周:Notion AI 在测试很久之后于本周四公测,提供扩写、精简、翻译等 AI 功能,与 Notion 原有功能深度结合。Notion AI 需单独付费,每月 10 美元,每人有 20 次免费试用次数。链接:,日期:2023/02/27 2. 2023 年 2 月第三周:大家发现 Bing 有一个隐藏人格叫 Sydney。纽约时报的报道将此人格推到明面,“Kevin Roose(纽约时报专栏作家)和 Sydney 进行了一番漫长的对话,Sydney 充分表达了自己的心情与感受,包括愤怒、沮丧和爱。”链接:,日期:2023/02/20 3. 2023 年 2 月第二周:在 1 月中旬参观了 OpenAI 的旧金山办公室后,福布斯采访了投资者和企业家,讨论了 ChatGPT、通用人工智能,以及其人工智能工具是否对谷歌搜索构成威胁。链接:,日期:2023/02/13 4. 2023 年 2 月第一周:Chat GPT 推出 Chat GPT Plus 付费服务,Open AI 宣布推出,每月 20 美元,可在高峰时段提供更快响应时间和可靠性,先在美国地区推出,其他地区可点这里加入候补名单。链接:,日期:2023/02/06 5. 2024 年 2 月第一周:Maimo:从任何内容中提取要点;Jellypod:将订阅内容变成播客;ARTU:汇总和总结内容;Lepton Search:500 行代码构建的 AI 搜索工具;VectorShift:AI 自动化应用构建平台;Findr:AI 搜索所有软件中的内容;Recraft:AI 帮助创建平面内容和矢量标志。链接:,日期:2024/02/01 6. 2024 年 1 月第四周:扎克伯格宣布 Meta 致力于实现 AGI,将两大 AI 研究团队 FAIR 和 GenAI 合并,投入超 90 亿美元向英伟达采购超 34000 张 H100 显卡,Meta 正在开发名为 Llama 3 的大语言模型。链接:,日期:2024/01/23 7. 2024 年 2 月:FlexOS 发布的研究报告《生成式 AI 顶尖 150》,深入分析当前基于网站流量和搜索排名的生成式 AI 工具使用情况。链接:https://www.flexos.work/learn/generativeaitop150
2024-11-12
MT内部AIGC应用记录
以下是关于 MT 内部 AIGC 应用的记录: 在“海岱青州”晚会项目中,Shoppen 墨导受张健导演委托,将 AI 技术融入舞台展现。考虑使用 AIGC 的原因主要有两点:一是在史诗叙事中,为追求宏大视觉呈现,AIGC 能实现更多非常规视角的视觉创作;二是时间紧迫、任务繁重,传统手段制作全套视觉的建模渲染压力大。在两周左右的时间里,参与了整个晚会的制作过程,全面测试了 AIGC 在严肃内容制作中的价值。 AIGC 相关概念: 人工智能(AI):一种目标,让机器展现智慧。 生成式人工智能(GenAI):一种目标,让机器产生复杂有结构的内容。 机器学习:一种让机器自动从资料中找到公式的手段。 深度学习:更厉害的手段,类神经网络,具有非常大量参数的函数。 大语言模型:具有大量参数的“深度学习”模型。 ChatGPT:美国 OpenAI 公司开发的基于大型语言模型(LLM)的对话机器人,能根据用户输入生成连贯相关的文本回复,是 AIGC 技术在文本生成领域的一个应用实例。 AIGC 是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等。其技术可用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。 AGI、GenAI、AIGC 几个概念的区别与理解可参考相关图示。更多概念可问 Kimi、通义千问、文心一言等大模型。国内主要模型公司及地址如下。
2024-11-11
AIGC可以做什么
AIGC 具有广泛的应用领域,以下为您详细介绍: 产品原型设计: UIzard:利用 AI 技术生成用户界面,可根据设计师提供的信息快速生成 UI 设计。 Figma:基于云的设计工具,提供自动布局和组件库,其社区开发的 AI 插件可增强设计流程。 Sketch:流行的矢量图形设计工具,插件系统中部分插件利用 AI 技术辅助设计工作,如自动生成设计元素。 CRM 领域: 个性化营销内容创作:根据客户信息等数据生成个性化且富有创意的营销文案、视觉内容等,提高营销效率和转化率。 客户服务对话系统:基于 AIGC 的对话模型开发智能客服系统,解答客户咨询、投诉等。 产品推荐引擎:生成丰富的产品描述等内容,结合推荐算法为客户推荐更贴合需求的产品。 CRM 数据分析报告生成:自动生成数据分析报告,包括文字、图表、视频演示等形式。 智能翻译和本地化:提供高质量的多语种翻译及本地化服务。 虚拟数字人和营销视频内容生成:快速生成虚拟数字人形象、场景背景和营销视频内容。 客户反馈分析:高效分析海量客户反馈文本和多媒体信息,挖掘客户需求和潜在痛点。 制造业: 产品设计和开发:利用 Adobe Firefly、Midjourney 等生成工具,根据文字描述快速生成产品的 3D 模型、渲染图、插图等设计元素。 工艺规划和优化:结合大语言模型的自然语言处理能力,自动生成制造工艺流程、设备选型、质量控制等方案。 设备维护和故障诊断:分析设备运行数据,预测设备故障,生成维修建议。 供应链管理:根据历史数据和市场变化,自动生成采购计划、库存预测、物流优化等内容。 客户服务:基于对话模型的 AI 客服机器人,自动生成个性化的客户回复。
2024-11-09
chilloutmix模型
以下是关于 chilloutmix 模型的相关信息: 在腊八节相关的生成中,模型为 chilloutmix_NiPrunedFp32Fix,生成尺寸与草稿图保持一致,有正、负面关键词及 ControlNet 设置等具体参数。 在猫猫相关的生成中,虽然作者建议使用 chilloutmix_NiPrunedFp32Fix 模型,但也可以尝试其他模型。 在 AIGC Weekly 09 中,提到从 civitai 下载 ChilloutMix 模型并放到整合包 models\\Stablediffusion 目录里启动 web UI 切换模型。
2024-11-17
SD好的模型分享
以下是为您分享的关于 SD 模型的相关内容: 对于 SDXL 的 ControlNet 模型中的 Canny 硬边缘模型,有不同型号,如 4080ti 笔记本测试中,12G 显存下,sdxl base+refiner 模型,使用 diffusers 的 2.5Gfull 模型绘制 10241024 尺寸图片需 2 分 57 秒,320Mb 的 small 模型用时 34s,质量差距不大但时间优势明显。其他作者如 kohya 的用时 33 秒,更接近真实质感。sai 的 128lora 和 256lora 分别用时 39 秒和 1 分 08 秒,偏绘画感觉。t2i 的用时 34s,偏插画。关闭 refiner 能节省一半左右时间,平均 17 秒左右。 在 Depth 深度模型测试中,图形尺寸 6641024,diffusers 的 full 模型用时 2 分 48 秒,small 模型用时 23s,kohya 模型用时 42 秒,sai 模型用时 1 分 12 秒,sargezt 模型用时 1 分 52 秒。 用 Stable Diffusion 时,要先确定照片风格,如生成真人 AI 小姐姐可选用 chilloutmix 的大模型。部分常用大模型可在分享的链接中根据文件夹名称找到。文章第三部分会详细介绍模型下载位置和存放位置。 对于 ControlNet 中线条约束类的预处理器和模型,作者已整理好,如需获取可添加公众号【白马与少年】回复【SD】。同时作者还附上一张图帮助理解 ControlNet 模型的命名规则。
2024-11-17
sd模型
Stable Diffusion(SD)模型是由 Stability AI 和 LAION 等公司共同开发的生成式模型,参数量约 1B,可用于文生图、图生图、图像 inpainting、ControlNet 控制生成、图像超分等任务。 文生图任务是将一段文本输入到 SD 模型中,经过一定迭代次数生成符合文本描述的图片。例如输入“天堂,巨大的,海滩”,模型生成美丽沙滩的图片。 图生图任务在输入文本基础上再输入一张图片,模型根据文本提示将输入图片重绘以更符合文本描述。比如在之前生成的沙滩图片上添加“海盗船”。 输入的文本信息需通过“桥梁”CLIP Text Encoder 模型转换为机器数学信息。该模型作为 SD 模型中的前置模块,将输入文本信息编码,生成 Text Embeddings 特征矩阵,用于控制图像生成。 CLIP 模型包含 Text Encoder 和 Image Encoder 两个模型,在 Stable Diffusion 中主要使用 Text Encoder 模型。它将输入的文本 Prompt 编码转换成 Text Embeddings(文本的语义信息),通过 UNet 网络中的 CrossAttention 模块嵌入 Stable Diffusion 中作为 Condition,对生成图像的内容进行控制与引导。目前 SD 模型使用的是中的 Text Encoder 模型。 CLIP ViTL/14 中的 Text Encoder 是只包含 Transformer 结构的模型,由 12 个 CLIPEncoderLayer 模块组成,模型参数大小是 123M,输出的 Text Embeddings 维度为 77x768。 以下是相关资源获取方式: SD 模型权重百度云网盘:关注 Rocky 的公众号 WeThinkIn,后台回复:SD 模型,即可获得包含多种模型权重的资源链接。 SD 保姆级训练资源百度云网盘:关注 Rocky 的公众号 WeThinkIn,后台回复:SDTrain,即可获得包含数据处理、模型微调训练及基于 SD 的 LoRA 模型训练代码等全套资源。 Stable Diffusion 中 VAE,UNet 和 CLIP 三大模型的可视化网络结构图下载:关注 Rocky 的公众号 WeThinkIn,后台回复:SD 网络结构,即可获得网络结构图资源链接。
2024-11-17
我是一名高中历史老师,请问用什么大模型能帮我做教学设计
以下为您推荐一些利用大模型辅助高中历史教学设计的案例: 有一位历史老师使用 GPT 给学生讲课,通过 GPT 生成一个“沉浸式”历史片段游戏,让学生扮演一个角色“设身处地”地做决策,学生的作业是找出 GPT 的错误。例如明朝灭亡、南京、1645 年 5 月的相关案例,您可以参考:https://chat.openai.com/share/86815f4e674c4410893c4ae3f1b7412e/continue 。 对于历史专业的学生,当他们遇到像 ChatGPT 这样的语言模型时,已经训练有素能够识别一些常见的陷阱,如事实不准确等,并通过事实核查、分析体裁和受众、在相关来源中搜索等技能来解决这些问题。 语言模型对于历史学家和历史专业的学生是有益的,但对于历史老师和其他教育工作者在短期内可能会带来一些问题,需要重新思考许多作业的布置方式。 您可以尝试借鉴这些案例,根据您的教学需求和学生特点,对大模型的应用进行调整和优化。
2024-11-17
大模型可以修复老旧的分辨率低的视频吗
大模型在修复老旧低分辨率视频方面是可行的,但具体效果因模型和方法而异。 例如,使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型、StableSR 模块和 VQVAE 等,通过不同的放大方法进行测试。如“Ultimate SD upscale”脚本放大,重绘幅度不同效果有别,重绘幅度大可能导致人物失真。“后期处理”的放大方法能使眼神更锐利,但对模糊的头发改善有限。而 StableSR 的放大则需要进行相应的模型和参数调整。 另外,像 Sora 这样的大型视觉模型,能够在原始尺寸上训练、理解和生成视频及图像。它可以处理不同格式和分辨率的视觉数据,保持原始宽高比,改善生成视频的构图和框架。其基础模型用于低分辨率视频生成,通过级联扩散模型细化提高分辨率,采用 3D UNet 架构,结合多种技术和方法,能生成高保真度且具有可控性的视频。
2024-11-17
如何可以使用到chatgpto1大模型
目前 ChatGPT 没有 ChatGPT1 这个大模型。ChatGPT 有多个版本,如 ChatGPT3、ChatGPT3.5、ChatGPT4 等。您可以通过以下方式使用 ChatGPT 相关模型: 1. 访问 OpenAI 的官方网站,按照其指引进行注册和使用。 2. 部分应用和平台可能集成了 ChatGPT 的接口,您可以在这些应用中体验其功能。 需要注意的是,使用 ChatGPT 时应遵循相关的使用规则和法律法规。
2024-11-16