Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI、AIGC、大模型这三者之间有什么关系

Answer

AI(人工智能)是一种让机器展现智慧的目标。AIGC(人工智能生成内容)是利用人工智能技术生成包括文本、图像、音频和视频等内容的新型生产方式。大模型如大语言模型(LLM)是具有大量参数的“深度学习”模型。

生成式 AI 是一种让机器产生复杂有结构内容的目标。机器学习是让机器自动从资料中找公式的手段,深度学习是更厉害的类神经网络且有大量参数的手段。

AIGC 技术可用于多种应用,如自动撰写新闻文章、生成艺术画作等。ChatGPT 是 AIGC 技术在文本生成领域的一个应用实例,它是基于大型语言模型(LLM)的对话机器人,能根据用户输入生成连贯且相关的文本回复。

2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,不依赖循环神经网络(RNN)或卷积神经网络(CNN)。

Content generated by AI large model, please carefully verify (powered by aily)

References

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。

快速学习 AIGC,有料通俗易懂版!

人工智能:一种目标,让机器展现智慧,Artificial Intelligence,简称AI生成式人工智能GenAI:一种目标,让机器产生复杂有结构的内容,Generative AI简称GenAI机器学习:一种手段,让机器自动从资料中找到公式深度学习:一种更厉害的手段,类神经网络-非常大量参数的函数大语言模型:是一类具有大量参数的“深度学习”模型,Large Language Models,简称LLMsChatGPT:一个应用实例,形象比喻:通过投喂大量资料预训练后,ChatGPT会通过聊天玩“文字接龙游戏”了。英文解释:Chat聊天,G:Generative生成,P:Pre-trained预训练,T:Transformer类神经网络模型以上概念之间的关系如下图:AIGC(Artificial Intelligence Generated Content,人工智能生成内容)是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。AIGC技术可以用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。ChatGPT是AIGC技术的一个应用实例,它代表了AIGC在文本生成领域的进展。ChatGPT是美国OpenAI公司开发的一款基于大型语言模型(Large Language Model,简称LLM)的对话机器人,它能够根据用户的输入生成连贯且相关的文本回复。用户界面如下:AGI、GenAI、AIGC几个概念的区别与理解可参考下图:更多概念可问Kimi、通义千问、文心一言等大模型,也可以继续往下看,会逐步讲解更多概念。国内主要模型公司及地址如下:

Others are asking
我是一个纯小白如何学习AI具体罗列一个过程
以下是为纯小白学习 AI 罗列的一个过程: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库查看大家实践后的作品、文章分享,并分享自己实践后的成果。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 另外,对于中学生学习 AI,建议: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 需要注意的是,以上内容部分由 AI 大模型生成,请仔细甄别。同时,像《雪梅 May 的 AI 学习日记》中提到的,如果您是纯小白,还可以参考其学习模式,即输入→模仿→自发创造,并且根据自己的时间和兴趣进行学习,学习资源大多是免费开源的。
2025-03-14
有没有ai调色的大模型
以下为您介绍一些有关 AI 调色的大模型: 1. 在最近新上线的 controlnet 模型中,新增了名为 Recolor 的模型,可将黑白图片重新上色。在处理人物照片还原时,可选择 realisian 的写实大模型,通过提示词描述颜色和对应内容。ControlNet 选择 Recolor 时,预处理器选择“recolor_luminance”效果较好。 2. 星流一站式 AI 设计工具的基础模型中,允许使用更多的微调大模型,如基础模型 F.1、基础模型 XL、基础模型 1.5 等。同时,还具有高清分辨率修复、脸部/手部修复等功能,以及多种参数如采样器、采样步数、随机种子、CFG Scale 等可调整。 3. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。处理复杂照片时,可放弃人物服装颜色指定,只给场景方向,如加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,通过简单关键词控制色调。
2025-03-14
有什么ai学习的最新资讯么
以下是关于 AI 学习的最新资讯: WaytoAGI(通往 AGI 之路)是一个致力于人工智能学习的中文知识库和社区平台。它为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。在没有任何推广的情况下,一年时间已有超过 100 万用户和超千万次的访问量。目前合作过的公司/产品包括阿里云、通义千问、淘宝、智谱等众多知名企业和产品。 3 月 4 日的 AI 资讯: 【AI 3D】Meshcapade 预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝;InsTaG 通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果;3DMem 为新型 3D 场景记忆框架。 【AI 绘图】智谱开源 AI 绘图 CogView4,可在图像中生成中文字符;海螺推出 Image01 多功能文本转图像模型。 【AI 视频】Runway 被网友爆料内测能力可根据参考图像进行 Video to Video 视频风格化;Vidu 的 API 开放平台全面开放。 【AI 模型】Google Colab 推出 Data Science Agent;微软为医疗行业提供首个统一语音 AI 助手 Dragon Copilot;Opera 宣布推出网页浏览器的 AI 代理。 对于新手学习 AI,建议持续学习和跟进,AI 是快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。
2025-03-14
AI应用开发平台哪个最牛?
目前在 AI 应用开发平台方面,百度智能云表现较为出色。 IDC 发布的报告显示,在战略领先、数据集成、模型调优、模型部署、加速计算能力、工程化能力、平台生态、用户体验 7 大评估项目中,百度智能云获得七项满分,位于所有大模型平台厂商第一名。 百度智能云在 IaaS 层,其百舸 AI 异构计算平台解决大模型应用中的算力问题,提供从集群创建到模型训练、推理的完整算力管理方案,显著提升算力管理能力和模型训练效率。在 Paas 层,千帆大模型平台解决大模型的调用、开发和应用开发问题,支持调用文心大模型全系列模型,还提供全面的工具链,支持定制化的模型开发。在 SaaS 层,提供丰富的常用应用供客户选择。 此外,像美团外卖配送系统、猎聘 APP、链家 APP 等也是在各自领域利用 AI 技术取得良好效果的应用。 在智能体开发平台方面,字节的扣子和腾讯的元器受到关注。扣子主要用于开发下一代 AI 聊天机器人,国内也有像 Dify.AI 等智能体开发平台。
2025-03-14
AI生成PPT好用的工具,平台?
以下是一些好用的 AI 生成 PPT 的工具和平台: 1. 讯飞智文:https://zhiwen.xfyun.cn/ 2. Mindshow:https://www.mindshow.fun/ 3. Kimi.ai:http://kimi.ai ,选 PPT 助手暂时免费效果好 4. Tome.app:http://Tome.app ,AI 配图效果好 5. Chatppt.com:自动化程度高 6. Gamma:https://gamma.app/ 7. 美图 AI PPT:https://www.xdesign.com/ppt/ AI 辅助 PPT 的原理和作用包括: 1. 减轻排版工作的压力。 2. 生成打底的内容,减轻人写内容的工作。比如文章生成 PPT,让 AI 帮忙摘要内容,生成大纲列表;主题生成 PPT,让 AI 根据主题扩充成大纲列表,乃至具体内容。在特定的场景下不用改直接用,如学生快速为小组展示配 PPT。 网站把 AI 输出的文本丢给 LLM,让它根据内容,在已有的 UI 组件中选择更适合的组件。按时间线,每页 PPT 的文字,选出整个 PPT 中,每一页的 UI 组件。有的网站,如 tome、gamma,配图也是由 GenAI 根据页面内容生成的。呈现 AI 生成的 PPT 结果,用户不满意可以自行选择模版。 扩展阅读: 1. 《》 2. 《》 需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2025-03-14
AI海报生成
以下是一些常见的 AI 海报生成工具和相关教程: 1. Canva(可画):https://www.canva.cn/ 这是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,用户通过简单拖放操作即可创建海报,其 AI 功能可帮助选择合适颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ 这是一个简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,简化设计流程。 此外,还有即梦的女神节海报生成教程: 1. 原文链接:https://mp.weixin.qq.com/s/CYmlZDPjrchnKr8V4lvmRQ 2. 操作步骤: 第一步:打开即梦 AI,选择“图片生成”功能,https://jimeng.jianying.com 第二步:模型选择图片 2.1,输入提示词(可以直接参考案例提示词)。 第三步:点击生成,几秒钟后,专属字体海报就完成啦! 3. 海报案例: 案例一:提示词:女神节主题,3D 设计,梦幻氛围,明亮春天场景,花田,数字 38,天空“女神节”,五彩缤纷的蝴蝶,晴朗的蓝天,茂密的绿色草地,盛开的花朵,柔和光线 案例二:提示词:粉色主题,梦幻氛围,数字 38,心形气球,花卉装饰,玫瑰花,漂浮的花瓣,柔和的云朵,美丽的湖面倒影,奇幻风格,柔和的色调,庆祝场景 案例三:提示词:妇女节,3D 设计,粉色主题,大号装饰数字 38,爱心,郁金香花朵,柔和光照,背景城市天际线,精致花卉装饰,优雅节日氛围,金色文字,春天氛围,细致鲜艳 内容由 AI 大模型生成,请仔细甄别。
2025-03-14
AI应用赛道中top应用介绍,实现的功能和应用场景,产品Launch时间:AIGC功能 Launch时间、当前月活用户数、营收利润、一年成本投入、市场占有率、目前融资金额及估值、创始团队介绍、公司员工规模、所属国家、用户来源、用户来自于哪些国家、用户profile、转化率、ROI等等, 盈利模式,优劣势与未来发展趋势。
以下是关于 AI 应用赛道的相关介绍: 应用场景:涵盖医疗、制造业、金融风控、消费端个性化服务、办公、农业、能源优化、娱乐等领域。 关键技术: 1. 包括大语言模型作为中枢神经系统,记忆模块实现长期和短期记忆,以及规划能力中的目标设定、任务拆解、生成策略、执行与反馈、资源管理和多智能体协同。 2. 强化学习用于环境感知和决策调整,多模态融合涉及多种数据类型,低成本训练是考虑成本的重要因素。 智能体特征:包括自主性、交互性和适应性,如通过自我对弈和博弈不断进化,在金融风控领域利用大量数据提升准确率。 AI 技术路线:从有语言能力的 AI 到有推理能力,再到能使用工具、发明创新以及形成组织,共五级。 智能体框架类型:分为任务驱动型、多智能体协作、强化学习型、具身智能体、应用型智能体,每种类型都有代表性框架。 智能体与大模型的关系:大模型是中枢和基石,智能体是行动引擎,两者协同演进,智能体产生的数据可反哺大模型。 未来趋势:智能体可能在中小企业中更具效益,人机协作中人类成为监督角色,但存在算力成本、伦理风险、技术瓶颈等挑战。 B 端变现与创业方向: 1. B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。 2. 自媒体创业:视频号等平台尚有蓝海空间,需具备内容创新和差异化,内容成本低且更新迭代快。 3. 游戏创业:个人或团队可做轻量化游戏,结合 AI 技术,满足放松和社交需求,专注垂类赛道,避免与大厂竞争。 4. 影视创业:25 年将是拐点,更多内容会采用 AI 技术,如哪吒 2 因前期规划未用 AI 技术。 5. 广告营销创业:重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: 1. 创业难点:创业对创业者综合能力要求极高,找到志同道合且能力互补的战友是创业前期最难的事。 2. AI 虚拟人发展:从早期以首位为核心的宅文化虚拟偶像,到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人,其发展历程不断演进。 3. 虚拟人产业链:包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。 4. 未来创业机遇:AI 虚拟人是未来 310 年 Web 3.0 的风口,提前布局未来有潜力的赛道,准备好迎接机遇。 相关案例和产品信息: 1. 10 月 26 日,AI 翻译和口型匹配技术在视频制作中的应用逐渐流行,公司如 Captions、HeyGen 和 Verbalate 通过 AI 生成字幕、配音和口型匹配等功能,帮助用户轻松实现视频翻译本地化。 2. 10 月 25 日,Perplexity 最新估值约为 5 亿美元,较 3 月宣布的 1.5 亿美元估值上涨 300%以上,当前的付费用户数量达到了 1.5 万人,截止本月,Perplexity 的 ARR 达到 300 万美元,最新估值约为 ARR 的 150 倍。 3. 《100 个有意思的 AI 应用》由国盛证券出品,分为基于 LLM 自然语言能力的对话、写作、阅读、分析等应用;多模态技术持续发展,图像、视频、音频、3D 等 AIGC 应用;企业级应用等。
2025-03-14
AIGC是什么意思
AIGC 是 AI generated content 的缩写,又称为生成式 AI,指利用人工智能技术生成的内容,例如 AI 文本续写、文字转图像的 AI 图、AI 主持人等。 AIGC 工具通常使用机器学习算法,以自然语言处理为基础,分析大型文本数据集,并学习如何生成风格和语气相似的新内容。其应用领域广泛,包括内容创作、广告、媒体等。 能进行 AIGC 的产品项目和媒介众多。语言文字类有 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等;语音声音类有 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等;图片美术类有早期的 GEN 等图片识别/生成技术,去年大热的扩散模型又带火了 Midjourney、谷歌的 Disco Diffusion、OpenAI 的 Dalle·2 以及 stability ai 和 runaway 共同推出的 Stable Diffusion 等。 AIGC、UGC(普通用户生产)和 PGC(专业用户生产)都是内容生成的不同方式。AIGC 由人工智能生成内容,可快速大规模生成,适用于自动化新闻、广告创作等;UGC 由用户生成,内容丰富多样,适用于社交媒体、社区论坛等;PGC 由专业人士或机构生成,内容质量高、专业性强,适用于新闻媒体、专业网站等。 在国内,AIGC 主要在《网络安全法》《数据安全法》《个人信息保护法》的框架下,由《互联网信息服务算法推荐管理规定》《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《科技伦理审查办法(试行)》共同监管。
2025-03-13
教育行业有那些基于aigc的业务实际落地的产品和案例?
以下是教育行业基于 AIGC 的一些业务实际落地的产品和案例: 教师的 AI 减负指南生成式人工智能在教学中的应用,包括教师使用 AI 的小技巧。涉及人员有张亚丽、富露露、张亚玲、张楚璇、吴箭枢等,学校有深圳大学附属中学、苏州工业园区娄葑学校、上海市静安区风华初级中学南校、江苏省苏州工业园区教师发展中心中学、苏州工业园区唯亭学校初中、中央民族大学附属中学等。 AIGC 人机协同国家课程项目化学科实践设计与实施,例如以科学《计量时间博物展》为例,以及基于思维可视化的项目式主题学习设计与实践,如以智驾未来课程为例。相关人员有祝琛、崔琴、张然、刘敏、王国庆、吴沁珂等,学校有深圳市南方科技大学教育集团实验二小、成都经济技术开发区实验小学校。 Al 创作家:用 AI 辅助设计桌游,解决学校实际问题,如北京市新英才学校的魏一然所做的工作。 生成式人工智能与教学变革:AI 领雁行动的探索与实践,相关人员有邹贤莲、向雪萍、陈治佑、余初冉、阊洪娇,学校有重庆两江新区行远小学校。 北京市新英才学校的跨学科项目老师带着学生用 AIGC 做学校地图桌游,英语老师在 AIGC 的帮助下备课和授课,生物和信息科技老师合作一起带着学生用训练 AI 模型,用以识别植物。 AIGC 常见名词解释,如 AIGC 意为人工智能生成内容,能进行 AIGC 的产品项目和媒介众多,包括语言文字类的 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等,语音声音类的 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等,图片美术类的 Midjourney、Stable Diffusion 等。
2025-03-13
如何利用aigc生成高质量的logo?
利用 AIGC 生成高质量的 logo 可以参考以下方法: 1. 在 AIGC 1.0 时代,AIGC 主要起到产生参考图像的作用,可使用 ControlNet 但存在一定局限性,如无法精确控制某些特征材质,不过适合整体全身材质风格替换,能以正视图或手绘线稿图输入 ControlNet 进行控制。 2. 在 AIGC 2.0 时代,基于 Stable diffusion 的 Lora 模型训练可直出较高质量的形象,但对于要求较高的场景仍存在问题,如四肢比例失调、手指数量错误等,随着技术更新有望解决。 3. 可以使用 Midjourney 等生成式 AI 工具为企业创建徽标,将相关提示与企业信息结合,制作适合自身品牌个性和价值观的定制徽标,提示种类丰富并提供设计样例。 同时需要注意,目前的 AIGC 工具仍存在问题,真正的完美落地仍需要专业设计师的大量介入与修复。拥抱 AIGC 是为设计师提供辅助工具,而非完全取代传统设计方法或设计师。
2025-03-13
当前国内有哪些AIGC应用
当前国内的 AIGC 应用主要有以下一些: 语言文本生成类: “悟道・天鹰”(北京智源人工智能研究院):首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。 文心一言(百度):大语言模型,可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。
2025-03-12
aigc 教程
以下为您提供一些 AIGC 教程相关的内容: 1. 2024 AIGC 营销视频生态创新大赛: 10 月 19 日:EM7,南柒() 10 月 23 日:从构思到可视化——AI 脚本与分镜创作(),嘉宾为娜乌斯嘉,是 AI 绘画知名 UP 主、全网粉丝 20w、国内首批 AIGC 应用研究先驱者、模型师、comfyUI 工程师、动画艺术和心理学双硕士。 11 月 01 日:AIGC 制作商业片进阶教程( 11 月 7 日:AIGC 电影化叙事实战教程,嘉宾为 Joey,是莫奈丽莎工作室主理人、上影全球 AI 电影马拉松大赛最佳叙事奖导演、可灵星芒 AIGC 短剧获奖导演、资深创意广告人。 总奖金池百万元,机会就在眼前,准备好您的创意来瓜分百万奖池。 2. AIGC 电影化叙事实战教程: 第三部分:AIGC 电影化的快速技巧 分镜头脚本制作 GPTs:以 2024 AIGC 营销视频生态创新大赛的冰工厂赛道为例。 生图及生视频提示词制作 GPTs 音乐提示词制作 GPTs:参考 prompt 为请帮我制作一首短剧结尾部分转折的纯音乐背景音乐,内容是孙悟空中了圈套,被带上闪电禁锢,落入陷阱,坠入悬崖失去踪迹,希望风格新颖,带有电影感,时长 30s。参考给到的 prompt:Experimental oriental electronica, Intense suspense, Background music, BPM65, Thunderous crashes, Rapid descending synths。调整歌曲快慢技巧:修改 BPM,值越高节奏越快。 3. 上海国际 AIGC 大赛第三名—《嘉定汇龙》复盘: 由咖菲猫咪和三思完成。三思是中国做 stable diffusion 艺术字的高手,具体教程可在 WaytoAGI 查看。核心是让 AI 根据提供的框架生成对应的艺术形态,根据地名特色产业,找寻或炼制 lora,有的用即梦的通用模型生成。 用一镜到底完成全片内容和思想的浓缩,通过空中俯拍嘉定的古老街景呈现历史厚重感,转向现代都市繁荣景象,以 AI 生成的未来场景结尾。 音乐选择为开头增色,从古风音乐到现代电子乐的转换与画面切换契合。 开场部分结合应用了 comfyui 转绘、steerablemotion、runway 文生视频、图生视频等多种 AI 技术,最后通过合成剪辑拼合。 多人在线工作流:十个人的小组,素未谋面却要完成高度协同工作。
2025-03-11
Transformer模型
Transformer 模型是一种基于注意力机制的深度学习模型,由 Vaswani 等人在论文《Attention is All You Need》中提出,用于处理序列到序列的任务,如机器翻译、文本摘要等。其原理主要包括以下几个关键点: 1. 自注意力机制:能够同时考虑输入序列中所有位置的信息,而非像循环神经网络或卷积神经网络一样逐个位置处理。通过自注意力机制,模型可根据输入序列中不同位置的重要程度,动态分配注意力权重,从而更好地捕捉序列中的关系和依赖。 2. 位置编码:由于自注意力机制不考虑输入序列的位置信息,为使模型能够区分不同位置的词语,Transformer 模型引入了位置编码。位置编码是一种特殊的向量,与输入词向量相加,用于表示词语在序列中的位置信息。位置编码通常基于正弦和余弦函数计算得到的固定向量,可帮助模型学习到位置信息的表示。 3. 多头注意力机制:通过引入多头注意力机制,可以并行地学习多个注意力表示,从不同的子空间中学习不同的特征表示。每个注意力头都是通过将输入序列线性变换成查询、键和值向量,并计算注意力分数,然后将多个头的输出拼接在一起得到最终的注意力表示。 4. 残差连接和层归一化:在每个子层(SelfAttention 层和前馈神经网络层)的输入和输出之间都引入了残差连接,并对输出进行层归一化。残差连接可缓解梯度消失和梯度爆炸问题,使得模型更容易训练和优化;层归一化可加速训练过程,并提高模型的泛化能力。 5. 位置感知前馈网络:在每个注意力子层之后,Transformer 模型还包含了位置感知前馈网络,它是一个两层的全连接前馈神经网络,用于对注意力表示进行非线性转换和映射。位置感知前馈网络在每个位置独立地进行计算,提高了模型的并行性和计算效率。 Transformer 模型主要由两大部分组成:编码器和解码器。每个部分都是由多个相同的层堆叠而成,每层包含了多头注意力机制和位置全连接前馈网络。 编码器可以理解为将自然语言转换成向量文本,以模型内的既有参数表示。这些参数包含了原始信息,同时也融合了序列内元素间的相互关系。例如,输入“我喜欢猫”,将自然语言转换成词嵌入向量:我>,经过自注意力机制,输出编码器输出一个序列的向量,表示对输入句子的理解。 解码器基于编码器的输出和之前生成的输出逐步生成目标序列,也就是把向量文本重新转化成自然语言。例如,目标生成中文句子“我喜欢猫”,初始输入为解码器接收一个开始符号,用,对应“猫”。这是一个简单的复现概念,当模型得到匹配度高的参数时,它就会一个词一个词地判断需要输出的语言文本。
2025-03-14
大模型如何在企业里应用
大模型在企业中的应用主要体现在以下几个方面: 1. 智能终端行业:中国超半数手机厂商如三星、荣耀、vivo、OPPO、小米等主流品牌,以及上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 2. 百度表现:在主流大模型厂商中,百度表现突出,拿下最关键的中标项目数量、中标金额两项第一。其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。百度智能云的增长主要由互联网、教育、金融等行业对模型训练和推理的高需求带动。 3. 落地所需能力:企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。这意味着大模型落地赋能企业智能化时,能力比拼从单项变为全能比拼。 然而,大模型在企业落地应用中面临一些问题和挑战: 1. 竞争格局:大模型是典型赢家通吃领域,胜出的大模型在中国和世界范围内都很难超过 2 个,巨头在资金、技术和数据方面具有优势,给创业公司的机会很少。 2. 落地难题:如何将大模型更快落地应用,将技术能力释放并与更多场景相结合,真正产生新一轮科技革命和产业变革,是当前紧要的关键问题。 3. 具体问题: 提高内容可信:需要通过商业交付去应用、反馈和评测,不断优化数据以解决实际应用问题,走向垂直化以提高内容精准度。 解决算力成本高、训练重复和资源紧缺:以 GPT3 模型为例,训练成本高昂,且目前仍无法用商业化的国产芯片进行大模型训练。 解决大模型落地问题,主要有以下三方面:提高内容可信;解决算力成本高、训练重复和资源紧缺的问题;降低大模型价格或使用垂直领域模型落地。
2025-03-14
大模型和智能体的区别
大模型和智能体的区别主要体现在以下几个方面: 概念定义: 智能体:简单理解就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。可以是面向 C 端,如社交方向,用户注册后先捏一个自己的智能体,然后让其与他人的智能体聊天,两个智能体聊到一起后再真人介入;也可以面向 B 端,帮助 B 端商家搭建智能体。 大模型:是一种技术。 局限性: 大模型具有强大的语言理解和生成能力,但存在一定局限性,例如无法回答私有领域问题(如公司制度、人员信息等),无法及时获取最新信息(如实时天气、比赛结果等),无法准确回答专业问题(如复杂数学计算、图像生成等)。 开发平台: 有众多智能体开发平台,如字节的扣子、Dify.AI 等。 应用场景: 智能体应用基于大模型,通过集成特定的外部能力,能够弥补大模型的不足。适用于有企业官网、钉钉、微信等渠道,期望为客户提供产品咨询服务,缺少技术人员开发大模型问答应用等场景。典型场景包括私有领域知识问答、个性化聊天机器人、智能助手等。 在 Anthropic 的定义中,智能体可以有多种定义,一些客户将其定义为能够长期独立运行的全自动系统,能使用各种工具完成复杂任务;另一些则将其描述为更具规范性、遵循预定义工作流程的系统。Anthropic 将这些变体统称为智能系统,并在架构上区分为工作流和智能体两种类型,工作流是通过预定义代码路径来编排 LLM 和工具的系统,智能体则是由 LLM 动态指导自身流程和工具使用的系统,能够自主控制任务完成方式。
2025-03-14
快速帮我补充下大模型的发展时间线和关键节点,以及当前最前沿的新闻
大模型的发展时间线和关键节点如下: 2017 年:发布《Attention Is All You Need》论文。 2018 年: Google 提出 BERT,创新性地采用双向预训练并行获取上下文语义信息及掩码语言建模。 OpenAI 提出 GPT,开创仅使用自回归语言建模作为预训练目标的方式。 2021 年:Meta 提出 Large LAnguage Model Approach(LLAMA),成为首个开源模型。 2022 年 11 月 30 日:ChatGPT 发布,在全球范围内掀起人工智能浪潮。 2022 年 12 月:字节云雀大模型等出现。 2023 年: 国内大模型发展大致分为准备期(国内产学研迅速形成大模型共识)、成长期(数量和质量逐渐增长)、爆发期(开源闭源大模型层出不穷,形成百模大战态势)。 关键进展包括:Meta 开源 Llama2、OpenAI 发布多模态 GPT4V 及 GPT4 Turbo、百川智能开源 Baichuan7B 及 Baichuan2、百度升级文心一言 4.0、清华&智谱 AI 开源 ChatGLM2 及清华开源 ChatGLM3、腾讯发布混元助手等。 当前最前沿的新闻包括:过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从 7 月份与 GPT3.5 的 20 分差距,到 11 月份测评时已在总分上超越 GPT3.5。
2025-03-14
阿里的千问大模型在行业内处于一个什么样的水平
阿里的通义千问大模型在行业内处于领先水平。 通义千问 2.5 正式发布并开源 1100 亿参数模型,在多模态和专有能力模型方面影响力强大,始终坚持开源路线,已推出多款开源模型,受到开发者和生态伙伴的热情支持。百炼平台也升级支持企业 RAG 链路,提供更灵活的企业级检索增强服务。通义灵码推出企业版,满足企业定制化需求,已在多个领域落地应用。 Qwen2.5Max 基于 SFT 和 RLHF 策略训练,在多项基准如 Arena Hard、LiveBench、LiveCodeBench、GPQADiamond 上超越 DeepSeek V3,引发社区关注。支持官方 Chat、API 接口、Hugging Face Demo 等多种方式,展示其顶尖性能与灵活应用场景。 Qwen2.5VL 是新一代视觉语言模型,可解析 1 小时以上视频内容并秒级定位事件,识别从金融文档到通用物体,动态适配高分辨率图像。具备复杂任务执行能力,覆盖更多实际场景如票据解析、商业分析等。 10 月 31 日,阿里云正式发布千亿级参数大模型通义千问 2.0,8 大行业模型同步上线。
2025-03-14