Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

用别人的模型出图商用 会侵权吗

Answer

使用别人的模型出图商用是否侵权,需要根据具体情况来判断。

以腾讯混元大模型为例,其适用场景包括给自己或身边人做头像、公众号和媒体版面排版时的文字配图、制作海报、PPT 的素材以及广告配图等。但需要注意的是,腾讯混元大模型并不主张生成图片的版权,且原素材涉及到的版权风险可能存在争议。比如,如果用混元生成了某个 IP 如皮卡丘、米奇老鼠等,或者某个名人的真人脸,都可能存在侵权风险。建议在使用配图过程中尽量避免此类情况。如果最终使用了腾讯混元大模型生成的图片,应注明“由腾讯混元大模型生成”。

从全国首例 AI 生成图片著作权案例解读来看,软件设计者通过设计算法训练出智能模型,对模型设计投入了智力成果。但图片是由创作者根据个人意愿,选取提示词、修改参数等步骤得出的最终成品,著作权属于人类创作者。尽管 AI 是工具,但法院强调著作权仍然属于人类创作者,保护了人类在知识产权领域的权益。

根据《中华人民共和国著作权法》第十一条规定,著作权属于作者,创作作品的自然人是作者。由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者。在未显示作者身份信息的情况下使用图片可能构成侵权。

Content generated by AI large model, please carefully verify (powered by aily)

References

腾讯混元大模型文生图操作指南

给自己或者身边人做头像、公众号和媒体版面排版的时候给文字配图、做海报、做PPT的素材、广告配图。注意事项:腾讯混元大模型并不主张生成图片的版权,但原素材涉及到的版权版权风险可能有争议,比如如果用混元生成了某个IP如皮卡丘、米奇老鼠等,或者某个名人的真人脸的,都可能存在侵权风险,建议你在使用配图过程中也尽量避免。如果最终使用了腾讯混元大模型生成的图片,烦请注明“由腾讯混元大模型生成”。

全国首例AI生成图片著作权案例解读:探索AI作品知识产权保护之路

其次,软件设计者通过设计算法,训练出可以根据不同需求自主生成内容的智能模型,对该模型设计确实投入了相应的智力成果,而后续该软件是根据什么样的提示词、多少参数生成的内容,与软件设计者没有太大关系。图片是由创作者根据个人意愿,经过选取提示词修改参数等步骤得出的最终成品,自然应成为该作品的作者,相应地享有著作权。可见,尽管AI是工具,但法院强调著作权仍然属于人类创作者,保护了人类在知识产权领域的权益。人类创作者对作品的智力投入不可忽视,强调个人的创作故事,突出人性化的创作过程,加深了消费者对产品的情感认同,更能鼓励利用AI技术完成艺术作品的创作,从而促进人工智能技术的发展。法律适用:《中华人民共和国著作权法》第十一条:著作权属于作者,本法另有规定的除外。创作作品的自然人是作者。由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者。(3)在未显示作者身份信息的情况下使用图片构成侵权案例中刘某的行为是怎么样侵害到李某的权力的呢?又侵害了哪些权力呢?

Others are asking
能直接输出图片的AI网站
以下是一些能直接输出图片的 AI 网站: 1. Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 5. 无界 AI:一款可以在线 AI 生成图片的网站(类似 SD Online 一键出图版),网址为 https://www.wujieai.cc/ (新用户扫码注册可领取积分)。 此外,还有用于鉴别图片是否为 AI 生成的网站,如 ILLUMINARTY(https://app.illuminarty.ai/)。但需注意,AI 鉴别仍存在一些局限性。
2025-02-07
有图片文字翻译输出图片的应用吗?
目前市面上有一些能够实现图片文字翻译并输出图片的应用。例如,百度翻译、腾讯翻译君等,它们在一定程度上具备这样的功能。但具体的效果可能会因图片的清晰度、文字的复杂程度等因素而有所不同。
2025-01-09
用macbook M3 Pro芯片,comfyUI 跑工作流,结果黑屏,没有输出图像,是为什么呢
很抱歉,目前没有关于使用 Macbook M3 Pro 芯片运行 ComfyUI 工作流出现黑屏且无输出图像的具体原因的相关知识。可能的原因有多种,比如软件与芯片的兼容性问题、显卡驱动异常、工作流设置错误、系统资源不足等。建议您检查软件的版本是否与您的系统兼容,更新显卡驱动,确认工作流的设置是否正确,以及关闭其他占用大量资源的程序以释放系统资源。
2025-01-03
flux和sdXL出图的区别
Flux 和 SDXL 出图主要有以下区别: 1. 生成人物外观:Flux 存在女生脸油光满面、下巴等相同外观问题,而 SDXL 相对在这方面有改进。 2. 模型构成:SDXL 由 base 基础模型和 refiner 优化模型两个模型构成,能更有针对性地优化出图质量;Flux 中 Dev/Schnell 是从专业版中提取出来,导致多样性丧失。 3. 处理方式:在低显存运行时,可采用先使用 Flux 模型进行初始生成,再用 SDXL 放大的分阶段处理方式,有效控制显存使用。 4. 模型参数和分辨率:SDXL 的 base 模型参数数量为 35 亿,refiner 模型参数数量为 66 亿,总容量达 13G 之多,基于 10241024 的图片进行训练,可直接生成 1000 分辨率以上的图片,拥有更清晰的图像和更丰富的细节;而 Flux 在这方面相对较弱。
2024-12-20
flux和sd3.5出图的区别
Flux 和 SD3.5 出图存在以下区别: 1. 模型性质:Flux.1 有多种版本,如开源不可商用的 FLUX.1等。而 SD3.5 未提及相关性质。 2. 训练参数:Flux.1 的训练参数高达 120 亿,远超 SD3 Medium 的 20 亿。 3. 图像质量和提示词遵循能力:Flux.1 在图像质量、提示词跟随、尺寸适应、排版和输出多样性等方面超越了一些流行模型,如 Midjourney v6.0、DALL·E 3和 SD3Ultra 等。 4. 应用场景:Flux.1 可以在 Replicate 或 fal.ai 等平台上试用,支持在 Replicate、fal.ai 和 Comfy UI 等平台上使用,并且支持用户根据自己的数据集进行微调以生成特定风格或主题的图像。而 SD3.5 未提及相关应用场景。 5. 本地运行:文中尝试了在没有 N 卡,不使用复杂工作流搭建工具的 Mac Mini M1 上运行 FLUX.1,以及在边缘设备 Raspberry PI5B 上运行的情况,未提及 SD3.5 的相关内容。 6. 模型安装部署:对于 Flux.1,不同版本的模型下载后放置的位置不同,如 FLUX.1应放在 ComfyUI/models/unet/文件夹中。而 SD3.5 未提及相关安装部署内容。 7. 显存处理:对于 Flux.1,如果爆显存,“UNET 加载器”节点中的 weight_dtype 可以控制模型中权重使用的数据类型,设置为 fp8 可降低显存使用量,但可能会稍微降低质量。而 SD3.5 未提及相关显存处理内容。 8. 提示词使用:在训练 Flux 时,应尽量使用长提示词或自然语言,避免使用短提示词,因为 T5 自带 50%的删标。而 SD3.5 未提及相关提示词使用内容。
2024-12-20
如果给AI数据,AI可以做出小波分析并出图吗
目前的 AI 技术在给定相关数据的情况下,是有可能进行小波分析并出图的。但这取决于多个因素,如数据的质量、数量、特征,以及所使用的 AI 模型和算法的能力和适应性。一些专门为数据分析和图像处理设计的 AI 模型,经过适当的训练和配置,能够处理数据并生成小波分析的结果图像。然而,要实现准确和有意义的小波分析及出图,还需要对数据进行预处理、选择合适的模型架构,并进行精细的调参和优化。
2024-10-31
Ai生成漫画,进行商业,会侵权吗
在进行 AI 生成漫画的商业活动时,是否侵权需要具体分析。以下是一些相关要点: 作品价值开发:公开发表在网络平台、在展馆陈列、与商业合作创建品牌等,要注意保留相关材料,如发表平台的账号、上传时间、商业合作合同等。 发现受到侵权后的维权流程: 1. 先核实他人是否获得合法授权或存在合法使用的情形,确定是否侵权。 2. 保留对方侵权行为的证据,可以通过截图、视频、公证等方式收集。 3. 直接联系他人或采取律师函通知等方式告知对方侵权行为。 4. 联系后与对方进一步沟通和协商,将损失尽量减少到最小。 5. 向有关部门投诉或向人民法院起诉,申请第三方介入来解决侵权争端。 6. 让侵权方承担停止侵权、消除影响、赔偿损失的责任。
2024-09-14
AI音乐用于商用作品中,是否侵权
AI 音乐用于商用作品中是否侵权,情况较为复杂。 一方面,索尼音乐集团近日指控 AI 开发者在未经授权的情况下,使用索尼的知识产权来训练 AI 模型,并收集索尼拥有的媒体数据,可能侵犯了其版权。索尼音乐集团在其官方网站上发布声明,并通过信件形式向超过 700 名 AI 开发者和流媒体服务发出警告,明确禁止使用索尼的音乐、歌词、音乐视频和专辑封面等媒体内容用于 AI 系统的“训练、开发或商业化”。 另一方面,Rightsify 公司发布的 Hydra II 是基于完全授权音乐训练的音乐生成人工智能,其生成的音乐可以在全球范围内的任何商业项目中永久使用,没有任何限制。 目前,对于在未经许可的情况下使用音乐录音训练 AI 系统是否构成版权侵犯,尚不清楚。但随着生成音频质量的不断提升,AI 技术在音乐领域的应用越来越受到主流听众的关注。索尼音乐集团的这一警告可能会对 AI 技术在音乐产业的进一步发展造成影响。有人认为,AI 开发者应该被允许从互联网上免费获取的数据中学习,但版权保护的不确定性对任何人都不利,现在是更新知识产权法律以适应生成性 AI 时代的关键时刻。
2024-08-23
DB gpt具备商用化能力了吗?
目前 DB GPT 尚未具备成熟的商用化能力。其在技术、性能、安全性、稳定性等方面可能还存在一些需要进一步完善和优化的地方。商用化需要满足一系列严格的标准和要求,包括但不限于高效的处理能力、准确的结果输出、可靠的安全性保障以及良好的用户体验等。
2025-02-17
电商用最好的产品图片修改工具
以下是一些适用于电商的产品图片修改工具及相关应用: 1. Midjourney: 产品海报设计:将产品图片导入编辑器,通过简单操作和提示词生成不同风格的海报。 家具材质变化:利用图像重纹理化模式快速为家具换上各种材质。 艺术字体海报:通过白底字体图和图像重纹理化模式变换成各种炫酷的字体海报风格。 2. Stable Diffusion: 对于运营网店的女装店主,可通过真人穿衣服拍照,选好底模(如 realisitic 的真人照片风格底模),根据不同平台换头,使用图生图下的局部重绘选项卡涂抹替换部分等步骤,初步制作展示商品。 3. 其他工具: 像 Flair、Booth 和 Bloom 这样的工具帮助品牌创建引人注目的产品照片。 AdCreative 和 Pencil 可以制作用于电子邮件或社交媒体的营销材料。 Frase 或 Writesonic 可以编写经过 SEO 优化的产品描述。 未来,我们有望仅通过描述期望的审美并点击按钮,就能创建一个完整的电商商店及用于市场营销的材料。
2025-01-15
电商用的AI工具
以下是一些电商常用的 AI 工具: 1. 电商 AI 工具库基础版(作者:清酒): 收集了十几款电商领域能用得上的 AI 工具,结合场景特别直观。 按照电商的角色进行了区分,无论您是买家、卖家、渠道还是生产者,都能找到合适的 AI 工具。 不仅有产品形态,还有非常具体的使用描述。您可以通过链接 https://i1lfku7w5p.feishu.cn/sheets/PJZTsTnDQhZnAatp2dccKYjQnnh 查看。 2. 生成式 AI 工具: 像这样的工具帮助品牌创建引人注目的产品照片,这对于向在线购物者销售产品非常重要。 可以制作用于电子邮件或社交媒体的营销材料。 可以编写经过 SEO 优化的产品描述。 3. 营销领域的 AI 工具: Synthesia:允许用户创建由 AI 生成的高质量视频,包括数字人视频。提供多种定价计划,从免费到商业级不等,可用于制作营销视频、产品演示等。 HeyGen:基于云的 AI 视频制作平台,用户可从 100 多个 AI 头像库中选择,并通过输入文本生成数字人视频。适合制作营销视频和虚拟主持人等。 Jasper AI:人工智能写作助手,可用于生成营销文案、博客内容、电子邮件等。提供多种语气和风格选择,写作质量较高。 Copy.ai:AI 营销文案生成工具,可快速生成广告文案、社交媒体帖子、电子邮件等营销内容。有免费和付费两种计划。 Writesonic:AI 写作助手,专注于营销内容创作,如博客文章、产品描述、视频脚本等。提供多种语气和行业定制选项。 更多的营销产品可以查看 WaytoAGI 网站:https://www.waytoagi.com/sites?tag=8 。总的来说,这些 AI 工具能够帮助电商从业者高效创作各种营销内容,提高工作效率。用户可根据实际需求选择合适的工具。需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-23
AI作品是否能够商用
AI 作品能否商用取决于多种因素。 一些 AIGC 艺术家认为,好的 AIGC 作品应具备美感、创意和值得思考的故事内核。在商业应用方面,比如在广告行业等细分领域已经有一定的应用。 生成式 AI 在艺术创作领域,如 Midjourney 和 Stable Diffusion 等产品允许用户输入提示和风格,并接收独特的艺术作品。从消费者“仅为了娱乐”地创造内容,到创作者或个体创业者通过内容实现盈利都有可能性。 智谱 AI 的部分开源模型(如 ChatGLM 系列)在填写问卷进行登记后允许免费商业使用,但模型可能犯错,由于模型回答造成的后果,智谱 AI 不承担相应责任。
2024-09-18
陪护机器人最快多久能正式商用?
目前,在幼教场景中正在开发的陪伴机器人,预计半年内视频生成技术成熟,届时可实现一些创新功能。但对于陪护机器人整体的正式商用时间,由于不同应用场景和技术发展的差异,还难以给出确切的时间。在医疗领域,由 AI 驱动的护理机器人会早于手术机器人应用,但具体商用时间也不确定。总体而言,陪护机器人的正式商用时间受多种因素影响,仍需进一步观察和等待技术的发展与完善。
2024-09-04
电商用什么ai工具
以下是一些适用于电商的 AI 工具及使用 AI 完成阿里巴巴营销技巧和产品页面优化的方法: 电商 AI 工具: 1. 清酒整理的电商 AI 工具:收集了十几款电商领域能用得上的 AI 工具,结合场景特别直观;按照电商的角色进行了区分,无论您是买家、卖家、渠道还是生产者,都能找到合适的 AI 工具;不仅有产品形态,还有非常具体的使用描述。 2. 常用于营销领域的 AI 工具: Synthesia:允许用户创建由 AI 生成的高质量视频,包括数字人视频。提供多种定价计划,从免费到商业级不等,可用于制作营销视频、产品演示等。 HeyGen:基于云的 AI 视频制作平台,用户可从 100 多个 AI 头像库中选择,并通过输入文本生成数字人视频。适合制作营销视频和虚拟主持人等。 Jasper AI:人工智能写作助手,可用于生成营销文案、博客内容、电子邮件等。提供多种语气和风格选择,写作质量较高。 Copy.ai:AI 营销文案生成工具,可快速生成广告文案、社交媒体帖子、电子邮件等营销内容。有免费和付费两种计划。 Writesonic:AI 写作助手,专注于营销内容创作,如博客文章、产品描述、视频脚本等。提供多种语气和行业定制选项。 更多的营销产品可以查看 WaytoAGI 网站:https://www.waytoagi.com/sites?tag=8 。总的来说,这些 AI 工具能够帮助营销人员高效创作各种营销内容,提高工作效率。用户可根据实际需求选择合适的工具。 使用 AI 完成阿里巴巴营销技巧和产品页面优化的方法: 1. 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况。AI 可以处理大量数据,快速识别出哪些产品受欢迎、价格区间、销量等关键信息。 2. 关键词优化:AI 可以分析和推荐高流量、高转化的关键词,帮助卖家优化产品标题和描述,提高搜索排名和可见度。 3. 产品页面设计:AI 设计工具可以根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:AI 文案工具可以撰写有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:AI 图像识别技术可以帮助选择或生成高质量的产品图片,这些图片能够更好地吸引顾客并展示产品特点。 6. 价格策略:AI 可以分析不同价格点对销量的影响,帮助卖家制定有竞争力的价格策略。 7. 客户反馈分析:AI 可以分析客户评价和反馈,帮助卖家了解客户需求,优化产品和服务。 8. 个性化推荐:AI 可以根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。
2024-08-28
有哪些在企业内部落地应用AI大模型工具的实践案例?不要营销文案生成、代码开发助手、智能客服问答机器人这种太常见的
以下是一些在企业内部落地应用 AI 大模型工具的实践案例: 1. 阿里云百炼: 智能体应用:能够弥补大模型的不足,如回答私有领域问题、获取实时信息、回答专业问题等。适用于有企业官网、钉钉、微信等渠道,期望为客户提供产品咨询服务,以及缺少技术人员开发大模型问答应用的场景。典型场景包括私有领域知识问答、个性化聊天机器人、智能助手等。 内部业务助手:通过企业内部规章制度、部门结构、产品介绍等文档构建知识库,并借助 RAG 智能体实现内部知识问答功能。系统支持多源异构数据,并通过复杂文档解析和视觉增强技术,提升文档理解的准确性与深度。目前该功能已灰度上线,需提供 UID 并通过白名单进行开启。 2. 达摩院: AI 模特(虚拟换装):支持虚拟换装、姿态编辑。 3. 电商零售: 推广文案写作:通过内置的多样化营销场景的文体模板,基于用户输入的创作主题以及参考素材,大模型即可为您生成对应的营销文案,为营销活动和宣传文案提供灵感和文案写作支持。 4. 泛企业: VOC 挖掘:是一个面向各类企业的 VOC 标签挖掘的工具。不论是用户的长短评论、帖子、还是用户和客服/销售的聊天记录、通话记录,都可以使用。通过选中或自定义标签,即可让大模型针对海量非结构化的 VOC 数据快速打标。相比于人工打标或规则打标准确率更高;对于业务标签变动频繁的情况,也能更敏捷、快速地影响。 5. 通义晓蜜:基于深度调优的对话大模型,为营销服类产品提供智能化升级所需的生成式摘要总结、质检、分析等能力应用。
2025-02-18
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
大模型产品对比
以下是对一些大模型产品的对比介绍: 智谱清言:由智谱 AI 和清华大学推出,基础模型为 ChatGLM 大模型。2023 年 10 月 27 日,智谱 AI 于 2023 中国计算机大会(CNCC)上推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。 模型特点:在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三。更擅长专业能力,但代码能力有优化空间,知识百科稍显不足,是很有竞争力的大模型。 适合应用:场景广泛,可优先推进在 AI 智能体方面相关的应用,包括任务规划、工具使用及长文本记忆相关场景,在较复杂推理应用上效果不错,也适用于广告文案、文学写作。 其他大模型产品: OpenAI 发布 GPT4 科大讯飞发布星火 1.0 及升级至星火 3.0 百度发布文心一言 1.0 及升级至 V3.5 清华开源 ChatGLM 360 发布 360 智脑 1.0 及升级至智脑 4.0 复旦开源 MOSS 元语开源 ChatYuan 阿里云发布通义千问 1.0 及开源 Qwen7B 商汤科技发布商量 1.0 及升级至商量 2.0、商量 3.0 昆仑万维发布天工 1.0 出门问问发布序列猴子 华为发布盘古 3.0 西湖心辰发布西湖大模型 云从科技发布从容大模型 理想汽车发布 MindGPT OPPO 发布 AndesGPT vivo 发布 BlueLM 小米发布大模型 MiLM 元象科技开源 XVERSE13B Google 发布多模态大模型 Gemini 上海人工智能实验室开源 InternLM20B 百川智能发布 Baichuan2—Turbo 关于大模型在营销方面的应用: 大模型在实体类产品的营销标语生成上表现较好,虚拟类产品相对欠佳。可能是因为大模型训练数据中实体类语料多,更能调用已有知识加工,而虚拟类产品非标准品,大模型认识不足。 情绪价值在营销领域有很多用武之地,除快消商品外,很多产品的营销需要反复沟通,虚拟产品对感性成交依赖更大,大模型在这方面仍有很大发展空间。
2025-02-18
我想创业,花多少钱,能够搭建一个视频领域的AI模型
在视频领域搭建 AI 模型的成本因多种因素而异。对于创业者或小公司来说,这个领域存在一定的挑战。 腾讯的混元 AI 视频模型目前只支持文生视频,且已开源免费。 在模型供应商方面,不同供应商的特点和成本有所不同: 智谱 GLM4V 是通用视觉类大模型,为拍立得最早使用的模型,接口响应速度快,指令灵活性差一些,调用成本为 0.05 元/千 tokens。 阿里云百炼 qwenvlplus 也是通用视觉类大模型,是拍立得目前使用的模型,指令灵活性比较丰富,接口调用入门流程长一些,密钥安全性更高,调用成本为 0.008 元/千 tokens,训练成本为 0.03 元/千 tokens。 阶跃星辰是通用视觉类大模型,响应速度快,支持视频理解,输入成本为 0.005 0.015 元/千 tokens,输出成本为 0.02 0.07 元/千 tokens。 百度 PaddlePaddle 是 OCR 垂直小模型,文本识别能力补齐增强,私有化部署有服务费,API 调用在 0.05 0.1 元/次。 此外,获取高质量数据的难度较高,大厂在该领域的护城河深厚。大公司在争取大模型 API 客户方面更具优势,且开源大模型的发展可能会影响创业公司的业务。去年为大客户定制一个大模型的最高订单额可达 1000 万元,而今年则快速降到了百万元级别乃至更低。
2025-02-18
你的底层大模型用的是哪个?
目前常见的大型语言模型多采用右侧只使用 Decoder 的 Decoderonly 架构,例如我们熟知的 ChatGPT 等。这些架构都是基于谷歌 2017 年发布的论文“attention is all you need”中提出的 Transformer 衍生而来,其中包括 Encoder 和 Decoder 两个结构。 大模型的特点在于: 1. 预训练数据非常大,往往来自互联网上的论文、代码、公开网页等,一般用 TB 级别的数据进行预训练。 2. 参数非常多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。 大模型之所以能有效生成高质量有意义的回答,关键在于“大”。例如 GPT1 的参数规模是 1.5 亿,GPT2 Medium 的参数规模是 3.5 亿,到 GPT3.5 时,参数规模达到惊人的 1750 亿,参数规模的增加实现了量变到质变的突破,“涌现”出惊人的“智能”。 大模型的预训练机制是指其“脑袋”里存储的知识都是预先学习好的,预训练需要花费相当多的时间和算力资源。在没有其他外部帮助的情况下,大模型所知道的知识信息总是不完备且滞后的。
2025-02-18