直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

生成卡通形象的AI

回答

以下是关于生成卡通形象的 AI 的相关内容:

  1. 通用人物模版:如果想用真人照片生成卡通头像,可以用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在使用过程中,若生成了满意的图,记得保存,下次同种类型可直接拿来喂图,效果更好。
  2. 生成式 AI 和视觉效果:生成式 AI 会被艺术家作为工具,且需要一定程度的用户监督。以漫画家 Yoko Li 为例,用其 70 张图片训练的模型能以令人不安的方式模仿生成图像,每个艺术家都要思考创作方向,训练过的模型能提供更多选项。AI 模型生成的图像通常有非白色背景。在创意资产为重要业务组成部分的行业中,生成式 AI 带来的经济效益提升、创造新风格和概念的灵活性以及生成完整工作成果的能力,将使行业发生明显变化,不仅限于图像,还适用于整个设计领域。
  3. 小码哥的 AI 绘画示例:如“一只穿着柔软中国唐代服装的小白兔,超级可爱,电影灯光,复杂的花丝设计,皮克斯风格,拟人化,手持粉色灯笼,大眼睛,微笑,桃花,流动,迷人,不朽,蓬松,闪亮的刷毛,花瓣,童话故事,虚幻引擎 5 和辛烷渲染,令人难以置信的细节,4K,在艺术站流行,华丽,超广角,4K --ar 10:16 --test --video --upbeta --upbeta --upbeta”等十二生肖唐装系的描述。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

进阶使用技巧总结

[title]进阶使用技巧总结[heading4]二、通用人物模版当然,如果你想用真人照片来生成卡通头像,就用「真人照片」+「照片描述」+「方法1的关键词」来处理即可,下面是我拿自己照片头像生成的(ps:就不露脸~),还不错。大家自行尝试。↓↓↓总结:细心的友友可能发现了我刚开始喂的图其实也是AI生成的。这就要给大家提个醒了,在玩的过程中如果生成了自己比较满意的图,一定要记得存起来。下次想要同种类型的就可以直接拿来喂图,效果要比重新找的好很多哟~

艺术并未消亡,它只是由机器生成

[title]艺术并未消亡,它只是由机器生成[heading2]生成式AI和视觉效果与上文中提到的编程辅助工具相似,生成式AI将会被艺术家们采用作为工具,而且都需要一定程度的用户监督。但是,很难夸大图像模型模拟完整艺术作品输出所产生的经济差异。使用代码生成模型,编写一个执行标准计算任务的基本功能程序需要审查、编辑和添加许多代码片段的测试。但对于一个基本的图像,输入一个提示并从十几个建议中选择一个图像可以在不到一分钟的时间内完成。以我们自己的漫画家(和投资合作伙伴)Yoko Li([@stuffyokodraws](https://twitter.com/stuffyokodraws))为例。我们使用她以前的70张图片训练了一个模型,这个模型能够以一种令人不安的方式模仿生成图像。每个艺术家都必须弄清楚接下来要创作什么,她甚至发现训练过的模型可以呈现出比她脑海中想到的更多的选项——至少在给定时间内迅速产生某物时是这样。画同一个物体有数百种方法,但生成模型立刻就明确了哪些路径值得探索。因此,在这样的任务中,我们并不是在争论计算机在1:1的基础上是否一定比人类更优秀。但是,就像许多其他任务一样,当计算机能够产生完整的工作成果时,它们在规模上完全压倒我们。请尝试猜测以下哪些图画是由Yoko直接画的,哪些是生成的。答:AI模型生成的图像拥有一个非白色背景。经济效益的巨大提升,能够创造新风格和概念的灵活性,以及生成完整或几乎完整的工作成果的能力,这些因素使我们预见,在所有创意资产是业务重要组成部分的行业中,我们将看到明显的变化。而且,这并不仅限于图像,而是适用于整个设计领域。例如:

小码哥:AI绘画十二生肖之唐装系

[title]小码哥:AI绘画十二生肖之唐装系A little white bunny in a soft Chinese Tang Dynasty Chinese costume,super cute,cinematic lighting,intricate filigree design,Pixar style,anthropomorphic,holding a pink lantern,big eyes,smile,peach blossom,flow,charming,immortal,fluffy,shiny bristles,ptals,fairy tale,unreal engine 5 and octane rendering,incredibly detailed,4K,trending in art station,gorgeous,Super wide angle,4K --ar 10:16 --test --video --upbeta --upbeta --upbetaA little white snake in a soft Chinese Tang Dynasty Chinese costume,super cute,cinematic lighting,intricate filigree design,Pixar style,anthropomorphic,holding a pink lantern,big eyes,smile,peach blossom,flow,charming,immortal,fluffy,shiny bristles,ptals,fairy tale,unreal engine 5 and octane rendering,incredibly detailed,4K,trending in art station,gorgeous,Super wide angle,4K --ar 10:16 --test --video --upbeta --upbetaA little white horse in a soft Chinese Tang Dynasty Chinese costume,super cute,cinematic lighting,intricate filigree design,Pixar style,anthropomorphic,holding a pink lantern,big eyes,smile,peach blossom,flow,charming,immortal,fluffy,shiny bristles,ptals,fairy tale,unreal engine 5 and octane rendering,incredibly detailed,4K,trending in art station,gorgeous,Super wide angle,4K --ar 10:16 --test --video --upbeta --upbeta

其他人在问
学习AI视频链接
以下为您推荐两个学习 AI 的视频: 1. 【包教包会】一条视频速通 AI 大模型原理_哔哩哔哩_bilibili 链接:https://www.bilibili.com/video/BV17t4218761/?vd_source=3cc4af77a2ef185635e8097d3326c893 介绍:由(女神)主讲,和某知识 up 主 Genji 一起制作的免费公益课。干货满满,新手友好,能带你 50 分钟速通 AI 大模型原理。 2. 用大模型保存你的全部人生,你会接受吗:专访安克创新 CEO 阳萌|大咖谈芯第 11 期_哔哩哔哩_bilibili 链接:https://www.bilibili.com/video/BV1iT421Q7M1 介绍:某知识 up 主老石谈芯专访安克创新 CEO 阳萌的视频,一共两期,此链接为第二期。两期内容都值得观看,访谈非常硬核。
2024-11-02
学习AI的视频
以下为您推荐一些学习 AI 的视频: AI 视频学社: 入门教程: 软件教程: 工作流教程: 交流群:需要学习 AI 视频的,参与 AI 视频挑战赛,参与 AI 视频提示词共创的小伙伴,直接扫二维码或联系三思或小歪【备注:AI 视频学社】,必须有 AI 视频账号才能进群,请勿随便申请好友。 每周 1 次直播(周五直播):@lailai 统筹负责 【AI 学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐): (女神)主讲,和某知识 up 主 Genji 一起制作的免费公益课,新手友好,带你 50 分钟速通 AI 大模型原理。 ,某知识 up 主老石谈芯专访安克创新 CEO 阳萌的视频,一共两期,视频链接是第二期。两期内容都值得观看,访谈非常硬核。
2024-11-02
辅助生成电商图片的 AI 工具
以下是一些辅助生成电商图片的 AI 工具: 1. Midjourney 新编辑器: 玩法一:产品海报设计。将可乐等产品图片导入编辑器,通过简单操作和写提示词,生成不同风格的海报。 玩法二:家具材质变化。在电商家具展示中,利用图像重纹理化模式快速为沙发等换上各种材质。 玩法三:艺术字体海报。通过白底字体图,利用图像重纹理化模式变换成各种炫酷的字体海报风格。建议使用竖版白底文字图。详细操作请点击→ 2. CADtools 12:Adobe Illustrator(AI)插件,为 AI 添加 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 3. Autodesk Fusion 360:集成了 AI 功能的云端 3D CAD/CAM 软件,能创建复杂几何形状和优化设计。 4. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 5. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 6. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供基于 AI 的生成设计工具,可根据用户输入自动产生多种设计方案。 此外,在电子商务领域,像可以编写经过 SEO 优化的产品描述。未来,预计用户仅通过描述期望的审美并点击按钮,就能创建一个完整的电商商店及用于市场营销的材料。
2024-11-02
手机端好用的ai软件
以下为您推荐一些手机端好用的 AI 软件: Kimichat:访问网址 https://kimi.moonshot.cn/ ,您可以通过微信小程序搜索 kimi,并将小程序悬浮固定,隐藏到微信左侧方便快速调出。 秘塔 AI:访问网址 https://metaso.cn/ 美丽修行 APP:是一个 AI 美容护肤产品推荐平台,利用数据分析和自然语言处理技术,根据用户肤质推荐适合的美容护肤产品,市场规模达数亿美元。 360 儿童手表:具备 AI 儿童安全监控系统,通过图像识别和机器学习技术保障儿童安全,让家长放心,市场规模达数亿美元。 汽车之家 APP:拥有 AI 汽车保养提醒系统,利用数据分析和机器学习技术提醒车主及时进行汽车保养,市场规模达数亿美元。 京东物流仓储管理系统:是一个 AI 物流仓储管理系统,利用数据分析和机器学习技术优化物流仓储管理,提高运营效率,市场规模达数十亿美元。
2024-11-02
什么ai对思路分解做的比较好
以下几种 AI 在思路分解方面具有一定的优势和特点: 1. 专家 AI:鉴于其神经网络基础,可能通过元学习更快地获得知识。通过构建系统深入探索其内部工作机制,能创造学习的飞轮,未来甚至可能成为下一代专家的教师,帮助我们将复杂问题一部分一部分地拆解研究。 2. ChatGPT:在某些实用向话题,如写代码、解数学题等方面表现相对稳定,能够为解决问题提供一定的思路。 3. 大语言模型:可以加速认知提升,指导学习。人类可以利用其培养结构化思维,将复杂问题分解成更小、更易管理的部分,并通过逻辑和有条理的步骤来解决,从而达到解决整体问题的目的。 需要注意的是,不同的 AI 在不同的场景和任务中表现各异,具体的效果还需根据实际需求和使用情况来评估。
2024-11-02
如何用AI教外国人学汉语
以下是用 AI 教外国人学汉语的方法和推荐的工具: 1. 语言学习应用: 1.1 多邻国(Duolingo):功能是使用 AI 个性化学习体验,根据进度和错误调整练习内容,通过游戏化方式提供词汇、语法、听力和口语练习。使用方法为下载应用,选择汉语,按照课程指引学习。 1.2 巴贝尔(Babbel):结合 AI 技术提供个性化课程和练习,重点在于实际交流所需的语言技能。注册账户,选择汉语课程,按学习计划学习。 1.3 罗塞塔石碑(Rosetta Stone):使用动态沉浸法,通过 AI 分析学习进度,提供适合的练习和反馈。注册并选择汉语,使用多种练习模式学习。 2. AI 对话助手: 2.1 ChatGPT:可用来模拟对话练习,提高语言交流能力。在聊天界面选择汉语,与 AI 对话,询问语法、词汇等问题,模拟交流场景。 2.2 谷歌助手(Google Assistant):支持多种语言,可进行日常对话练习和词汇学习。设置为汉语,通过语音或文本输入互动。 3. 学习方法建议: 设定目标:明确学习目标和时间表,分阶段完成任务。 多样化练习:结合听、说、读、写多种方式全面提升技能。 模拟真实环境:尽量多与汉语母语者交流,或用 AI 对话助手模拟真实场景。 定期复习:使用 AI 工具的复习功能,根据记忆曲线定期复习已学内容。 4. 语言学习平台: 3.1 FluentU:使用真实世界的视频,通过 AI 生成个性化的词汇和听力练习。选择汉语,观看视频并完成练习积累词汇、提升听力。 3.2 Memrise:结合 AI 技术,根据记忆曲线提供复习和练习,增强记忆效果。选择汉语,使用词汇卡和练习学习。 5. 发音和语法检查: 4.1 Speechling:提供口语练习和发音反馈,帮助改进口音和发音准确性。录制语音,提交给 AI 系统或人类教练获取反馈和建议。 4.2 Grammarly:帮助提高写作的语法和词汇准确性,支持多种语言。将写作内容粘贴到编辑器中获取改进建议。 6. 实时翻译和词典工具: 5.1 谷歌翻译(Google Translate):提供实时翻译、语音输入和图像翻译功能,适合快速查找和学习新词汇。输入或语音输入内容查看翻译结果和例句。 5.2 Reverso Context:提供单词和短语的翻译及上下文例句,帮助理解和学习用法。输入单词或短语查看翻译和例句。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-02
哪些软件可以用来生成卡通形象?
以下是一些可以用来生成卡通形象的软件及相关操作: 1. Midjourney 背景:之前有制作过相关教程,可利用其以图绘图功能生成迪斯尼卡通风格的头像。若没有账号或不懂基础操作,可参考之前的教程。 操作: 选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,上传文件选取图片并发送。 复制图片在浏览器中打开的链接。 在聊天窗口输入/imainge 找到/imagine prompt,将链接放入,加提示词(以英文逗号分隔)和设置参数。 设置参数: iw 1.5:设置参考图片的权重,数值越高与参考图片越接近,默认 0.5,最大 2,可选择中间值调整。 s 500:设置风格强度,个性化、艺术性,数字越大越有创造力和想象力,可设置 0 1000 间任意整数。 v 5:用 Midjourney 的第 5 代版本,需订阅付费,不想付费可用v 4。 no glasses:若不喜欢戴眼镜的图片,可使用此设置。 2. 提示词: 风格提示词:dark fantasy style(黑暗幻想风格)、Pop art(波普艺术)、impressionism(印象派)、Neoimpressionism(后印象派)、fauvism(野兽派)、expressionism(表现主义)、abstract expressionism(抽象表现主义)、cubism(立体主义)、contemporary art(当代艺术)、anime style(动画风格)、cartoon(卡通)、visionary art(视觉艺术)、comic book(漫画书)、streampunk(蒸汽朋克)、dark theme(黑暗主题)、miniature model film(微缩模型电影)、DC Comics(能生成美漫封面的漫画画面)、pixiv(纯二次元风格人像)、style ofAl Williamson(威廉森风格)、Bauhaus Style(包豪斯风格)、Warhol(安迪·沃霍尔风格)、Luminsm(光色主义)、Magic Realism(魔幻现实主义)、fantastic Realism(魔幻现实主义)、Classical Realism(批判现实主义)
2024-11-02
Midjourney生成知名动漫或卡通形象受限制了么?
Midjourney 在生成知名动漫或卡通形象时存在一定的限制。例如,在生成角色方面,最好不要生成过多角色,过多甚至可能指 2 个。做人、做动物的情况还好,但对于有拟人角色需求的情况,可能难以生成满意的结果。比如小龙喷火到小兔子举着的礼物盒这种看似简单的需求,可能无法达到满意效果,可能出现动物不拟人或龙的体型超大等情况。对于像中国龙这种数据样本较少的形象,生成符合要求的图很有挑战性。 在视频生成方面,如果想让角色做出一些较大的动作,比如转头、掉眼泪、抬手或更生动的表情变化,现有的技术还不够成熟,还需要更先进的技术、更丰富的数据和更强大的计算能力。此时的策略是尽量规避制作需要大动作表现的视频,如果实在避免不了,可以尝试制作一些只涉及小动作的场景,然后通过加入台词和场景描述来补充细节和深度,帮助观众更好地理解场景背景和角色心理,以弥补视觉上的不足。
2024-10-29
如何把自己图片卡通化
以下是将自己图片卡通化的方法: 1. 简单提示词方法: 在聊天窗口输入/imainge 找到/imagine prompt,然后把图片链接放进去,空格后加提示词,提示词以英文逗号分隔,最后加上设置参数。 设置参数: iw 1.5 是设置参考图片的权重,数值越高与参考的图片越接近,默认是 0.5,最大是 2,可选择中间值调整。 s 500 设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为 0 1000 间任意整数。 v 5 是指用 midjourney 的第 5 代版本,这一代的最真实,目前 v5 需要订阅付费,不想付费可以使用 v 4 。 no glasses 是指不戴眼镜,不喜欢戴眼镜的图片,可以加上这个设置。 完整的提示词示例(替换您的 png 图片地址):simple avatar,Disney boy,3d rendering,iw 1.5 s 500 v 5 。如果对生成效果不满意,可以调整 s 和 iw 的值进行多次尝试。 2. 复杂提示词方法: 比如:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultra detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino iw 1.5 s 500 v 5 。 不同照片生成:如果对照片风格不满意,可以换一张新照片使用上述提示词重新生成。 其他调整:如果觉得 Disney 风格的头像太过卡通,可以把提示词里面的 Disney 都换成 Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的 boy 换成 girl。每次会生成 4 张图片,对某一张图片满意,点击下方的 U1 U4 生成大图,如果对风格满意但是需要调整,点击下方的 V1 V4 进行修改。 此外,还有通过【SD】玩转局部重绘的方法: 1. 添加关键词,点击生成,图片就像神笔马良一样生出了一朵花。 2. 如果想让图片变成横的,在图生图中选择“缩放后填充空白”,重绘幅度 0.5,并将宽度从 512 增加到 1200。生成后若背景拉伸重复度太高,可适当增加重绘幅度。 3. 当重绘幅度为 0.58 时,背景可能比较正常。但随着重绘幅度增大,人物细节可能产生改变。若既不想改变人物,又想修改背景,可借助 PS 帮助。保存图片进入 PS,对主体人物抠像。点击选择 主体,得到人物的选区。对选区填充白色,对背景填充黑色,得到人物形象的精确蒙版。 4. 进入“上传重绘蒙版”的界面,上面放置需要重绘的图像,下面放置 PS 中制作好的蒙版。在 Stable Diffusion 中,蒙版的白色区域是默认重绘的区域,如果只想改变背景,可以切换到“重绘非蒙版区域”。 5. 将提示词调整为铺满了鲜花的场景:detailed background filled with,depth of field,Canan EOS R6,135mm,1/1250s,f/2.8,ISO 400。重绘幅度拉高到 0.9 ,点击生成。可以看到,人物原封不动,而场景产生大变化,成为一片花海。
2024-10-19
有没有照片生成卡通形象的AI工具
以下为您介绍一些可以将照片生成卡通形象的 AI 工具: Midjourney: 之前有制作过相关的视频教程,教大家从零开始使用并通过简单的提示词生成图片。 利用其以图绘图功能生成迪斯尼卡通风格的头像。具体操作是先选一张满意的照片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,上传文件选取图片并发送(记得点击回车或发送按钮)。然后获取图片链接,加上 prompt 提示词发送给 Midjourney 即可。 出门问问: 这是一家以生成式 AI 和语音交互为核心的人工智能公司,提供面向创作者的 AIGC 工具等。 仅需上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”。不同风格的照片如真人、卡通、有胡须遮挡、有眼镜装饰等都可以驱动尝试。 如果您想用真人照片来生成卡通头像,就用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在使用过程中如果生成了满意的图,记得存起来,下次同种类型可直接拿来喂图,效果更好。
2024-10-10
国内有哪些可以做卡通表情包的免费ai
目前国内可以用于制作卡通表情包的免费 AI 工具相对较少,但以下一些免费的大模型 APP 可能对您有所帮助: 1. Kimi 智能助手:这是由 Moonshot AI 出品的智能助手,有着超大“内存”,可以一口气读完二十万字的小说,还会上网冲浪。 2. 文心一言:百度出品的 AI 对话产品,定位是智能伙伴,能写文案、想点子,又能陪您聊天、答疑解惑。 3. 通义千问:由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。 此外,您还可以领取以下免费大模型接口来尝试制作卡通表情包: 1. 阿里的通义千问大模型接口:https://dashscope.console.aliyun.com/ ,创建个 API key 即可。 2. 智谱 AI(ChatGLM):https://open.bigmodel.cn/ 。 3. 科大讯飞(SparkDesk):https://xinghuo.xfyun.cn/sparkapi 。 需要注意的是,目前国内的大模型大都是限制一定免费额度的 Token。 内容由 AI 大模型生成,请仔细甄别。
2024-09-21
什么软件可以直接生成卡通形象并且能说话
以下是一些可以生成卡通形象并且能说话的软件: 1. Creatie AI:AI 驱动的设计神器,能在几分钟内设计网站或程序,融合多种功能,自动分析设计文件,创建统一样式库,快速转化为高保真可交互原型并生成代码。网址:http://creatie.ai 。 2. 腾讯 AniPortrait:根据音频和静态人脸图片生成逼真的动态视频,支持多种语言、面部重绘、头部姿势控制,比阿里 EMO 项目先开源。网址:https://github.com/ZejunYang/AniPortrait 、https://arxiv.org/abs/2403.17694 、https://x.com/imxiaohu/status/1772965256220045659?s=20 。 3. NoLang:支持将文字、网页链接、PDF 等直接转换为视频,自动总结 PDF 内容并生成解答视频,还可追问,但目前服务器承受压力大,支持日语和英语。网址:http://nolang.com 。 此外,制作数字人的工具还有: 1. HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后就能合成一段非常逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-09-03
视频生成
以下是关于视频生成的相关内容: Adobe Firefly 中的视频生成: 在 Advanced 部分,您可以使用 Seed 选项添加种子编号,帮助启动流程并控制 AI 创建内容的随机性。若使用相同的种子、提示和控制设置,可重新生成类似的视频剪辑。选择 Generate 进行生成。 Adobe Firefly 中的“生成视频”(测试版)能将书面描述转换为视频剪辑。使用文本提示定义内容、情感和设置(包括摄像机角度)以指导摄像机移动并创建传达所需情绪和信息的视频,还可合并图像为视频生成提供视觉提示。 具体操作: 在 Adobe Firefly 网站上选择“生成视频”。 在 Generate video 页面的 Prompt 字段输入文本提示,也可在 Image 部分的 Upload 选项使用图像作为第一帧并为视频剪辑提供方向参考。添加图像可提供清晰视觉引导,使生成的视频更符合愿景。 在 General settings 部分可确定Aspect ratio 和 Frames per second。 Sora 原理解释: Garman 把 SORA 32 篇索引文章放到 GLMs,有啥不懂可以问它。链接:https://open.bigmodel.cn/shareapp/v1/?share_code=3MdNDUTIrkZVesAR5hPoY 从原始视频数据到模型训练再到模型生成视频的全流程包括: 数据准备:使用多种数据源,对图像和视频进行尺寸调整,包括空间上的抗锯齿双线性缩放和时间上的跳帧处理。 模型训练:基础训练阶段使用正方形图像比例进行训练,在特定数据子集上对基础模型进行微调以生成 9:16 比例的视频,采用了位置嵌入的插值和窗口尺寸的缩放。 视频生成:首先使用图像 LDM 生成单帧图像,然后运行预测模型,以生成的单帧为条件生成关键帧序列,在视频扩展时,再次调用预测模型,以两帧(捕捉方向信息)为条件生成连贯的运动。 微调与优化:对于长时间视频生成,模型在帧预测任务上进行联合训练,在推断阶段优化目标是加快小批量图像生成的速度。 模型初始化:由于视频数据集规模相对较小,从预训练的图像模型(如 ViT)初始化视频模型,以促进更有效的训练。
2024-11-02
一键生成PPT的AI
以下是为您整理的关于一键生成 PPT 的 AI 相关信息: 增强版 Bot: 是基于 AI 驱动的智能创作平台,能够实现一站式内容生成,包括图片、PPT、PDF 等。 输入诉求即可生成包含特定架构风格的完整 PPT,并提供相关模板选择。 歌者 PPT: 功能:具有话题生成、资料转换、多语言支持、海量模板和案例库、在线编辑和分享、增值服务等功能。 简介:是一款永久免费的智能 PPT 生成工具,适用于多种场景,能提供便捷和智能化体验。 产品优势:免费使用、智能易用、海量案例、资料转 PPT 专业、AI 翻译。 推荐理由:完全免费,智能化程度高,模板和案例丰富,适合不擅长制作 PPT 或时间紧张的人群。 AiPPT.cn: 是一家 AIGC 数字科技企业旗下的产品。 致力于打造“下一代个人与组织的 Ai 工作站”,包括多款应用 AI 能力的内容创作工具。 能够帮助用户“一分钟一键生成 PPT”,在国内 AiPPT 赛道创业公司中排名第 1,全球第 4,是国内所有 AIGC 产品 PC 端 Top10。目标市场包括基层及中高层管理岗位人员,如市场、运营、销售、人力、财务、行政、技术、产品、总助、公务员、学生、老师等。
2024-11-01
动作姿态生成的网站
以下为一些关于动作姿态生成的网站相关信息: 在 Stable Diffusion 中,ControlNet 是一个强大的控制插件。对于姿态约束,您可以通过以下方式操作: 1. 国风 3 模型点击生成姿势,但 AI 识别可能不准确,需耐心刷图和调整参数。 2. 若要细化图片,可使用扩展图片的方法,将图发送到图生图,通过“缩放后留白”和提高重绘幅度改变背景,再用 ControlNet 中的 tile 模型细化,最后使用 SD 放大插件。 3. 当找不到满足需求的动作图片时,可以自定义动作骨架。在【扩展】【加载扩展列表】中搜索【posex】安装插件(若安装不了,可将分享的插件文件夹拷贝至...\\sdwebuiakiv4\\extensions 目录,确保软件为最新版本后重启)。重启后来到首页,点击“将图片发送至 ControlNet”,可通过鼠标操作调整视角。如调一个玛丽琳梦露的经典动作,右边可调整出图尺寸,启用 ControlNet 时,若骨架图来自 posex 链接,无需添加图片和预处理器,直接加载 openpose 模型即可。 另外,公众号【白马与少年】有不同 pose 的骨架图可供参考,回复【SD】获取。该公众号还分享 Stable Diffusion、Blender 等学习心得,有 139 篇原创内容持续更新。
2024-11-01
动作姿态生成
以下是关于动作姿态生成的相关内容: 在使用 Stable Diffusion 进行动作姿态生成时,可采用以下方法: 1. 利用 ControlNet 中的姿态约束功能,如国风 3 模型,点击生成姿态,但可能存在骨骼错位等问题,需要耐心刷图和调整参数。同时,还收集了不同 pose 的骨架图,可通过添加公众号【白马与少年】回复【SD】获取参考。 2. 对于人物绘制,先确定人物动作,可在草图基础上用 Clip Studio Pro 中的 3D 人物模型进行姿态调整,或使用其他 3D Pose 类软件生成人物姿态,然后使用 ControlNet 的 Openpose 功能生成人物姿态。为控制人物色彩,可采用合适图片放入 img2img 中调整 Denoising strength,或使用 ControlNet Color 等插件,过程中需进行 img2img 反复迭代,并适时加入背景元素,人物大致确定后用 photoshop 融合,再继续生成和调整。 3. 对于特殊物品如天狗面具,若 Stable Diffusion 没有合适模型和 Lora,可自行训练专用 Lora,使用时用 inpainting sketch 重绘或在 Photoshop 处理后进入 img2img 重绘,注意重绘区域要小。 4. 对图片进行细化时,可使用扩展图片方法,将图发送到图生图,用 ControlNet 中 tile 模型细化,再使用 SD 放大插件。若找不到满足需求的动作图片,可在【扩展】【加载扩展列表】中搜索【posex】插件,安装或拷贝至指定目录,重启软件后在首页点击“将图片发送至 ControlNet”进行操作,可通过鼠标操作调整视角,调动作时启用 ControlNet,若骨架图来自 posex 链接,无需添加图片和预处理器,直接加载 openpose 模型。
2024-11-01
使用人物Lora生成的图片中有多个人物时,怎么让人物的形象各不相同?
在 Stable Diffusion 中,若使用人物 Lora 生成的图片中有多个人物并想让人物形象各不相同,可参考以下方法: 1. 在提示词中输入数量词(如 2girls 或 3boys 等),再加上各自的描述提示词。若刷图成功率不高,可配合 openpose 控制,做一个多人骨架,以生成多人物构图。 2. 需使用不同的 Lora 来区分人物,但单纯靠提示词可能行不通。 3. 分区控制思路: Multidiffusion 的做法:启用 Tiled Diifusion,打开分区提示词控制,创建文生图画布。启用不同区域,分别填写背景、不同人物的描述词和 Lora。增加 controlnet 的 openpose 控制来稳定人物,但可能存在分区生成的人物连续性低、lora 控制不强等问题。 Latent Couple 的做法(文中未提及,需进一步探索)。 此外,关于 Lora 模型: 1. Lora 可以固定照片的特征,如人物特征、动作特征和照片风格。 2. 点击“生成”下面的第三个按钮,找到 Lora 选项,可添加下载保存到电脑的 Lora 模型,Lora 可叠加使用,但新手不建议使用太多,且 Lora 之间用英文逗号隔开,每个 Lora 后面的数字用于调整权重,一般只会降低权重。选择 Lora 应根据最初想要生成的照片类型决定。
2024-09-27
推荐一下可以更改对话形象的智能体对话软件
以下为您推荐一款可以更改对话形象的智能体对话软件:Coze 智能体机器人。 Coze 智能体机器人是基于大模型的智能对话机器人,支持微信公众号、企业微信应用、飞书、钉钉接入,可选择 GPT3.5/GPT4.0/GPT4o/Claude/Gemini/ChatGLM/月之暗面/文心一言/讯飞星火/通义千问/LinkAI,能处理文本、语音和图片,通过插件访问操作系统和互联网等外部资源,支持基于自有知识库定制企业 AI 应用。 服务器设置方面: 1. 点击“Docker”中的“编排模板”中的“添加”按钮。 2. 备注说明版、无备注干净版可按需选择。 3. 将编译好的内容复制进来。 4. 在“容器编排”中“添加容器编排”,选择在“编排模板”里创建的“coze2openai”。提示运行成功,如果无法正常启动,请看文档后面的“常见问题”。 效果测试:把绑定的微信号拉到群里或者单独对话,如视频所示就可以激活对话了,训练的数据越好,对话效果越好。个人微信对话和微信群对话效果演示可参考相关视频。
2024-09-23
能更换任务形象的AI助手
Character.ai 是一款每个人都可定制自己个性化 AI 的工具。其愿景是“让地球上的每个人都能获得自己的深度个性化超级智能,帮助他们过上最美好的生活”。在这个平台上,授课教师、游戏玩家、情感伴侣等各种角色都可以由 AI 来扮演,一切的服务都可以被 AI 重构。这意味着每个人都能拥有像钢铁侠中的 Javis 一样的人工智能助手,帮助完成各种任务,成为生活中不可或缺的一部分。这种技术的发展将为人类带来更多便利和创新,改变人们的生活和工作方式。您可以通过以下链接了解更多:
2024-09-23