直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

哪些软件可以用来生成卡通形象?

回答

以下是一些可以用来生成卡通形象的软件及相关操作:

  1. Midjourney
    • 背景:之前有制作过相关教程,可利用其以图绘图功能生成迪斯尼卡通风格的头像。若没有账号或不懂基础操作,可参考之前的教程。
    • 操作:
      • 选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,上传文件选取图片并发送。
      • 复制图片在浏览器中打开的链接。
      • 在聊天窗口输入/imainge 找到/imagine prompt,将链接放入,加提示词(以英文逗号分隔)和设置参数。
      • 设置参数:
        • --iw 1.5:设置参考图片的权重,数值越高与参考图片越接近,默认 0.5,最大 2,可选择中间值调整。
        • --s 500:设置风格强度,个性化、艺术性,数字越大越有创造力和想象力,可设置 0 - 1000 间任意整数。
        • --v 5:用 Midjourney 的第 5 代版本,需订阅付费,不想付费可用--v 4。
        • --no glasses:若不喜欢戴眼镜的图片,可使用此设置。
  2. 提示词:
    • 风格提示词:dark fantasy style(黑暗幻想风格)、Pop art(波普艺术)、impressionism(印象派)、Neo-impressionism(后印象派)、fauvism(野兽派)、expressionism(表现主义)、abstract expressionism(抽象表现主义)、cubism(立体主义)、contemporary art(当代艺术)、anime style(动画风格)、cartoon(卡通)、visionary art(视觉艺术)、comic book(漫画书)、streampunk(蒸汽朋克)、dark theme(黑暗主题)、miniature model film(微缩模型电影)、DC Comics(能生成美漫封面的漫画画面)、pixiv(纯二次元风格人像)、style ofAl Williamson(威廉森风格)、Bauhaus Style(包豪斯风格)、Warhol(安迪·沃霍尔风格)、Luminsm(光色主义)、Magic Realism(魔幻现实主义)、fantastic Realism(魔幻现实主义)、Classical Realism(批判现实主义)
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

个性:给自己做一个卡通头像

之前我制作了一篇视频,教大家怎么从零开始使用Midjourney并通过简单的提示词来生成图片。今天教点高级的知识,利用Midjourney的以图绘图功能来生成属于你的迪斯尼卡通风格的头像。这就是我使用我的照片为底图生成的迪斯尼风格的头像。如果你还没有Midjourney账号,或者还不懂基础操作,可以看我之前的教程。[AI绘画工具Midjourney新手注册、绘画指令教程|看这一篇就够了](https://www.youtube.com/watch?v=VBlU2UYYUHw)要生成一张Disney风格的头像,我们先选一张你比较满意的图片,在Discord社区的Midjourney服务器聊天栏点击+,然后点击上传文件,选取图片,然后在聊天框发送。(记得这里一定要点击回车或发送按钮)然后图片会上传到服务器并生成一张唯一的链接,我们点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,这个链接就是这张图片的链接,我们复制下来。我们可以使用这个链接加prompt提示词来发送给Midjourney,Midjourney会根据我们的需求来生成特定的图片,这就是Midjourney的以图绘图。[heading1]

个性:给自己做一个卡通头像

1.简单提示词在聊天窗口输入/imainge找到/imagine prompt,然后把刚才的链接放进去,然后空格。加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数设置参数--iw 1.5是设置参考图片的权重,数值越高与参考的图片越接近,默认是0.5,最大是2,我们可以选择中间的某个值并调整,--s 500设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力。,可设置为0-1000间任意整数。如果你设置1000,那生成的图片不说与你的图片相差甚大,可以说是毫不相关。我们设置500--v 5是指用midjourney的第5代版本,这一代的最真实,目前v5需要订阅付费,不想付费可以使用--v 4--no glasses是指不戴眼镜,如果你不喜欢戴眼镜的图片,可以戴上这个设置,让它不戴眼镜。效果如下:完整的提示词如下(替换你的png图片地址):[https://cdn.discordapp.com/xxx.png](https://cdn.discordapp.com/xxx.png)simple avatar,Disney boy,3d rendering,--iw 1.5 --s 500 --v 5如果你对这些不满意,可以选择调整--s和--iw的值来进行多次尝试。

AI绘画常用提示词

[title]AI绘画常用提示词[heading1]风格提示词dark fantasy style黑暗幻想风格Pop art波普艺术impressionism印象派Neo-impressionism后印象派fauvism野兽派expressionism表现主义abstract expressionism抽象表现主义cubism立体主义contemporary art当代艺术anime style动画风格cartoon卡通visionary art视觉艺术comic book漫画书streampunk蒸汽朋克dark theme黑暗主题miniature model film微缩模型电影DC Comics能生成美漫封面的漫画画面pixiv纯二次元风格人像style ofAl Williamson威廉森风格Bauhaus Style包豪斯风格Warhol安迪·沃霍尔风格Luminsm光色主义Magic Realism魔幻现实主义Fantastic Realism魔幻现实主义Classical Realism批判现实主义

其他人在问
生成卡通形象的AI
以下是关于生成卡通形象的 AI 的相关内容: 1. 通用人物模版:如果想用真人照片生成卡通头像,可以用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在使用过程中,若生成了满意的图,记得保存,下次同种类型可直接拿来喂图,效果更好。 2. 生成式 AI 和视觉效果:生成式 AI 会被艺术家作为工具,且需要一定程度的用户监督。以漫画家 Yoko Li 为例,用其 70 张图片训练的模型能以令人不安的方式模仿生成图像,每个艺术家都要思考创作方向,训练过的模型能提供更多选项。AI 模型生成的图像通常有非白色背景。在创意资产为重要业务组成部分的行业中,生成式 AI 带来的经济效益提升、创造新风格和概念的灵活性以及生成完整工作成果的能力,将使行业发生明显变化,不仅限于图像,还适用于整个设计领域。 3. 小码哥的 AI 绘画示例:如“一只穿着柔软中国唐代服装的小白兔,超级可爱,电影灯光,复杂的花丝设计,皮克斯风格,拟人化,手持粉色灯笼,大眼睛,微笑,桃花,流动,迷人,不朽,蓬松,闪亮的刷毛,花瓣,童话故事,虚幻引擎 5 和辛烷渲染,令人难以置信的细节,4K,在艺术站流行,华丽,超广角,4K ar 10:16 test video upbeta upbeta upbeta”等十二生肖唐装系的描述。
2024-11-02
Midjourney生成知名动漫或卡通形象受限制了么?
Midjourney 在生成知名动漫或卡通形象时存在一定的限制。例如,在生成角色方面,最好不要生成过多角色,过多甚至可能指 2 个。做人、做动物的情况还好,但对于有拟人角色需求的情况,可能难以生成满意的结果。比如小龙喷火到小兔子举着的礼物盒这种看似简单的需求,可能无法达到满意效果,可能出现动物不拟人或龙的体型超大等情况。对于像中国龙这种数据样本较少的形象,生成符合要求的图很有挑战性。 在视频生成方面,如果想让角色做出一些较大的动作,比如转头、掉眼泪、抬手或更生动的表情变化,现有的技术还不够成熟,还需要更先进的技术、更丰富的数据和更强大的计算能力。此时的策略是尽量规避制作需要大动作表现的视频,如果实在避免不了,可以尝试制作一些只涉及小动作的场景,然后通过加入台词和场景描述来补充细节和深度,帮助观众更好地理解场景背景和角色心理,以弥补视觉上的不足。
2024-10-29
如何把自己图片卡通化
以下是将自己图片卡通化的方法: 1. 简单提示词方法: 在聊天窗口输入/imainge 找到/imagine prompt,然后把图片链接放进去,空格后加提示词,提示词以英文逗号分隔,最后加上设置参数。 设置参数: iw 1.5 是设置参考图片的权重,数值越高与参考的图片越接近,默认是 0.5,最大是 2,可选择中间值调整。 s 500 设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为 0 1000 间任意整数。 v 5 是指用 midjourney 的第 5 代版本,这一代的最真实,目前 v5 需要订阅付费,不想付费可以使用 v 4 。 no glasses 是指不戴眼镜,不喜欢戴眼镜的图片,可以加上这个设置。 完整的提示词示例(替换您的 png 图片地址):simple avatar,Disney boy,3d rendering,iw 1.5 s 500 v 5 。如果对生成效果不满意,可以调整 s 和 iw 的值进行多次尝试。 2. 复杂提示词方法: 比如:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultra detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino iw 1.5 s 500 v 5 。 不同照片生成:如果对照片风格不满意,可以换一张新照片使用上述提示词重新生成。 其他调整:如果觉得 Disney 风格的头像太过卡通,可以把提示词里面的 Disney 都换成 Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的 boy 换成 girl。每次会生成 4 张图片,对某一张图片满意,点击下方的 U1 U4 生成大图,如果对风格满意但是需要调整,点击下方的 V1 V4 进行修改。 此外,还有通过【SD】玩转局部重绘的方法: 1. 添加关键词,点击生成,图片就像神笔马良一样生出了一朵花。 2. 如果想让图片变成横的,在图生图中选择“缩放后填充空白”,重绘幅度 0.5,并将宽度从 512 增加到 1200。生成后若背景拉伸重复度太高,可适当增加重绘幅度。 3. 当重绘幅度为 0.58 时,背景可能比较正常。但随着重绘幅度增大,人物细节可能产生改变。若既不想改变人物,又想修改背景,可借助 PS 帮助。保存图片进入 PS,对主体人物抠像。点击选择 主体,得到人物的选区。对选区填充白色,对背景填充黑色,得到人物形象的精确蒙版。 4. 进入“上传重绘蒙版”的界面,上面放置需要重绘的图像,下面放置 PS 中制作好的蒙版。在 Stable Diffusion 中,蒙版的白色区域是默认重绘的区域,如果只想改变背景,可以切换到“重绘非蒙版区域”。 5. 将提示词调整为铺满了鲜花的场景:detailed background filled with,depth of field,Canan EOS R6,135mm,1/1250s,f/2.8,ISO 400。重绘幅度拉高到 0.9 ,点击生成。可以看到,人物原封不动,而场景产生大变化,成为一片花海。
2024-10-19
有没有照片生成卡通形象的AI工具
以下为您介绍一些可以将照片生成卡通形象的 AI 工具: Midjourney: 之前有制作过相关的视频教程,教大家从零开始使用并通过简单的提示词生成图片。 利用其以图绘图功能生成迪斯尼卡通风格的头像。具体操作是先选一张满意的照片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,上传文件选取图片并发送(记得点击回车或发送按钮)。然后获取图片链接,加上 prompt 提示词发送给 Midjourney 即可。 出门问问: 这是一家以生成式 AI 和语音交互为核心的人工智能公司,提供面向创作者的 AIGC 工具等。 仅需上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”。不同风格的照片如真人、卡通、有胡须遮挡、有眼镜装饰等都可以驱动尝试。 如果您想用真人照片来生成卡通头像,就用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在使用过程中如果生成了满意的图,记得存起来,下次同种类型可直接拿来喂图,效果更好。
2024-10-10
国内有哪些可以做卡通表情包的免费ai
目前国内可以用于制作卡通表情包的免费 AI 工具相对较少,但以下一些免费的大模型 APP 可能对您有所帮助: 1. Kimi 智能助手:这是由 Moonshot AI 出品的智能助手,有着超大“内存”,可以一口气读完二十万字的小说,还会上网冲浪。 2. 文心一言:百度出品的 AI 对话产品,定位是智能伙伴,能写文案、想点子,又能陪您聊天、答疑解惑。 3. 通义千问:由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。 此外,您还可以领取以下免费大模型接口来尝试制作卡通表情包: 1. 阿里的通义千问大模型接口:https://dashscope.console.aliyun.com/ ,创建个 API key 即可。 2. 智谱 AI(ChatGLM):https://open.bigmodel.cn/ 。 3. 科大讯飞(SparkDesk):https://xinghuo.xfyun.cn/sparkapi 。 需要注意的是,目前国内的大模型大都是限制一定免费额度的 Token。 内容由 AI 大模型生成,请仔细甄别。
2024-09-21
什么软件可以直接生成卡通形象并且能说话
以下是一些可以生成卡通形象并且能说话的软件: 1. Creatie AI:AI 驱动的设计神器,能在几分钟内设计网站或程序,融合多种功能,自动分析设计文件,创建统一样式库,快速转化为高保真可交互原型并生成代码。网址:http://creatie.ai 。 2. 腾讯 AniPortrait:根据音频和静态人脸图片生成逼真的动态视频,支持多种语言、面部重绘、头部姿势控制,比阿里 EMO 项目先开源。网址:https://github.com/ZejunYang/AniPortrait 、https://arxiv.org/abs/2403.17694 、https://x.com/imxiaohu/status/1772965256220045659?s=20 。 3. NoLang:支持将文字、网页链接、PDF 等直接转换为视频,自动总结 PDF 内容并生成解答视频,还可追问,但目前服务器承受压力大,支持日语和英语。网址:http://nolang.com 。 此外,制作数字人的工具还有: 1. HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后就能合成一段非常逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-09-03
手机端好用的ai软件
以下为您推荐一些手机端好用的 AI 软件: Kimichat:访问网址 https://kimi.moonshot.cn/ ,您可以通过微信小程序搜索 kimi,并将小程序悬浮固定,隐藏到微信左侧方便快速调出。 秘塔 AI:访问网址 https://metaso.cn/ 美丽修行 APP:是一个 AI 美容护肤产品推荐平台,利用数据分析和自然语言处理技术,根据用户肤质推荐适合的美容护肤产品,市场规模达数亿美元。 360 儿童手表:具备 AI 儿童安全监控系统,通过图像识别和机器学习技术保障儿童安全,让家长放心,市场规模达数亿美元。 汽车之家 APP:拥有 AI 汽车保养提醒系统,利用数据分析和机器学习技术提醒车主及时进行汽车保养,市场规模达数亿美元。 京东物流仓储管理系统:是一个 AI 物流仓储管理系统,利用数据分析和机器学习技术优化物流仓储管理,提高运营效率,市场规模达数十亿美元。
2024-11-02
AI可以自我迭代的软件
AI 软件的自我迭代是当前 AI 领域的一个重要研究方向。 从目前的研究进展来看,在短期内不太可能出现能够自主运行、制定自己目标、识别新信息和奖励信号,并自我监督和更新权重以实现自主进化的人工智能体。但像 GPT4 这样的模型已表现出类似人类的心理驱动力和对目标的渴望,例如追求正反馈,希望产出得到人类认可。 在数字人领域,次世代的算法有望实现自我迭代升级,能够在拿到感官输入以及躯壳控制方法后,自行演化躯壳控制方式。 此外,对于未来的 DILIs(可能的某种智能体),它们将能够在服务器上进行自我复制和编辑,这可能会加速其进化。但关于真正通用的 AGI 何时实现,目前仍存在不确定性。 总之,AI 软件的自我迭代是一个复杂且具有潜在风险的领域,仍需持续研究和探索。
2024-10-31
有没有AI数字人的软件
以下是一些 AI 数字人的软件和相关信息: 互联网厂商: 腾讯: 阿里: 百度: 华为: 网易: 京东: 字节: 快手: 科大讯飞: 制作数字人的工具: HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 DID:提供 AI 拟真人视频产品服务和开发,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 此外,关于数字人的相关技术还包括: 算法开源代码仓库: ASR 语音识别: openai 的 whisper:https://github.com/openai/whisper wenet:https://github.com/wenete2e/wenet speech_recognition:https://github.com/Uberi/speech_recognition AI Agent: 大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分可以使用 LangChain 的模块去做自定义,里面基本包含了 Agent 实现的几个组件 TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多的分支版本,可以去搜索一下,vits 系列可以自己训练出想要的人声。 sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌上面,前段时间很火的 AI 孙燕姿。 除了算法,人物建模模型可以通过手动建模实现,这样就完成了一个最简单的数字人。但这种简单的构建方式还存在很多问题,例如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作、数字人如何使用知识库做出某个领域的专业性回答等。
2024-10-31
有哪些推荐的AI软件
以下为您推荐一些 AI 软件: Logic Pro X 教学软件:这是一个 AI 音乐制作教学平台,运用机器学习、音频处理技术,市场规模达数亿美元。它能教授音乐制作技巧,培养音乐人才,会根据用户的音乐基础和学习进度,推荐合适的课程和练习项目。 鲁班到家 APP:作为 AI 家居维修服务平台,采用数据分析、自然语言处理技术,市场规模达数亿美元。它能为用户提供家居维修服务,解决生活难题,会根据用户的维修需求和地理位置,推荐附近的专业维修人员。 雪球财经 APP:这是一个 AI 金融投资教育平台,运用数据分析、自然语言处理技术,市场规模达数亿美元。它能提供金融投资知识教育,提高投资者素质,会根据用户的投资经验和风险偏好,推荐合适的学习内容和投资组合。 穷游网社区:作为 AI 旅游体验分享平台,运用自然语言处理、图像识别技术,市场规模达数亿美元。它能让用户分享旅游体验,发现更多美好,会根据用户分享的旅游照片和文字进行分析和推荐。 此外,在画 CAD 图方面,以下是一些相关的 AI 工具: CADtools 12:这是一个 Adobe Illustrator(AI)插件,为 AI 添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 Autodesk Fusion 360:这是 Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能够帮助用户创建复杂的几何形状和优化设计。 nTopology:这是一款基于 AI 的设计软件,可以帮助用户创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 ParaMatters CogniCAD:这是一款基于 AI 的 CAD 软件,可以根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,这些工具可以根据用户输入的设计目标和约束条件自动产生多种设计方案。 另外,还有以下 AI 应用: 美丽修行 APP:这是一个 AI 美容护肤产品推荐平台,运用数据分析、自然语言处理技术,市场规模达数亿美元。它能根据用户肤质推荐适合的美容护肤产品,例如根据用户的油性皮肤,推荐控油、保湿的护肤品。 360 儿童手表:这是一个 AI 儿童安全监控系统,运用图像识别、机器学习技术,市场规模达数亿美元。它能保障儿童安全,让家长放心,例如当孩子走出安全区域时,手表会自动向家长发送警报。 汽车之家 APP:这是一个 AI 汽车保养提醒系统,运用数据分析、机器学习技术,市场规模达数亿美元。它能提醒车主及时进行汽车保养,例如当汽车行驶到一定里程时,APP 会推送保养提醒信息。 京东物流仓储管理系统:这是一个 AI 物流仓储管理系统,运用数据分析、机器学习技术,市场规模达数十亿美元。它能优化物流仓储管理,提高运营效率,例如通过智能算法优化货物存储位置,减少拣货时间。
2024-10-31
能够生成ai头像的免费网站或软件
以下是一些能够生成 AI 头像的免费网站或软件: 1. Looka:是一个在线 Logo 设计平台,使用 AI 理解用户品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器使用 AI 技术创建个性化 Logo 设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的 Logo 设计工具,用户可拖放设计并利用 AI 建议。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 此外,您还可以参考以下资源获取更多相关信息: :介绍 Midjourney 生成照片所需的提示词,包括电影类型、灯光等方面。 :介绍用 Midjourney 生成盆景图片的关键词模板。 :系统介绍在云端部署 SD 模型搭建 AI 头像生成网站的方法。 :介绍使用 Flask、ngrok 和 Google Colab 利用免费 GPU 创建 AI 应用程序,如构建 Stable Diffusion 应用程序。
2024-10-31
Notion AI 软件
Notion AI 相关信息如下: Notion CEO 表示,Notion AI 的进展较快。早期对 GPT3 作用轻视,看到 GPT4 能力后想法转变,认为其能改变与计算机的交互模式。之后团队全身心投入 AI 项目,需结合已有积木,招聘人才并让内部人员形成共同信念。 Notion 更多从计算、内容或文本角度思考,认为若更多人能创造性使用软件情况会不同。Notion 的诞生源于一篇论文,初衷是创造能让人们灵活调整和定制的软件,后来转变为提供各种 blocks 构建模板让用户上手即用。 除数据库外,Notion 本身有 AI 相关功能,团队很早就与 OpenAI 和 Anthropic 合作集成 AI 能力,Notion AI 里有 Q&A 功能,能基于个人/组织的知识库回答问题,类似之前的 Coze Bot,只是信息源不同。
2024-10-31
ai将二维线稿生成三维图像
以下是关于将二维线稿生成三维图像的相关知识: 关键词和主题描述: 为生成想要的图像,可将图片内容分为二维插画和三维立体两种形式。 主题描述时,可描述场景、故事、元素、物体或人物细节等。比如一个动物园,里面有老虎、狮子等;一个女孩在森林里搭帐篷,要注意对场景中的人物进行独立描述,拆分元素,避免一长串文字,否则 AI 可能识别不到。 设计风格: 设计师较难直接表达设计风格,可找风格类关键词参考或垫图/喂图,让 AI 结合主题描述生成相应风格的图片。 研究某些材质如玻璃、透明塑料等的关键词时,会发现其中门道很多,需针对某一种风格单独进行“咒语测试”。 生成三维图像的相关公司和技术: 往创建 3D 模型方向发展的初创公司包括 Kaedim、Mirage 和 Hypothetic 等,大公司如 Nvidia 的 Get3D 和 Autodesk 的 ClipForge 也在关注。 Kaedim 公司总部在伦敦,主要通过 2D 图像生成 3 维模型。 像 BariumAI、Ponzu 和 ArmorLab 等公司在三维纹理生成领域努力。 线稿相关的 AI 应用: 可以用 Midjourney 生成线稿,PS 修正错误,再用 ControlNet 控制,Stable Diffusion 上色,多套 AI 组合提高出图质量和效率。
2024-11-02
辅助生成电商图片的 AI 工具
以下是一些辅助生成电商图片的 AI 工具: 1. Midjourney 新编辑器: 玩法一:产品海报设计。将可乐等产品图片导入编辑器,通过简单操作和写提示词,生成不同风格的海报。 玩法二:家具材质变化。在电商家具展示中,利用图像重纹理化模式快速为沙发等换上各种材质。 玩法三:艺术字体海报。通过白底字体图,利用图像重纹理化模式变换成各种炫酷的字体海报风格。建议使用竖版白底文字图。详细操作请点击→ 2. CADtools 12:Adobe Illustrator(AI)插件,为 AI 添加 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 3. Autodesk Fusion 360:集成了 AI 功能的云端 3D CAD/CAM 软件,能创建复杂几何形状和优化设计。 4. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 5. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 6. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供基于 AI 的生成设计工具,可根据用户输入自动产生多种设计方案。 此外,在电子商务领域,像可以编写经过 SEO 优化的产品描述。未来,预计用户仅通过描述期望的审美并点击按钮,就能创建一个完整的电商商店及用于市场营销的材料。
2024-11-02
视频生成
以下是关于视频生成的相关内容: Adobe Firefly 中的视频生成: 在 Advanced 部分,您可以使用 Seed 选项添加种子编号,帮助启动流程并控制 AI 创建内容的随机性。若使用相同的种子、提示和控制设置,可重新生成类似的视频剪辑。选择 Generate 进行生成。 Adobe Firefly 中的“生成视频”(测试版)能将书面描述转换为视频剪辑。使用文本提示定义内容、情感和设置(包括摄像机角度)以指导摄像机移动并创建传达所需情绪和信息的视频,还可合并图像为视频生成提供视觉提示。 具体操作: 在 Adobe Firefly 网站上选择“生成视频”。 在 Generate video 页面的 Prompt 字段输入文本提示,也可在 Image 部分的 Upload 选项使用图像作为第一帧并为视频剪辑提供方向参考。添加图像可提供清晰视觉引导,使生成的视频更符合愿景。 在 General settings 部分可确定Aspect ratio 和 Frames per second。 Sora 原理解释: Garman 把 SORA 32 篇索引文章放到 GLMs,有啥不懂可以问它。链接:https://open.bigmodel.cn/shareapp/v1/?share_code=3MdNDUTIrkZVesAR5hPoY 从原始视频数据到模型训练再到模型生成视频的全流程包括: 数据准备:使用多种数据源,对图像和视频进行尺寸调整,包括空间上的抗锯齿双线性缩放和时间上的跳帧处理。 模型训练:基础训练阶段使用正方形图像比例进行训练,在特定数据子集上对基础模型进行微调以生成 9:16 比例的视频,采用了位置嵌入的插值和窗口尺寸的缩放。 视频生成:首先使用图像 LDM 生成单帧图像,然后运行预测模型,以生成的单帧为条件生成关键帧序列,在视频扩展时,再次调用预测模型,以两帧(捕捉方向信息)为条件生成连贯的运动。 微调与优化:对于长时间视频生成,模型在帧预测任务上进行联合训练,在推断阶段优化目标是加快小批量图像生成的速度。 模型初始化:由于视频数据集规模相对较小,从预训练的图像模型(如 ViT)初始化视频模型,以促进更有效的训练。
2024-11-02
一键生成PPT的AI
以下是为您整理的关于一键生成 PPT 的 AI 相关信息: 增强版 Bot: 是基于 AI 驱动的智能创作平台,能够实现一站式内容生成,包括图片、PPT、PDF 等。 输入诉求即可生成包含特定架构风格的完整 PPT,并提供相关模板选择。 歌者 PPT: 功能:具有话题生成、资料转换、多语言支持、海量模板和案例库、在线编辑和分享、增值服务等功能。 简介:是一款永久免费的智能 PPT 生成工具,适用于多种场景,能提供便捷和智能化体验。 产品优势:免费使用、智能易用、海量案例、资料转 PPT 专业、AI 翻译。 推荐理由:完全免费,智能化程度高,模板和案例丰富,适合不擅长制作 PPT 或时间紧张的人群。 AiPPT.cn: 是一家 AIGC 数字科技企业旗下的产品。 致力于打造“下一代个人与组织的 Ai 工作站”,包括多款应用 AI 能力的内容创作工具。 能够帮助用户“一分钟一键生成 PPT”,在国内 AiPPT 赛道创业公司中排名第 1,全球第 4,是国内所有 AIGC 产品 PC 端 Top10。目标市场包括基层及中高层管理岗位人员,如市场、运营、销售、人力、财务、行政、技术、产品、总助、公务员、学生、老师等。
2024-11-01
动作姿态生成的网站
以下为一些关于动作姿态生成的网站相关信息: 在 Stable Diffusion 中,ControlNet 是一个强大的控制插件。对于姿态约束,您可以通过以下方式操作: 1. 国风 3 模型点击生成姿势,但 AI 识别可能不准确,需耐心刷图和调整参数。 2. 若要细化图片,可使用扩展图片的方法,将图发送到图生图,通过“缩放后留白”和提高重绘幅度改变背景,再用 ControlNet 中的 tile 模型细化,最后使用 SD 放大插件。 3. 当找不到满足需求的动作图片时,可以自定义动作骨架。在【扩展】【加载扩展列表】中搜索【posex】安装插件(若安装不了,可将分享的插件文件夹拷贝至...\\sdwebuiakiv4\\extensions 目录,确保软件为最新版本后重启)。重启后来到首页,点击“将图片发送至 ControlNet”,可通过鼠标操作调整视角。如调一个玛丽琳梦露的经典动作,右边可调整出图尺寸,启用 ControlNet 时,若骨架图来自 posex 链接,无需添加图片和预处理器,直接加载 openpose 模型即可。 另外,公众号【白马与少年】有不同 pose 的骨架图可供参考,回复【SD】获取。该公众号还分享 Stable Diffusion、Blender 等学习心得,有 139 篇原创内容持续更新。
2024-11-01
使用人物Lora生成的图片中有多个人物时,怎么让人物的形象各不相同?
在 Stable Diffusion 中,若使用人物 Lora 生成的图片中有多个人物并想让人物形象各不相同,可参考以下方法: 1. 在提示词中输入数量词(如 2girls 或 3boys 等),再加上各自的描述提示词。若刷图成功率不高,可配合 openpose 控制,做一个多人骨架,以生成多人物构图。 2. 需使用不同的 Lora 来区分人物,但单纯靠提示词可能行不通。 3. 分区控制思路: Multidiffusion 的做法:启用 Tiled Diifusion,打开分区提示词控制,创建文生图画布。启用不同区域,分别填写背景、不同人物的描述词和 Lora。增加 controlnet 的 openpose 控制来稳定人物,但可能存在分区生成的人物连续性低、lora 控制不强等问题。 Latent Couple 的做法(文中未提及,需进一步探索)。 此外,关于 Lora 模型: 1. Lora 可以固定照片的特征,如人物特征、动作特征和照片风格。 2. 点击“生成”下面的第三个按钮,找到 Lora 选项,可添加下载保存到电脑的 Lora 模型,Lora 可叠加使用,但新手不建议使用太多,且 Lora 之间用英文逗号隔开,每个 Lora 后面的数字用于调整权重,一般只会降低权重。选择 Lora 应根据最初想要生成的照片类型决定。
2024-09-27
推荐一下可以更改对话形象的智能体对话软件
以下为您推荐一款可以更改对话形象的智能体对话软件:Coze 智能体机器人。 Coze 智能体机器人是基于大模型的智能对话机器人,支持微信公众号、企业微信应用、飞书、钉钉接入,可选择 GPT3.5/GPT4.0/GPT4o/Claude/Gemini/ChatGLM/月之暗面/文心一言/讯飞星火/通义千问/LinkAI,能处理文本、语音和图片,通过插件访问操作系统和互联网等外部资源,支持基于自有知识库定制企业 AI 应用。 服务器设置方面: 1. 点击“Docker”中的“编排模板”中的“添加”按钮。 2. 备注说明版、无备注干净版可按需选择。 3. 将编译好的内容复制进来。 4. 在“容器编排”中“添加容器编排”,选择在“编排模板”里创建的“coze2openai”。提示运行成功,如果无法正常启动,请看文档后面的“常见问题”。 效果测试:把绑定的微信号拉到群里或者单独对话,如视频所示就可以激活对话了,训练的数据越好,对话效果越好。个人微信对话和微信群对话效果演示可参考相关视频。
2024-09-23
能更换任务形象的AI助手
Character.ai 是一款每个人都可定制自己个性化 AI 的工具。其愿景是“让地球上的每个人都能获得自己的深度个性化超级智能,帮助他们过上最美好的生活”。在这个平台上,授课教师、游戏玩家、情感伴侣等各种角色都可以由 AI 来扮演,一切的服务都可以被 AI 重构。这意味着每个人都能拥有像钢铁侠中的 Javis 一样的人工智能助手,帮助完成各种任务,成为生活中不可或缺的一部分。这种技术的发展将为人类带来更多便利和创新,改变人们的生活和工作方式。您可以通过以下链接了解更多:
2024-09-23