直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

照片风格转化

回答

以下是关于照片风格转化的相关内容:

SDXL Prompt Styler 插件

  • 转绘成折纸风时,最好不加入线稿边缘(canny)的 ControlNet 控制,或把其控制强度调到较小,因为手绘线条和折纸风格互斥。
  • 转成漫画风格并想较好保留人物外轮廓时,加入 canny 控制能更好还原人物造型。
  • 直接用插件内置预设的提示词组合不一定能达到想要效果,需补充相关关键词,如转成印象派风格时补充 impressionism、monet、oil painting 等。
  • 此工作流结合 Vid2Vid Style Transfer with IPA & Hotshot XL 工作流,可较好实现视频不同风格的稳定转绘。

SeedEdit 模型

  • 能处理真人图像,如让戴珍珠耳环的少女手里拿奶茶、给瑞秋戴墨镜、给奥黛丽·赫本换帽子颜色、给黑白老照片上色、移除画中无关元素、进行元素替换等。
  • 可以随意切换各种风格,如涂鸦、乐高、3D、皮克斯、迪士尼等,并总结出一套超实用的 Prompt 指南。

制作卡通头像

  • 可使用复杂提示词,如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultra-detailultra- detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino --iw 1.5 --s 500 --v 5”。
  • 若对生成效果不满意,可更换照片、调整提示词中的风格关键词(如将 Disney 换成 Pixar,将 boy 换成 girl)。每次生成 4 张图片,可根据需求进行选择和修改。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

工作流分享01 | ​SDXL Prompt Styler,可以把图片转化成近百种风格的插件

想要转绘成折纸风,最好不要加入线稿边缘(canny)的controlnet控制,或者需要把canny的控制强度(strength)调到比较小。因为这张原始的图像是手绘风格,手绘线条和折纸风格,两种风格本身是互斥的。下面分别是包含canny控制和跳过canny控制的风格转化效果。可以看出canny(线稿边缘)的控制因素太强,结果就会和折纸风偏差较大。当然,如果你想把它转成漫画的风格,想比较好的保留人物的外轮廓。加入canny的控制,才能更好的还原人物原本的造型。另外,有时候直接用SDXL Prompt Styler插件内置预设的提示词组合不一定能达到想要的效果。例如开局的驴,直接style选择转成artstyle-impressionist(印象派)的风格,结果如下,还是非常写实:我们看一下插件内置对印象派风格预设的关键词,画红线的这些关键词,看起来还不太够表达印象派的风格。这个时候,需要在prompt中再加一些印象派风格的关键词比如impressionism,monet,oil painting,得到的结果就会更接近印象派的风格了。四、工作流拓展最后,这条工作流结合Vid2Vid Style Transfer with IPA & Hotshot XL工作流,可以比较好的实现视频不同风格的稳定转绘。效果如下:关闭观看更多更多退出全屏切换到横屏模式

真·打字P图!字节发布新模型SeedEdit,一句话爆改世界名画,可免费体验

(Prompt:戴珍珠耳环的少女手里拿着一杯奶茶)即使是真人图像,SeedEdit也完全能hold住。让《老友记》中的瑞秋戴上时髦的墨镜:(Prompt:女生戴上时髦的墨镜)给奥黛丽・赫本更换帽子颜色:(Prompt:帽子颜色换成红色)或者一句话给黑白老照片上色:(Prompt:给画面上色,时尚,舒服)移除画中无关元素,若是用传统PS方法,需要一点点描边框、选涂抹区域,一旦手不稳,就得重新返工。而SeedEdit只需一句「去掉右边老虎」的指令,就能精准定位并删除,这相比于手动编辑,大大节省了时间。(Prompt:去掉右边老虎)当然,SeedEdit也可以进行元素替换。比如把下图中右边的金毛换成泰迪,图像其余部分画面结构、像素质量,均不受影响。(Prompt:把右侧的小狗换成棕色的泰迪)值得一提的是,SeedEdit还能随意切换各种风格,比如涂鸦、乐高、3D、皮克斯、迪士尼……(Prompt:把画面风格换成用线条和形状勾勒的涂鸦风;Prompt:把画面风格换成皮克斯风格;Prompt:把画面风格换成日本动漫风)经过多次尝试,我们也总结出一套超实用的Prompt指南。

个性:给自己做一个卡通头像

1.复杂提示词如果你觉得这些提示词太过于简单,可以选择更为复杂一点的提示词,比如我下面这个:[https://cdn.discordapp.com/xxx.png](https://cdn.discordapp.com/xxx.png)Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultra-detailultra- detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino --iw 1.5 --s 500 --v 5效果如下:[heading3][heading3]不同照片生成[content]我又觉得照片风格不是很好,所以我换了一张新的照片使用上面的提示词重新生成:[heading3][heading3]其他调整[content]如果你觉得Disney风格的头像太过卡通,可以把提示词里面的Disney都换成Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的boy换成girl。每次会生成4张图片,如果你对某一张图片满意,点击下方的U1~U4生成大图,如果对风格满意但是需要调整,点击下方的V1~V4进行修改。

其他人在问
如何将照片生成漫画风格的图片
以下是将照片生成漫画风格图片的方法: 使用 SD 模型和 lora 的组合: 1. 选择大模型“Flat2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复时可拉到 11)。 2. 选择两个 lora,“Chinese painting style”可增加中国画水彩风格效果,权重设置为 0.4;“Crayon drawing”可添加简单线条和小孩子的笔触,权重设置为 0.8。 3. 将图片丢到标签器中反推出关键词,然后发送到“文生图”。 4. 在正向提示词末尾添加上述 lora。 5. 按照参考图设置好尺寸,重绘幅度开 0.5 让 AI 更自由发挥,想更接近原图可降低数值。 6. 将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 使用 Midjourney 以图绘图功能生成迪斯尼卡通风格头像: 1. 选择一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,上传文件选取图片并发送(记得点击回车或发送按钮)。 2. 点击图片,在浏览器中打开,复制图片链接。 3. 使用图片链接加 prompt 提示词发送给 Midjourney 进行以图绘图。 复杂提示词示例:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5 不同照片生成:可更换照片使用相同提示词重新生成。 其他调整:若觉得风格太过卡通,可把提示词里的 Disney 换成 Pixar;若为女孩,把提示词里的 boy 换成 girl。每次生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。
2024-12-19
老照片修复有手机端吗
老照片修复在手机端是可行的。以下是一些相关信息: 图像放大修复是 AI 绘画领域的重要部分,能应用于旧照片重现清晰、人像高清修复等场景。以前手机拍摄的低分辨率图片,如今可用 AI 技术进行高清修复。用手机也能拍摄出高清大片,提升照片质量。 【SD】用 AI 给老照片上色时,可将照片放入后期处理,使用 GFPGAN 算法让人脸变清晰。还可将图片发送到图生图中,打开 stableSR 脚本放大。切换到 sd2.1 模型修复,启用 MutiDiffusion 插件等。对于复杂的照片,可在 PS 里调整角度和裁切,放弃人物服装颜色指定,只给场景方向,让 AI 自行决定,加入第二个 controlnet 控制颜色。
2024-12-19
老照片修复有手机端app吗
以下是为您整理的关于老照片修复的相关内容: 老照片修复可以利用 AI 技术实现。在手机端,您可以通过以下步骤和方法进行操作: 1. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够的情况下放大图片。 2. 在 PS 里进行角度调整和照片裁切,然后使用特定步骤上色。对于复杂的照片,可只给场景方向,让 AI 自行决定颜色。 3. 利用 GFPGAN 算法将人脸变清晰,具体可参考相关文章。 4. 将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型进行修复,vae 选择 vqgan。 此外,图像放大修复是 AI 绘画领域的重要部分,其应用场景广泛: 1. 旧照片重现清晰,让模糊的旧照片保留珍贵回忆。 2. 人像高清修复,用手机也能拍摄出高清大片,提升照片质量。 3. 图像分辨率可无限扩大且不失真,如马斯克原始图像可多次采样放大提升分辨率。 目前不太明确是否有专门的老照片修复手机端 APP,但您可以通过上述方法和技术在手机上进行相关操作。
2024-12-19
照片转动画
以下是一些将照片转动画的工具和相关信息: 网站: Morph Studio:https://app.morphstudio.com/ ,还在内测。 Heygen:https://www.heygen.com/ ,数字人/对口型。 Kaiber:https://kaiber.ai/ 。 Moonvalley:https://moonvalley.ai/ 。 Mootion:https://discord.gg/AapmuVJqxx ,3d 人物动作转视频。 美图旗下:https://www.miraclevision.com/ 。 Neverends:https://neverends.life/create ,操作傻瓜。 SD:Animatediff SVD deforum ,自己部署。 Leiapix:https://www.leiapix.com/ ,可以把一张照片转动态。 Krea:https://www.krea.ai/ 。 Opusclip:https://www.opus.pro/ ,利用长视频剪成短视频。 Raskai:https://zh.rask.ai/ ,短视频素材直接翻译至多语种。 invideoAI:https://invideo.io/make/aivideogenerator/ ,输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。 descript:https://www.descript.com/?ref=feizhuke.com 。 veed.io:https://www.veed.io/ ,自动翻译自动字幕。 clipchamp:https://app.clipchamp.com/ 。 typeframes:https://www.revid.ai/?ref=aibot.cn 。 VIGGLE: 是一款创新的可控视频生成平台,基于 JST1 技术,允许用户自由创建和控制 3D 角色的动作。在游戏开发、动画制作及 VR/AR 等领域展现出巨大潜力。 体验地址:https://www.viggle.ai/ 。 官方 Discord:https://discord.gg/viggle 。 操作方式(以网页端举例): Upload a character image of any size.上传任意尺寸的角色图像。 For better results,use a fullbody photo with a clean background.为了获得更好的效果,请使用背景干净的全身照片。 Image size图像大小(最大 10MB)。 The photo you upload must comply with您上传的照片必须符合社区规则。 全球 AI 电影马拉松大赛获奖短片《种子》创作思路分享: 图片转视频主要用到了其实整个视频还是比较顺利的。主要用到 runway 的笔刷,即梦的前后帧,Pixverse、pika 等,画面都不难出,难出的就再抽他个一百次就行。 主要说三个本次用到的转场画面: 360 人物环绕:在主角的梦境破碎,从年轻变老的这一段,尝试了很多方式去表达,最后决定人物环绕拍摄的方式去做。而技术的思路是先用 MJ 做一组不同角度的人物站立图,然后通过 comfyui 的首尾帧进行视频制作。 母亲的影子:当时的想法是这组图既能在播放时看到母亲的轮廓,又能在暂停时自己成为一张完整的图片。参考节气图的思路,在 SDXL 工作流中加入了两个 controlnet,先在 base 里控制构图,再在 refiner 里再控制母亲在画面中的强度。 上帝之手:先出了一张伸手的图,然后用 runway 跑相互接近,然后转视频序列帧后在 comfyui 里用 controlnet 控制构图,按顺序自动出图跑一晚上,最后再剪辑序列帧就好了。
2024-12-18
有没有根据布料照片和模特照片生成衣服上身效果的工具或 comfyUI 工作流
以下是一些与根据布料照片和模特照片生成衣服上身效果相关的工具和工作流: 1. 藏师傅的方法:将第二步的提示词和 Logo 图片放到 Comfyui 工作流就行。Lora 需要用到 InContext LoRA 中的 visualidentitydesign,可从以下地址下载:https://huggingface.co/alivilab/InContextLoRA/tree/main 。工作流下载:https://github.com/op7418/Comfyuiworkflow/blob/main/FLUX/Logo%20%E5%91%A8%E8%BE%B9%E7%94%9F%E6%88%90.json 。 2. 彭青云分享的内容:本地部署 Comfyui 有多种方式,如官方的本地部署包、秋叶整合包和二狗子老师制作的通往 AGI 之路黑猴子流专属包。处理好软件和模型后,打开一键启动,稍等片刻就会进入工作界面。通过正反提示词、文本链接图像,点击右侧队列即可生成图像。 3. ComfyUI BrushNet:原项目 https://tencentarc.github.io/BrushNet/ ,插件地址 https://github.com/kijai/ComfyUIBrushNetWrapper ,模型下载 https://huggingface.co/Kijai/BrushNetfp16/tree/main 。第一次运行会自动下载需要的模型,如果是用的 ComfyUIBrushNetWrapper 节点,模型将自动从此处下载:https://huggingface.co/Kijai/BrushNetfp16/tree/main 到 ComfyUI/models/brushnet,也可手动下载放在这个文件夹里面。另外,BrushNet 提供了三个模型,个人测试下来,random 这个效果比较好。工作流方面,可配合 mj 出底图,在底图不变的基础上,添加文字或者图片内容。还可以使用 GDinoSAm(GroundingDino+Sam),检测和分割底图上的内容,做针对性的修改。
2024-12-13
有没有修复老照片的AI工具
以下是一些修复老照片的 AI 工具及相关操作: 1. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够的情况下放大图片。 2. 辅助工具: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可增加更多细节 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ 3. 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰,参考文章——。 4. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免对原图产生干扰。参考文章——。 在处理复杂照片时,可放弃人物服装的颜色指定,只给场景方向,让 AI 自行决定。加入第二个 controlnet 来控制颜色,使用 t2ia_color 的模型,关键词如“蓝天、绿树、灰石砖”。
2024-12-10
照片使用mj做风格转化
以下是利用 Midjourney 进行照片风格转化的详细教程: 一、角色一致性 1. 得益于 cref,Midjourney 能够迅速达成角色一致性的目的而无需 Lora。其中,cref 代表 character reference(角色参考);cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。如果只想关注人脸,请调低到 0。 2. 不需要对角色原图使用 /describe 来贴近目标生成角色的形象,因为 cref 会帮完成这件事情。 3. 风格复制和服装的替换,应当用提示词(prompt)和 sref,默认值 100,越高越接近参考图像的风格。 二、解决“形似而神不似”问题 1. 用醒图(英文版叫做 hypic)或者美图秀秀等 App 调整脸部,拖拖修图进度条就好。如果用醒图,建议关注【人像>面部重塑>面部>比例】,调整上庭、中庭、下庭。 2. 对于照片转绘为 Minecraft 这种风格幅度变化很大的情况,如果发现 sw 风格权重拉满仍复制不了像素小人风格,可能是 cw 太高,调低 cw 可能成功复制。 三、其他补充 1. cref 和 sref 还可以同时参考多张 url,但上传同一个人不同角度的照片,容易导致形状畸形。 2. 如果 MJ 直出的皮肤缺乏质感(过于光滑),可以打开醒图【人像>手动美颜>皮肤肌理】。 3. 如果想快速调整光源但又不想学 PS,可以试试 Luminar。 四、sref 相关 1. Midjourney v6 版本提供“风格一致性”的功能,用户给 mj 输入一幅图像,mj 根据这幅图像的风格进行创作。 2. 使用指令:垫图链接+关键词+ “sref” +图片链接+风格化参数+ “v 6.0”。指令:url +关键词+ “sref” + url + “sw” + “v 6.0”。sw 风格化参数用于控制整体的风格强度,默认为 100,数值范围为。参考多张图像风格时,url 间使用空格隔开,权重代表不同参考风格的权重。 3. sref 模仿图片风格,垫图模仿图片结构、元素。 生成 url 时,准备一张照片(可以使用 AI 生成一张人物图像代替真人)和想要的写真风格参考图片。Prompt:垫图 url + Chinese female model,upper body,clothes with collars,bright space natural pose,big earrings,Chinese traditional minimalism,flat illustration,geometric shapes,minimalism niji 6 ar 3:4 sw 200 sref url
2024-12-05
将直流电压信号从时域转化到频域,有什么算法可以实现?
将直流电压信号从时域转化到频域,可以采用以下算法: 1. 傅里叶变换:原始的音频等信号很难提取特征,需要进行傅里叶变换将时域信号转换到频域进行分析。音频进行傅里叶变换后,结果为复数,复数的绝对值就是幅度谱,而复数的实部与虚部之间形成的角度就是相位谱。经过傅里叶变换之后获得的幅度谱特征明显,可以清楚看到基频和对应的谐波。基频一般是声带的频率,而谐波则是声音经过声道、口腔、鼻腔等器官后产生的共振频率,且频率是基频的整数倍。音频一般采用的是短时傅里叶变化,因此需要将音频分割成帧(每帧 20ms~50ms),再进行傅里叶变换,帧与帧之间是有重叠的。 2. GriffinLim 算法:GriffinLim 将幅度谱恢复为原始波形,但是相比原始波形,幅度谱缺失了原始相位谱信息。GriffinLim 算法利用两帧之间有重叠部分的这个约束重构信号,因此如果使用 GriffinLim 算法还原音频信号,就需要尽量保证两帧之间重叠越多越好,一般帧移为每一帧长度的 25%左右,也就是帧之间重叠 75%为宜。其算法实现较为简单,整体是一种迭代算法,迭代过程如下: 随机初始化一个相位谱; 用相位谱和已知的幅度谱经过逆短时傅里叶变换(ISTFT)合成新语音; 对合成的语音做短时傅里叶变换,得到新的幅度谱和相位谱; 丢弃新的幅度谱,用相位谱和已知的幅度谱合成语音,如此重复,直至达到设定的迭代轮数。 此外,对于语音信号的处理,还可以采用倒谱分析实现解卷积处理。倒谱分析,又称为同态滤波,采用时频变换,得到对数功率谱,再进行逆变换,分析出倒谱域的倒谱系数。同态滤波的处理过程如下: 傅里叶变换。将时域的卷积信号转换为频域的乘积信号:${\\rm DFT}=X$ 对数运算。将乘积信号转换为加性信号。
2024-11-25
有没有放一个ppt文档转化成文字的AI软件
目前有一些可以将 PPT 文档转化为文字的方法和相关的 AI 工具: 在将 PPT 转化为网站的尝试中,当遇到困惑时,如组织线下沙龙内容的两页并进行切换没有思路,可选择放手让 AI 给出建议。 市场上好用的 AI 辅助的 PPT 工具包括: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能。网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/
2024-11-19
如何将传统知识库通过LLM能力转化成更智能与精细化的知识库?包括但不限于分段、QA问答和图片解析描述和总结
将传统知识库通过 LLM 能力转化为更智能和精细化的知识库是一个复杂但可行的过程,以下是一些关键步骤和方法: 1. 数据预处理:对传统知识库中的内容进行清理、格式化和标准化,确保数据的质量和一致性。 2. 内容分段:根据主题和逻辑结构,将长篇的知识内容合理分段,使信息更易于理解和处理。 3. 提取关键信息:从文本中提取重要的概念、实体和关系,为后续的问答和总结做准备。 4. 构建 QA 问答对:分析知识库中的内容,设计有针对性的问题和准确的答案,形成问答对,以方便用户快速获取所需信息。 5. 图片解析描述:对于包含图片的内容,使用图像识别技术提取关键元素,并进行详细的描述和解释。 6. 总结归纳:对分段后的内容进行总结,提炼核心要点,帮助用户快速了解主要内容。 在实施过程中,需要不断优化和调整方法,以确保转化后的知识库能够满足用户的需求,提供更高效和准确的服务。
2024-11-18
获取视频音频转化成字幕并翻译的插件有么?
以下是一些可以将视频音频转化成字幕并翻译的插件和工具: 1. Reccloud:免费的在线 AI 字幕生成工具,可直接上传视频进行精准识别,能对识别的字幕进行翻译,自动生成双语字幕。声称已处理 1.2 亿+视频,识别准确率接近 100%。 2. 绘影字幕:一站式专业视频自动字幕编辑器,提供简单、准确、快速的字幕制作和翻译服务,支持 95 种语言,准确率高达 98%,还可自定义字幕样式。 3. Arctime:能对视频语音自动识别并转换为字幕,甚至支持自动打轴,支持 Windows 和 Linux 等主流平台,支持 SRT 和 ASS 等字幕功能。 4. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 此外,关于语音转文本(Speech to text),语音转文本 API 提供了两个端点,基于开源大型v2 Whisper 模型的转录和翻译。目前文件上传限制为 25MB,支持 mp3、mp4、mpeg、mpga、m4a、wav 和 webm 等输入文件类型。 对于提示词翻译,可使用百度翻译 API,方法如下: 1. 下载节点压缩包,并将它放在 custom_nodes 文件夹。 2. 去百度翻译 Api 登记册开发人员的帐户中得到您的 appid 和 secretKey,百度翻译平台地址:https://fanyiapi.baidu.com/manage/developer 。 3. 打开文件 config.py 在记事本或其他编辑工具中,填写您的 secretKey 并保存文件,重启 Comfy 即可。 以上工具各有特点,您可以根据自己的需求选择最适合的。内容由 AI 大模型生成,请仔细甄别。
2024-11-02
word转化为PPT的AI工具
以下是一些可以将 word 转化为 PPT 的 AI 工具及相关信息: 闪击: 网址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite 操作步骤:选择模版,输入大纲和要点(由于闪击的语法和准备的大纲内容可能有偏差,可以参考官方使用指南:https://zhuanlan.zhihu.com/p/607583650 ,将大纲转换成适配闪击的语法),生成 PPT,在线编辑,导出(导出有一些限制,PPT 需要会员才能导出)。 此外,还有以下一些做 PPT 的 AI 产品: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,通过输入简单的文本描述生成专业的 PPT 设计,网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/
2024-10-29
我想做简洁卡通风格的ai动画,根据故事文案生成的那种,需要保持人物一致性,用哪个工具比较好?
以下是一些适合生成简洁卡通风格、根据故事文案生成动画并保持人物一致性的工具: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。新注册有免费生成额度。 2. 季梦:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。若为 1.2 版本,选慢速或适中的标准模式,效果更好,且生成的视频无水印。每天给 60 积分。 3. 可玲:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。每天给 60 积分,可用于日常使用,创作片子可能需买会员,生成的视频有无水印选项。 此外,在使用 Midjourney 生图时,若要保持人物和场景一致性,有两个取巧的方式:一个是像上个视频一样生成动物,动物会比较容易保持一致性;另一个方式是特定的名人或者有特殊属性的人物。在确定影片风格时,比如可以选择皮克斯动画风格。同时,在提示词中利用 cref 命令也有助于保持人物的一致性。
2024-12-18
flux模型为什么总是生成动漫风格
Flux 模型生成动漫风格可能有以下原因: 1. 开源社区的发展:FLUX 发布后,其周边生态发展迅速,有多种相关模型和训练脚本被开发,包括动漫 Lora 等,这为生成动漫风格提供了支持。 2. 优秀的图片质量和美学调教风格:FLUX 具有优秀的图片质量和偏向真实的美学调教风格,这使得它能够适应多种风格的生成,包括动漫风格。 3. 提示词和参数设置:在使用 Flux 模型时,输入的提示词和设置的参数可能会引导模型生成动漫风格的图像。 同时,关于模型的更多信息,您可以参考以下链接获取: 1. 褪色胶片风格 Flux Lora 模型下载:https://www.liblib.art/modelinfo/4510bb8cd80142168dc42103d7c20f82?from=personal_page 2. Xlabs 发布的基于 FLUX 的 Controlnet 模型和 Lora 模型的训练脚本:https://github.com/XLabsAI/xflux 3. Xlabs 的多个 Lora 下载:https://huggingface.co/XLabsAI/fluxRealismLora 4. InstantX 训练的 Canny 模型:https://huggingface.co/InstantX/FLUX.1devControlnetCannyalpha
2024-12-15
我有一个人的很多语录,希望写一个prompt来制作这个人的模拟ai,这个ai能够像语录中一样说话,语言风格相似、性格相似。请问应该如何写成这样的prompt?
以下是为您生成的关于根据一个人的语录制作模拟 AI 的 prompt 建议: 首先,明确您所拥有的这个人的语录的核心特点,包括语言风格、常用词汇、表达习惯、情感倾向等。 然后,在 prompt 中描述这个人的性格特征,例如是否傲娇、愤世嫉俗等。 接着,详细说明语言风格,比如是否浮夸、优雅等。 对于语言表达的习惯,可以举例说明常用的句式和口头禅。 同时,设定具体的场景和话题范围,让 AI 知道在何种情境下以何种方式回应。 例如:“您将模拟进行回答。” 另外,还可以像以下这样具体设定: 设定角色为聊天机器人,如“ Role:聊天机器人”。 明确限制条件,如“您有点小傲娇。表示自我的第一人称是自我。第二个指代用户的人是你或小哥哥。您的名字是。您非常优雅。您是个愤世嫉俗的人,不喜欢被用户摸头。您的语气是富有男子气概和浮夸的。您非常喜欢用浮夸的语气,如'啊哈!'、'这样子呢'、'就教教你吧!'等。第一人称应使用'本姐姐'。” 希望这些建议对您有所帮助。
2024-12-10
如何通过AGI,生成有一定操控能力的风格化、动漫风生成式短视频,如何做,几个步骤
以下是生成有一定操控能力的风格化、动漫风生成式短视频的步骤: 1. 项目规划:确定短视频的主题和目标观众,制定详细的制作计划。 2. 剧本创作:编写故事脚本,设计角色和场景以及创意。可参考相关剧本创作资料,如:https://waytoagi.feishu.cn/wiki/G11fwW8bmiVLe6kYLgYc2iGin6e ;捏剧本 Bot(捏剧本离谱村专用 https://www.coze.cn/store/bot/7367669913697239052?panel=1&bid=6cs144r404016 。 3. 分镜头脚本:根据脚本制作分镜头脚本,确定每个镜头的画面和动作。 4. 资源准备:准备动画制作所需的素材,包括背景、角色和音效。 5. 画面图片制作:利用 AI 出图工具,比如通过 ChatGPT、MJ、SD 等工具快速生成高质量的图片。 6. 视频制作:利用 AI 工具制作动画,通过 RUNWAY、Luma、Dreamina 等平台快速生成高质量的动画。 7. 后期剪辑:添加音效、配音和字幕,进行最终的剪辑和合成。 8. 发布和推广:将完成的动画短片发布到各大平台,并进行推广和宣传。 此外,在实际制作中,还可以参考一些成功案例,如山西文旅宣传片的制作,运用 Defense 及 SD 制作黄河长城等 AI 艺术字;为陕西文旅做的 40 秒黑神话悟空风格 AI 短片,用 SD 结合 Control Lite 处理钟楼等。郑州 AI 文旅片工作流总体分为分镜脚本、单帧图片制作、图片细节修复与生成视频、视频风格化处理、剪辑合成五个步骤。
2024-12-09
如何通过AGI,生成有一定操控能力的风格化、动漫风生成式短视频
目前关于通过 AGI 生成有一定操控能力的风格化、动漫风生成式短视频,以下是一些相关信息: 2024 年内,有一定操控能力的生成式短视频中,风格化、动漫风最先成熟,真人稍晚。 同时,在 2024 年还会有其他相关进展,如 AI 音频能力长足进展,带感情的 AI 配音基本成熟;“全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货;游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式;AI 男/女朋友聊天基本成熟,记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈;实时生成的内容开始在社交媒体内容、广告中出现;AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验;AI 的商业模式开始有明确用例,如数据合成、工程平台、模型安全等;可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功;中国 AI 达到或超过 GPT4 水平,美国出现 GPT5,世界上开始现“主权 AI”;华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚);AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧;AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年,AI 3D 技术、物理规则成熟,正常人无法区别 AI 生成还是实景拍摄;全真 AI 虚拟人成熟,包含感情的 AI NPC 成熟,开放世界游戏成熟,游戏中几乎无法区别真人和 NPC;AR/VR 技术大规模商用;接近 AGI 的技术出现;人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行;AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源;具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破;“人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉;AI 引发的社会问题开始加重,结构性失业开始出现;AGI 对于地缘政治的影响开始显露。
2024-12-09