直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

照片转漫画风格

回答

以下是为您提供的关于照片转漫画风格的相关信息:

  1. Magnific AI 推出了照片风格化功能,可将任意照片转换成任意风格,能控制样式数量和结构完整性,适用于多种用例。相关链接:https://x.com/imxiaohu/status/1769710736132227434?s=20
  2. 莱森提供了利用一致性 MJ 出海马体写真的教程。例如,若用醒图调整脸部,可关注【人像->面部重塑->面部->比例】调整上庭、中庭、下庭;在转绘中,对于照片转 Minecraft 这种风格幅度变化大的情况,若复制不了像素小人风格,可能是因为--cw 太高,调低可成功复制;cref 和 sref 同时参考多张 url 时,上传同一个人不同角度的照片不一定更容易直出,可能导致结果畸形;若 MJ 直出的皮肤缺乏质感,可使用醒图【人像->手动美颜->皮肤肌理】,若想快速调整光源,可试试 Luminar。
  3. Animagine XL 3.1 作为动漫主题文本到图像模型更新发布,扩展了对广泛动漫风格的理解,提高了生成图像质量,解决了过曝问题,新增了美学标签,优化了结果准确性。相关链接:https://cagliostrolab.net/posts/animagine-xl-v31-release 、https://huggingface.co/cagliostrolab/animagine-xl-3.1 、https://huggingface.co/spaces/cagliostrolab/animagine-xl-3.1 、https://x.com/imxiaohu/status/1769691980882432192?s=20
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

XiaoHu.AI日报

[title]XiaoHu.AI日报[heading2]3月18日🔔Xiaohu.AI日报「3月18日」 ✨✨✨✨✨✨✨✨1⃣️📸 Magnific AI推出照片风格化功能:任意照片转换成任意风格。控制样式数量和结构完整性,适用于多种用例。🔗 https://x.com/imxiaohu/status/1769710736132227434?s=202⃣️🎵《滚石》报道Suno AI与ChatGPT合作创作的歌曲:Suno AI生成的音乐,ChatGPT提供歌词和标题。模仿独奏原声密西西比三角洲蓝调,讲述一个悲伤的AI故事。🔗 https://rollingstone.com/music/music-features/suno-ai-chatgpt-for-music-1234982307/🔗 https://soundcloud.com/rs-539916550/soul-of-the-machine🔗 https://x.com/imxiaohu/status/1769702028425744427?s=203⃣️🖌️ Animagine XL 3.1,动漫主题文本到图像模型更新发布:扩展对广泛动漫风格的理解,提高生成图像质量。解决过曝问题,新增美学标签,优化结果准确性。🔗 https://cagliostrolab.net/posts/animagine-xl-v31-release🔗 https://huggingface.co/cagliostrolab/animagine-xl-3.1🔗 https://huggingface.co/spaces/cagliostrolab/animagine-xl-3.1🔗 https://x.com/imxiaohu/status/1769691980882432192?s=204⃣️🚀奥特曼关于GPT-5的看法:

XiaoHu.AI日报

[title]XiaoHu.AI日报[heading2]3月18日🔔Xiaohu.AI日报「3月18日」 ✨✨✨✨✨✨✨✨1⃣️📸 Magnific AI推出照片风格化功能:任意照片转换成任意风格。控制样式数量和结构完整性,适用于多种用例。🔗 https://x.com/imxiaohu/status/1769710736132227434?s=202⃣️🎵《滚石》报道Suno AI与ChatGPT合作创作的歌曲:Suno AI生成的音乐,ChatGPT提供歌词和标题。模仿独奏原声密西西比三角洲蓝调,讲述一个悲伤的AI故事。🔗 https://rollingstone.com/music/music-features/suno-ai-chatgpt-for-music-1234982307/🔗 https://soundcloud.com/rs-539916550/soul-of-the-machine🔗 https://x.com/imxiaohu/status/1769702028425744427?s=203⃣️🖌️ Animagine XL 3.1,动漫主题文本到图像模型更新发布:扩展对广泛动漫风格的理解,提高生成图像质量。解决过曝问题,新增美学标签,优化结果准确性。🔗 https://cagliostrolab.net/posts/animagine-xl-v31-release🔗 https://huggingface.co/cagliostrolab/animagine-xl-3.1🔗 https://huggingface.co/spaces/cagliostrolab/animagine-xl-3.1🔗 https://x.com/imxiaohu/status/1769691980882432192?s=204⃣️🚀奥特曼关于GPT-5的看法:

莱森:利用一致性MJ 出海马体写真的教程来啦

[title]莱森:利用一致性MJ出海马体写真的教程来啦[heading2]视频教程:如果你不控制变量一个个调整,就会觉得「怎么眼睛嘴巴合在一起就不像我了?」此时,用醒图(英文版叫做hypic)或者美图秀秀等App调整脸部,拖拖修图进度条就好了~完成度就从50%->80%甚至更高!如果你用的是醒图,我建议关注一下【人像->面部重塑->面部->比例】,调整一下上庭、中庭、下庭。其他备注1:在转绘这部分有一个重点案例是照片-> Minecraft这种风格幅度变化很大的。有小伙伴的问题是发现即便--sw风格权重拉满了还是复制不了像素小人风格。经过实验发现:原因是--cw太高。猜想原理:cref提取的人物本身包含了一定程度的风格特性。MJ把这部分特质也当成了「作为你character的一部分」。调低cw发现成功复制,猜想正确。(见视频)其他备注2:cref和sref还可以同时参考多张url,那是不是说我只要上传同一个人不同角度的照片,就更容易直出呢?实验发现不是..用语言描述的感觉是:MJ它会把多张照片理解为多张人脸,直接把形状揉在一起。结果非常容易畸形。补充笔记3:如果你觉得MJ直出的皮肤缺乏质感(过于光滑),那么还是打开醒图【人像->手动美颜->皮肤肌理】就可以了。如果你想快速调整光源但又不想学PS,那就试试Luminar吧。可以直接官方下载和购买完整版,或者如果你是macos订阅了setapp也能使用有基础功能的Luminar版本。视频如下

其他人在问
制作漫画的ai推荐
以下为您推荐一些制作漫画的 AI 工具和相关技巧: Sarah Andersen 风格 主题风格: 漫画特色:通常使用简单的黑白线条作画,配以极富表现力的角色表情,经常探讨如焦虑、社交尴尬、性别问题以及对生活中普通但难以言说的瞬间的幽默呈现。 线条和轮廓:使用清晰简洁的线条,有助于表达画面的情感和幽默。 色调:大多数作品是黑白的,有时会使用颜色来强调特定的元素或情感。 角色设计:角色常常显示出戏剧性的表情,反映各种情绪状态。 元素:作品经常用幽默和讽刺来处理生活中的不如意。 技巧: 在主要描述语后面加上“by Sarah Andersen”或者“style reference Sarah Andersen”。 在提示中加入情感色彩的描述,比如使用“joyful,” “awkward,”或“anxious”等词,来帮助 AI 捕捉 Sarah Andersen 作品中的情感深度。 利用cref 命令保持人物的一致性。 应用: 社交媒体上进行漫画创作。 使用这种风格的插图,可以使故事更加生动有趣。 个性化礼物和商品设计(需注意版权问题)。 将小说做成视频 工具与网址: Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址: Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址: Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: Clipfly:一站式 AI 视频生成和剪辑平台。网址: VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 故事 AI 绘图:小说转视频的 AI 工具。网址: 制作流程: 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。内容由 AI 大模型生成,请仔细甄别。
2024-10-26
我想要美式漫画风格的图怎么和AI沟通
如果您想要美式漫画风格的图,可以从以下几个方面与 AI 沟通: 1. 风格提示词:使用如“DC Comics 能生成美漫封面的漫画画面”“comic book 漫画书”等相关的风格提示词。 2. 主题描述:清晰地描述场景、故事、元素、物体或人物的细节及搭配。例如,不要用一长串文字去表达一个包含多个角色细节的大场景,而是将其拆分描述,如“一个男孩”“穿着红色盔甲”“站在山顶”。 3. 设计风格:可以找一些风格类的关键词参考,或者找一张想要的风格的图片进行垫图/喂图,让 AI 根据给出的图片风格结合主题描述生成图片。 4. 特定风格技巧: 对于 Sarah Andersen 风格,可以在主要描述语后面加上“by Sarah Andersen”或者“style reference Sarah Andersen”。 在提示中加入情感色彩的描述,比如使用“joyful,” “awkward,”或“anxious”等词,帮助 AI 捕捉作品中的情感深度。 利用cref 命令保持人物的一致性。
2024-10-25
我想制作美式漫画用哪个AI比较好
以下是一些适合制作美式漫画的 AI 工具及相关信息: DC Comics 能生成美漫封面的漫画画面。 MewXAI 是一款强大专业且新手友好、操作简单的 AI 绘画创作平台。它拥有众多超火模型和上百种风格,只需一句话即可让文字变为艺术画作,支持文生图、图生图等多种功能,可玩性极强。访问地址:https://www.mewxai.cn/ 可以使用 Midjourney 生成线稿,用 PS 稍微修正错误的地方,再用 ControlNet 控制,Stable Diffusion 上色,多套 AI 组合使用能快速生成效果惊艳的图。
2024-10-25
用ai生成漫画
以下是关于用 AI 生成漫画的相关信息: 教程方面:可以先使用 Midjourney 生成线稿,用 PS 修正错误的地方,再用 ControlNet 控制,最后用 Stable Diffusion 上色,多套 AI 组合能快速生成效果惊艳的图。生成线稿的 Midjourney 关键词如:Black and white line drawing illustration of a cute cat cartoon IP character,black line sketch,wearing a fortune hat,wearing a collar around the neck,Carrying a huge bag containing scrolls and ingots,matching rope and straps at his wrists,Chinese element style,popular toys,blind box toys,Disney style,white background niji 5 style expressive 。 相关工具方面: Al Comic Factory 漫画工厂能够自动生成情感丰富、有故事性的漫画内容,还支持批量生成不同语言的漫画。其网址为:https://x.com/imxiaohu/status/1773255641563533542?s=20 。
2024-10-09
黑白简笔画风格的AI漫画可以参考谁的
以下是一些黑白简笔画风格的 AI 漫画参考: Sarah Andersen: 主题风格: 通常使用简单的黑白线条作画,配以极富表现力的角色表情。 作品经常探讨如焦虑、社交尴尬、性别问题以及对生活中普通但难以言说的瞬间的幽默呈现。 通常使用清晰简洁的线条,这有助于表达画面的情感和幽默。 大多数作品是黑白的,有时会使用颜色来强调特定的元素或情感。 角色常常显示出戏剧性的表情,这反映了各种情绪状态。 作品经常用幽默和讽刺来处理生活中的不如意。 技巧: 在主要描述语后面加上“by Sarah Andersen”或者“style reference Sarah Andersen”。 在提示中加入情感色彩的描述,比如使用“joyful,” “awkward,”或“anxious”等词,来帮助 AI 捕捉 Sarah Andersen 作品中的情感深度。 利用cref 命令保持人物的一致性。 应用: 社交媒体上进行漫画创作。 使用这种风格的插图,可以使故事更加生动有趣。 个性化礼物和商品设计(需注意版权问题)。 擅长创作表情包 Meme: Prompt 4:Black and white photo illustration of a doge face in the center, looking utterly baffled with a humorous 'shrug' gesture. Adjacent to the doge, three doge face icons are displayed for 'Like', 'Repost', and 'Collect'. The 'Like' doge is smitten with heart eyes, the 'Repost' doge is dizzy with spiraled eyes, and the 'Collect' doge is greedily drooling over a bone. Prompt 5:Vector meme in black and white of a doge depicted with three heads and six arms, exuding a calm, Buddhalike aura. Surrounding comical diagram elements point to the doge with arrows labeled '70% tranquility', '20% deep thought', and '10% in the moment'. Prompt 6:如果想要呈现出特定的表现结果,还可以用比喻,类比等方法达到类似的画面。比如这里想生成很多 Doge,那么也可以借助九头蛇等提示词。 教程:线稿上色 Midjourney + Stable Diffusion: 在学习 AI 绘画这段时间,发现 AI 绘画并不会完全替代设计师,而是可以让出图质量更好,效率更高。比如上面是用 midjourney 生成线稿,PS 稍微做一些修正,再用 controlnet 控制,stable diffusion 上色,多套 AI 组合拳,可以快速生成效果惊艳的图。 线稿产出:mj 关键词:Black and white line drawing illustration of a cute cat cartoon IP character, black line sketch, wearing a fortune hat, wearing a collar around the neck, Carrying a huge bag containing scrolls and ingots, matching rope and straps at his wrists, Chinese element style, popular toys, blind box toys, Disney style, white background niji 5 style expressive PS 手动手动重绘错误的地方:有些图出来没有阴影容易飘,可以自己画一个出来。
2024-10-08
AI做漫画
以下是关于 AI 做漫画的相关内容: Sarah Andersen 风格 主题风格: 通常使用简单的黑白线条作画,配以极富表现力的角色表情。 作品经常探讨如焦虑、社交尴尬、性别问题以及对生活中普通但难以言说的瞬间的幽默呈现。 采用简洁的线条和明确的轮廓。 大多数作品是黑白的,有时会使用颜色来强调特定的元素或情感。 角色常常显示出戏剧性的表情,作品包含幽默和讽刺元素。 技巧: 在主要描述语后面加上“by Sarah Andersen”或者“style reference Sarah Andersen”。 在提示中加入情感色彩的描述,比如使用“joyful,” “awkward,”或“anxious”等词。 利用cref 命令保持人物的一致性。 应用: 社交媒体上进行漫画创作。 使用这种风格的插图,可以使故事更加生动有趣。 个性化礼物和商品设计(需注意版权问题)。 线稿上色 Midjourney+Stable Diffusion 在学习 AI 绘画这段时间,发现 AI 绘画并不会完全替代设计师,而是可以让出图质量更好,效率更高。比如上面是用 midjourney 生成线稿,PS 稍微做一些修正,再用 controlnet 控制,stable diffusion 上色,多套 AI 组合拳,可以快速生成效果惊艳的图。 如何判断一张图片是否 AI 生成的 AI 是以积累数据、扩散噪声、再降噪收束的路径来生图的,这个过程往往不是一个线性的有先有后的创作过程,而是一个计算猜测并筛选的螺旋迸进过程。这导致 AI 作画经常会在同一张图中呈现出不同绘画级别的细节。比如线条还没整利索,色彩却能用得尽善尽美;比如前后景透视都够呛,但光影却能媲美哈苏 hasselblad 全彩相机。而人类作画再怎么画也是(尽量)符合人对肢体相貌的审美追求逻辑的,而 AI 生成就缺乏人的逻辑性。当出现更为尽善尽美的、比人工绘图还要好的 AI 作品时,真正支撑我们能继续对这类 AIGC 作品“一眼打假”的,正是这种“是否符合人的逻辑性”的感性判断。人的逻辑,由眼看,由心定。这才是鉴别 AIGC 的“知其所以然”。
2024-10-08
老照片修复用哪个AI软件比较好
以下是一些可用于老照片修复的 AI 软件和工具: Stable Diffusion:启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。还可使用 GFPGAN 算法将人脸变清晰,将图片发送到图生图中,打开 stableSR 脚本进行放大修复。 本地工具放大:https://www.upscayl.org/download 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强: magnific:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型(能恢复老照片):https://github.com/TencentARC/GFPGAN ,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/
2024-10-29
老照片修复
以下是关于用 AI 给老照片修复上色的详细步骤和方法: 1. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时放大图片。 2. 在 PS 里进行角度调整和照片裁切。 3. 将照片放入后期处理,使用 GFPGAN 算法让人脸变清晰。 4. 把图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 5. 对于人物照片还原,选择 realisian 的写实大模型,提示词直接描述颜色和对应内容。 6. ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 7. 对于复杂的照片,如人物多、场景复杂、像素低的,可先给场景方向,让 AI 自行决定颜色。还可加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,给出简单关键词如“蓝天、绿树、灰石砖”。 作者为白马少年,发布时间为 20230910 19:00,原文网址为 https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw 。
2024-10-29
如何用AI根据自己的照片生成动画风格的头像
以下是用 AI 根据自己的照片生成动画风格头像的方法: 1. 准备一张自己比较满意的照片。 2. 如果还没有 Midjourney 账号或不懂基础操作,可以参考之前的教程。 3. 在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取准备好的照片,在聊天框发送(记得点击回车或发送按钮)。 4. 图片上传到服务器后会生成唯一链接,点击图片,在浏览器中打开,复制浏览器上方的链接。 5. 使用复制的链接加 prompt 提示词发送给 Midjourney,Midjourney 会根据需求生成特定的图片,这就是 Midjourney 的以图绘图功能。 另外,细心的友友可能发现了我刚开始喂的图其实也是 AI 生成的。这就要给大家提个醒了,在玩的过程中如果生成了自己比较满意的图,一定要记得存起来。下次想要同种类型的就可以直接拿来喂图,效果要比重新找的好很多哟~
2024-10-29
照片人物与虚拟人合成
以下是关于照片人物与虚拟人合成的相关内容: 使用 Midjourney(MJ)生成人物图片: 确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 MJ 中生成直到得到满意的人物图像。可使用垫图 URL 及相关提示词,如“In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,其中“iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为了确保人物一致性,取 iw 2”。 合成人物和场景: 使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),在 MJ 中重新生图,提示词如“垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 在 StableDiffusion(SD)中绘制一致性多角度头像: 准备工作:准备一张人物的多角度图片,尺寸设置为 1328×800px,放大两倍后保证每张小图都是 512×512px。加上网格图,通过 lineart 来分割不同的块面。设置 controlnet,第一张图选择 openpose_face 得到人物的 15 个面部角度,第二张图选择 lineart_standard得到清晰的表格分区,为防止小图模式下人脸崩坏,可增加 ADetailer 的脸部修复插件。 制作数字人的工具: HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关条款和政策,并注意版权和伦理责任。
2024-10-28
用什么软件让照片说话
以下是一些可以让照片说话的软件及相关信息: Sadtalker: 开源程序,可独立使用或作为插件放入 stablediffusion。 相关链接:https://github.com/OpenTalker/SadTalker 。 整合包:夸克网盘分享的「EZAIStarterv0.9.8.zip」,链接:https://pan.quark.cn/s/1d5ca9f57f5c 。 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 。 具体步骤:点我启动,在启动界面中选择音频、图像口型同步的下载图标;下载完毕后启动应用,会弹出独立窗口;选择 sadtalker 同步器,分别导入图片和声音,根据需求选择图片预处理方式,点击 generate ,由于涉及视频推理和转换,需做好等待准备。 生成视频长度与音频一致,制作长视频建议剪成小段分别推理后合并。 HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片;上传后效果在 My Avatar 处显示上传的照片;点开大图后,点击 Create with AI Studio ,进入数字人制作;写上视频文案并选择配音音色,也可以自行上传音频;最后点击 Submit ,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的 Create vedio ;选择人物形象,可以点击 ADD 添加照片,或者使用 DID 给出的人物形象;配音时,可以选择提供文字选择音色,或者直接上传一段音频;最后,点击 Generate vedio 就可以生成一段视频;打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI 。 使用方法:点击上面的网址,注册后获得 120 免费 k 币,选择“照片数字人口播”的功能;点击开始创作,选择自定义照片;配音时,可以选择提供文字选择音色,或者直接上传一段音频;打开绿幕按钮,点击背景,可以添加背景图;最后,点击生成视频。
2024-10-22
根据单据照片生成统计表,多张照片
很抱歉,目前没有关于根据多张单据照片生成统计表的具体内容和方法。但您可以考虑使用以下几种可能的途径来实现这一目标: 1. 利用专门的图像识别软件或服务,这些工具通常能够对照片中的文字和数据进行识别和提取。 2. 借助一些具有 OCR(光学字符识别)功能的办公软件,将照片中的信息转换为可编辑的文本,然后再整理成统计表。 3. 如果照片中的数据格式较为规范,也可以通过编程的方式,使用相关的图像处理和数据提取库来实现自动化处理。 您可以根据实际情况选择适合您的方法。
2024-10-22
动漫风格的数字人
以下是关于动漫风格数字人的相关信息: 构建动漫风格数字人的躯壳有多种方式: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,能将喜欢的动漫人物变成数字人的躯壳。代表如 Live2D Cubism(https://www.live2d.com/)。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高。代表有 UE(Unreal Engine)、Unity,虚幻引擎 MetaHuman 等,但个人学习在电脑配置和学习难度上有一定门槛。 3. AIGC:省去了建模流程,直接生成数字人的展示图片,但算法生成的数字人很难保持 ID 一致性,帧与帧的连贯性上会让人有虚假的感觉。典型的项目有 wav2lip(https://github.com/Rudrabha/Wav2Lip)、videoretalking(https://github.com/OpenTalker/videoretalking)等。AIGC 还有一个方向是直接生成 2D/3D 引擎的模型,但该方向还在探索中。 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。 另外,【SD】一键切换不同画风中也包含动漫风格,例如“花丛中的小猫”。
2024-10-29
AI视频转换视频风格
以下为您介绍一些关于 AI 视频转换视频风格的相关内容: DomoAI: 主打风格转绘,效果稳定,支持动画风、粘土风、折纸风、像素风等多种曾在互联网上掀起浪潮的风格,还支持根据参考图切换视频风格,与开源模型中 IPAdapter 的能力相似。 同类产品还有 Goenhance AI。 每个账号仅有 15 个免费 credits,仅能生成 3s 视频。 网页版访问:https://domoai.app/ 官方推特:https://x.com/DomoAI_ Ebsynth:在实际操作中,若希望对视频风格转绘有更多可控和可操作性,可以借助 Ebsynth 来实现。 Viggle: 有免费额度。 相关网址: http://viggle.ai discord 免费体验:https://discord.com/invite/viggle 功能包括: /mix:将角色图像混合到动态视频中,需上传一张字符清晰的图片和一段清晰运动的视频。 /animate:使用文本运动提示为静态角色设置动画,需上传一张字符清晰的图片并描述想让角色做的动作,也可从 https://viggle.ai/prompt 中复制动作提示词。 /ideate:纯粹从文本创建角色视频,需描述想要创造的角色和希望角色执行的动作(或从 https://viggle.ai/prompt 中复制动作提示词)。 /character:通过文本提示创建角色并将其动画化,需描述想要创造的角色,从四个结果中选择一个图像,再描述希望角色执行的动作(或从 https://viggle.ai/prompt 中复制动作提示词)。 /stylize:使用文本提示符重新设计角色的样式并将其动画化,需上传一张字符清晰的图片,描述想改变角色的地方,从四个结果中选择一个图像,再描述想要角色做的动作(或者从 https://viggle.ai/prompt 中复制动作提示词)。 官方提供了多种动作提示词可供参考,提示词地址:https://viggle.ai/prompt
2024-10-28
图片风格切换工具
以下是为您提供的关于图片风格切换工具的相关信息: Midjourney V6 风格参考命令: 前期需要测试的细节和使用方法,以及适用场景。 使用方法:在提示框输入提示词描述 + sref URL(链接) + sv 1/2/3/4 + sw 50。 细节:URL 链接为您上传的一张图片地址,sw 50(默认为 100 风格最强,0 为减弱到无,50 取中间值)。 为什么要用这种使用方法:在没有sw 命令的情况下,生成的图片风格变化最强,可能导致某些细节缺失。取 50 作为中间值在测试中效果较好,您也可适当调整。 场景测试:固定动漫场景、真实人物场景、插画场景、3D 角色。测试对比在没添加sw 的效果和添加sw 的效果。 测试例子:Dynamic representation Asuka Langley Soryu from Neon Genesis Evangelion,piloting her EVA unit in battle,wallpaper HD,in the style of vivid energy explosions,realistic and hyperdetailed renderings,precisionist art,photorealistic scenes,epic,glassy translucence,anime art,detailed and intricate environment,Unreal Engine,strong facial expression ar 16:9 sref https://s.mj.run/zZAmLlwiDCc sv 1 niji 6 悠船操作指南: 基础页面操作: 工具首页是一个类似首页的概念。 在此可输入画面描述(如“一个小女孩在跳舞”)并回车生成,“+”可点击上传图片。 可通过“关键词”搜到之前的作品。 中间是生成的作品,默认一次性生成 4 张。 左侧是每组作品的描述和参数。 “想象历史”类似文件夹,可快速找到往期作品。 创作调整: 正常输入提示词。 可调整生成图片的尺寸(长图或宽图)。 风格化:数字越大越艺术,但并非越大越好,取决于创作,人像不用调整过高。 怪异化:数字越大越奇怪,建议新手不用碰。 多样化:数字越大结果越意想不到,越低越接近提示词。建议新手一开始不用怪异和多样化,可做实验测试。 模式:默认标准,朴实 raw 会让图片质感更好,依个人喜好选择。 版本:默认最高 V6,二次元可选 NIJI。 生成图片的速度:默认快速,速度越快对支付套餐要求越高。 图片详情页:打开创作的图片进入详情页,可看到提示词,右上可下载对应图片,可进行参数调整。注意任何点击都会重新生成图片,免费用户可能会提示超出套餐。 【SD】一键切换不同画风,SDXL Styles 汉化版插件: 包含塞尔达传说、童话世界、文艺复兴、GTA、禅绕、印象派、蒸汽朋克等不同风格的示例,如林克骑马、小美人鱼、微笑的少女、拿枪的男人、玫瑰花、海边日出等。通过一个风格的切换,能实现以前需要各种模型和 lora 配合才能实现的效果。想要体验这款汉化插件,可添加公众号【白马与少年】,回复【SDXL】。
2024-10-25
推荐一个做二次元风格的数字人的软件
以下为您推荐一些可用于制作二次元风格数字人的软件: 1. Live2D Cubism(https://www.live2d.com/):这是一款 2D 引擎,风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,深受年轻人喜欢,能将喜欢的动漫人物变成数字人的躯壳。 2. 剪映:虽然本身有很多公模数字人,但可以通过 AI 换脸软件(如按照以下步骤操作:第一步打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 就进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的 URL 就会打开操作界面;第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成;第三步:等着自己专属的数字人视频出炉)来实现数字人的“私有化”。 此外,关于数字人的更多知识和操作,您还可以参考以下内容: 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署。 笔者的开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。 有关数字人使用上的问题,欢迎在底部评论区留言,一起交流。同时如果对数字人课程感兴趣的话,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程! 课程内容: 在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0
2024-10-24