直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

如何用两张照片,合成一张绘画效果的图

回答

以下是将两张照片合成为一张绘画效果的图的步骤:

  1. 利用 Dalle-3 绘图,根据以下提示词分别把高中和大学时期的内容绘制成两幅四格漫画:
    • 高中:中午,急急忙忙跑到食堂,排长队买饭。
    • 大学:中午,懒洋洋在宿舍点外卖,直接送到宿舍楼下。
  2. 利用 Python 进行图片处理:
    • 统一设置:使用上传的字体,字体颜色黑色。
    • 首先:
      • 在每张图片的上面创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上“高中”,大学的图片写上“大学”)。
      • 文字的字体大小设置成 65px,居中显示。
    • 然后:
      • 在图片下方创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上[高中的文案描述(不用声明是高中)],大学的图片写上[大学的文案描述(不用声明是大学)]),如果句子过长,要注意换行显示。
      • 文字的字体大小设置成 45px,居中显示。
    • 最后把两张图片拼成一张图,高中的图片在左,大学的图片在右。两张图中间放置 50px 的空白区域。

另外,还有一些相关的知识供您参考:

  • Double Exposure 是一种视觉艺术风格,将两个或多个照片合成到一起,创建出具有艺术效果的图像,灵感来自于传统的双重曝光摄影技术。最佳提示词:Double Exposure。
  • 在 Stable Diffusion 中,可以使用【X/Y/Z plot】脚本来做参数对比,例如将 X 轴设置为提示词相关性,取值范围是 1 - 30(+5);将 Y 轴设置为重绘幅度,取值范围是 0 - 1(+0.2)。通过对比找到合适的参数,如提示词相关性在 6 - 11 中间为最佳。还可以使用绘图功能进行局部修改,如增加红色眼镜、去掉衣服上的图案、更换头部或帽子等部分。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

景淮:漫画趣味高中大学时期对比图 -GPTs 实战

我们这边使用刚才生成的这句进行测试高中:中午,急急忙忙跑到食堂,排长队买饭。大学:中午,懒洋洋在宿舍点外卖,直接送到宿舍楼下。提示词请分别把以上高中和大学时期的内容绘制成两幅四格漫画。[heading3]三)图片处理[content]利用Python分别把对应的文字加在图片下方。请使用python进行以下内容创作统一设置:使用我上传的字体,字体颜色黑色首先1.在每张图片的上面创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上“高中”,大学的图片写上“大学”)2.文字的字体大小设置成65px,居中显示然后1.在图片下方创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上[高中的文案描述(不用声明是高中)]”,大学的图片写上[大学的文案描述(不用声明是大学)]),如果句子过长,要注意换行显示。2.文字的字体大小设置成45px。居中显示。最后把两张图片拼成一张图,高中的图片在左,大学的图片在右。两张图中间放置50px的空白区域效果展示现在直接提示词出图效果还不错,但也留存下出图效果好的Python代码

双重曝光

[title]双重曝光共建者:阿强Double Exposure是一种视觉艺术风格,它将两个或多个照片合成到一起,创建出一个具有艺术效果的图像,灵感来自于传统的双重曝光摄影技术。这种风格通常包括两个主要元素:一个主体和一个与之相融的背景图像。最佳提示词:Double Exposure

【SD】真人转二次元?图生图如此强大

[title]【SD】真人转二次元?图生图如此强大我们使用Stable Diffusion中的【X/Y/Z plot】脚本来做一个参数对比,将X轴设置为提示词相关性,取值范围是1-30(+5),代表着从1到30,每次增加5;将Y轴设置为重绘幅度,取值范围是0-1(+0.2),代表着从0到1,每次增加0.2。这个对比结果,电脑一共需要生成42张图片,结果如下:可以看到,提示词相关性在6—11中间为最佳,大于11之后,画面的色彩和脸型就开始崩坏了,尤其是当重绘幅度变大之后,较高的提示词相关性会让AI走向完全不同的画风。而重绘幅度的大小可以控制生成图与原图的相似度,在对比图中可以看到,0.4时和原图比较接近,0.6时画面就变成了一个小女孩,当然这个数值也会因每幅图的不同而有所差异。通过对比,我们使用提示词相关性7和重回幅度0.5,绘制如下:接下来是绘图功能,比如我们现在想给这个人物增加一个红色的眼镜,可以使用红色的画笔工具做一个简单的描绘,然后在提示词中增加Red glasses,再点击生成。如果我们想去掉衣服上的图案,可以先用吸管吸取黄色部分,然后用画笔涂上。再生成时就没有图案了。绘图功能的话,每次生成都会重新调整整个画面,但是局部重绘的话可以只改变我们涂抹的部分,现在我们将人物的头部涂抹掉,文字提示改为“一个粉色头发的女孩的脸”,点击生成,就可以将头部换掉了。我们再使用局部重绘(手涂蒙版),修改一下帽子的部分,增加提示词“猫耳”,点击生成。

其他人在问
有没有ai可以根据两张图片生成视频
目前有一些 AI 工具可以根据图片生成视频,以下为您介绍相关情况: 前 Sora 时代的 AI 短片制作:使用了 Pika、Pixverse、Runway、SVD 四大 AI 视频工具,为每张图片只抽一次卡来生成视频,包括剧情片(如太空舰队交战、宇航员头盔特写等场景)、战争片(如士兵在战壕中准备迎击等场景)、奇幻片等类型。 《冷湖案例》:通过涂抹选区并给出相应的运动方向,利用 PixVerse(https://app.pixverse.ai)等工具生成视频,最后加入配音并进行剪辑。 将小说制作成视频的流程: 小说内容分析:使用如 ChatGPT 等 AI 工具分析小说,提取关键场景、角色和情节。 生成角色与场景描述:用如 Stable Diffusion 或 Midjourney 等工具生成视觉描述。 图像生成:使用 AI 图像生成工具创建图像。 视频脚本制作:将关键点和图像组合成脚本。 音频制作:利用如 Adobe Firefly 等工具将文本转换为语音,添加背景音乐和音效。 视频编辑与合成:使用如 Clipfly 或 VEED.IO 等软件将图像、音频和文字合成视频。 后期处理:进行剪辑、添加特效和转场以提高质量。 审阅与调整:观看视频并根据需要调整。 输出与分享:完成编辑后输出最终视频并分享。 请注意,具体操作步骤和所需工具可能因项目需求和个人偏好不同而有所差异,AI 工具的可用性和功能也可能随时间变化,建议访问工具网址获取最新信息和使用指南。同时,内容由 AI 大模型生成,请仔细甄别。
2024-09-04
是否有对比两张人像相似度的工具
目前有一些可以对比两张人像相似度的工具和技术,它们主要基于计算机视觉和人脸识别技术。以下是一些常见的选择: 1. 在线人脸比对工具 网上有一些免费或付费的在线人脸比对工具,例如 Face++、澄云人脸核身等,可以上传两张人像图片,系统会给出一个相似度评分。 2. Python 人脸识别库 像 face_recognition、dlib、OpenCV 等 Python 库都内置了人脸识别和相似度计算的功能,你可以用几行代码实现图片人脸比对。 3. 人脸识别云服务 一些科技公司提供了人脸识别的云 API 服务,如亚马逊 Rekognition、微软 Azure Face API、百度 AI 云人体分析等,可通过调用 API 获取两张图片的相似度。 4. 开源人脸识别引擎 有些知名的开源人脸识别系统如 FaceNet、ArcFace、InsightFace 等,你可以下载源码在本地部署,利用它们的相似度判断能力。 5. 人工智能应用平台 一些面向普通用户的 AI 平台如 PandorAI、PicoGPT 等,集成了人脸比对的功能模块,提供在线体验或调用接口。 使用这些工具前,通常需要先完成注册和人脸数据采集等准备工作。在选择时你可以考虑性能、便捷性、隐私安全、成本等因素。目前的人脸识别技术虽已相当精准,但也面临一些道德和法律挑战,使用时需谨慎。
2024-04-19
能修复老照片吗
AI 可以修复老照片。以下是一些相关的方法和工具: 可以使用 Stable Diffusion(SD)中的 controlnet 模型中的 Recolor 新模型为黑白老照片重新上色。提示词可直接描述颜色和对应的内容,ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰。 把图片发送到图生图中,打开 stableSR 脚本,放大两倍,切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 辅助工具方面: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可增加更多细节 开源工作流: 其他工具和网站: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN ,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/
2024-11-05
请问修复旧照片怎么处理?
修复旧照片可以按照以下步骤进行处理: 1. 将照片放入后期处理中,使用 GFPGAN 算法使人脸变清晰。您可以参考文章。 2. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。stableSR 是所有插件中对原图还原最精准、重绘效果最好的。您可以参考文章。 3. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写,以免对原图产生干扰。 4. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,可在显存不够的情况下将图片放大到足够倍数。 5. 对于复杂的照片,可先在 ps 里进行角度调整和照片裁切,然后按照上述步骤上色。若直接上色效果不佳,比如像加了黄色滤镜或年代感太强,可放弃人物服装颜色指定,只给场景方向,让 AI 自行决定。比如从网上找相关照片让 AI 匹配色调,加入第二个 controlnet 控制颜色,使用 t2ia_color 的模型,给简单的关键词,如“蓝天、绿树、灰石砖”。 6. 修复时必须使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹中。StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹中。VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。
2024-10-31
请问修复旧的照片怎么处理?
修复旧照片可以按照以下步骤进行处理: 1. 将照片放入后期处理中,使用 GFPGAN 算法使人脸变清晰。您可以参考文章——。 2. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。stableSR 是所有插件中对原图还原最精准、重绘效果最好的。您可以参考文章——。 3. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写,以免对原图产生干扰。 4. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,能在显存不够的情况下,将图片放大到足够的倍数。 5. 对于复杂的照片,如人物多、场景复杂、像素低的照片,可以先在 ps 里面进行角度调整和照片裁切,然后按照上述步骤进行上色。如果直接上色效果不佳,比如像加了一层黄色滤镜或颜色指定导致画面污染严重,可以放弃人物服装的颜色指定,只给一个场景方向,让 AI 自行决定。比如从网上找一张匹配色调的照片,加入第二个 controlnet 来控制颜色,使用 t2ia_color 的模型,关键词可以只给“蓝天、绿树、灰石砖”等简单的词。 6. 修复时必须要使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹中。 7. StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹中。 8. 一个 VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。这三个文件可以在百度云盘的链接中获取。安装好之后,可以用一张从网上找的神仙姐姐的照片做测试。 需要注意的是,在修复过程中,不同的照片可能需要根据具体情况进行调整和尝试,以达到最佳的修复效果。
2024-10-31
照片转漫画风格
以下是为您提供的关于照片转漫画风格的相关信息: 1. Magnific AI 推出了照片风格化功能,可将任意照片转换成任意风格,能控制样式数量和结构完整性,适用于多种用例。相关链接:https://x.com/imxiaohu/status/1769710736132227434?s=20 2. 莱森提供了利用一致性 MJ 出海马体写真的教程。例如,若用醒图调整脸部,可关注【人像>面部重塑>面部>比例】调整上庭、中庭、下庭;在转绘中,对于照片转 Minecraft 这种风格幅度变化大的情况,若复制不了像素小人风格,可能是因为cw 太高,调低可成功复制;cref 和 sref 同时参考多张 url 时,上传同一个人不同角度的照片不一定更容易直出,可能导致结果畸形;若 MJ 直出的皮肤缺乏质感,可使用醒图【人像>手动美颜>皮肤肌理】,若想快速调整光源,可试试 Luminar。 3. Animagine XL 3.1 作为动漫主题文本到图像模型更新发布,扩展了对广泛动漫风格的理解,提高了生成图像质量,解决了过曝问题,新增了美学标签,优化了结果准确性。相关链接:https://cagliostrolab.net/posts/animaginexlv31release 、https://huggingface.co/cagliostrolab/animaginexl3.1 、https://huggingface.co/spaces/cagliostrolab/animaginexl3.1 、https://x.com/imxiaohu/status/1769691980882432192?s=20
2024-10-31
老照片修复用哪个AI软件比较好
以下是一些可用于老照片修复的 AI 软件和工具: Stable Diffusion:启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。还可使用 GFPGAN 算法将人脸变清晰,将图片发送到图生图中,打开 stableSR 脚本进行放大修复。 本地工具放大:https://www.upscayl.org/download 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强: magnific:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型(能恢复老照片):https://github.com/TencentARC/GFPGAN ,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/
2024-10-29
老照片修复
以下是关于用 AI 给老照片修复上色的详细步骤和方法: 1. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时放大图片。 2. 在 PS 里进行角度调整和照片裁切。 3. 将照片放入后期处理,使用 GFPGAN 算法让人脸变清晰。 4. 把图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 5. 对于人物照片还原,选择 realisian 的写实大模型,提示词直接描述颜色和对应内容。 6. ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 7. 对于复杂的照片,如人物多、场景复杂、像素低的,可先给场景方向,让 AI 自行决定颜色。还可加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,给出简单关键词如“蓝天、绿树、灰石砖”。 作者为白马少年,发布时间为 20230910 19:00,原文网址为 https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw 。
2024-10-29
用现有的搭建一个ai网站 实现绘画 聊天 会员 积分 等功能
以下是搭建一个具备绘画、聊天、会员、积分等功能的 AI 网站的步骤: 1. 搭建 OneAPI(https://github.com/songquanpeng/oneapi),用于汇聚整合多种大模型接口,方便后续更换使用各种大模型,同时会告知如何白嫖大模型接口。 2. 搭建 FastGpt(https://fastgpt.in/),这是一个知识库问答系统,将知识文件放入,并接入上面的大模型作为分析知识库的大脑,最后回答问题。若不想接入微信,搭建到此即可,其有问答界面。 3. 搭建 chatgptonwechat(https://github.com/zhayujie/chatgptonwechat)接入微信,并配置 FastGpt 将知识库问答系统接入微信。建议先用小号以防封禁风险。若想拓展功能,可参考 Yaki.eth 同学的教程(https://waytoagi.feishu.cn/wiki/UADkwZ9B0iAWdTkFJIjcN7EgnAh),其中的 cow 插件能实现文件总结、MJ 绘画等能力。 在积分和会员方面,以下是一些相关的活动形式和积分设置示例: 吵爷帮助技能持有者在社区实现虚拟 IPO 审核服务。 Larkspur:扣子 bot 文案生图体验| 10 积分,扣子虚拟女友体验| 10 积分,帮你把 Siri 接入 Llama 3 70B |10 积分。 勿忘心安 Dify 本地部署不成功不要积分 10 积分一次。 Penny 给你解梦,并还原场景 10 积分。 Rachel 倩敏 宠物照片变毛毡头像 5 积分一个,before after 合并呈现 10 积分一个。 梦飞 给全国所有的项目做聚合平台,用户体验一次抽成 3 5 积分。 David 为社区用户做积分银行,可超前消费,存 10 个积分,利息 1 个积分,贷 10 个积分,利息 2 个积分,并为项目 IPO 提供融资服务。 波大波吗 5 分钟,让你的微信变成 chatgpt + MJ + SD +....+ 新闻专家 20 积分一次。 琥珀川 教你用 ai 技能接单、创业 10 积分。 大满满 简约的 mj 转模型|随喜积分。 Matteo 工作日晚 8 11 点,提供微信 1 对 1 视频聊天 30min,互通获取 AI 信息的渠道 + 漫聊 AI 相关使用体验思考 1 积分。 桂大阳 风景壁纸一张 10 积分、手机壳图案 + 手机壳效果图 10 积分。 镜 教你画小鹿动画表情包一个 10 积分,5 个 60 积分,8 个 100 积分。教你如何手绘蒙娜丽莎 10 积分一次,一次 10 分钟。教你做小鹿角色 2 维转 3D 一个 20 积分。 易求无方 与你的虚拟人进行一次心灵交流 20 积分,与你进行一次心灵交流 10 积分。 游小言 虚拟 IP 打造,给视频换脸,一次 10 积分,支持以技能易技能。
2024-11-04
绘画提示词
以下是关于绘画提示词的相关信息: 提示词语法: 根据想画的内容写出提示词,多个提示词之间使用英文半角逗号将权重降低至原先的 90.91%,将权重减少为原先的 25%。 风格提示词: pointillism 点彩派、Claude Monet 克劳德莫奈、quilted art 桁缝艺术、partial anatomy 局部解剖、color ink on paper 彩墨纸本、doodle 涂鸦、Voynich manuscript 伏尼契手稿、book page 书页、realistic 真实的、3D 3D 风格、sophisticated 复杂的、photoreal 真实感、national geographic 国家地理、hyperrealism 超写实主义、cinematic 电影股的、architectural sketching 建筑素描、symmetrical portrait 对称肖像、clear facial features 清晰的面部特征、interior design 室内设计、weapon design 武器设计、subsurface scattering 次表面散射、Game scene graph 游戏场景图、character concept art 角色概念艺术 图像类 Prompt 网站: MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库, MidJourney Prompt Tool:类型多样的 promot 书写工具,点击按钮就能生成提示词修饰部分, OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便快速可视化生成自己的绘画提示词, AIart 魔法生成器:中文版的艺术作品 Prompt 生成器, IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器, Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT & Midjourney, OpenArt:AI 人工智能图像生成器, img2prompt:根据图片提取 Prompt, MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用, PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板, AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供广泛的不同风格选择,
2024-10-29
推荐一款可以根据指令进行绘画的ai
以下为您推荐几款可以根据指令进行绘画的 AI: 1. Midjourney:目前是一款容易上手的 AI 绘图工具,对于新手是不错的入门选择。现阶段的 AI 能辅助进行设计,视觉效果吸睛。在 Midjourney 中没有固定的 Prompt来生成某种 APP,具体想要的效果需要多多尝试。可以使用指令模板:「ui design forapplication,mobile app,iPhone,iOS,Apple Design Award,screenshot,single screen,high resolution,dribbble」,把里面的“类型”替换成您想设计的产品的关键词描述(英文),就能生成想要的 UI 设计图。例如出行类关键词:「距离、车费、费用结算、优惠金额、地图」等;餐饮类关键词:「介绍咖啡的特色、口味、咖啡豆产地、价格」等;运动类关键词:「卡路里、步数、距离、某种运动」等描述。 2. 古德齐尔德女士尝试让 AI 通过执行著名艺术家 Sol LeWitt 的指令并生成 Javascript 代码来创建艺术品。使用 OpenAI 的旧模型 GPT3 时大多失败,但 GPT4 对部分指令表现不错。例如在一个墙面上,任何连续的墙面,使用硬铅笔,在随机位置放置 50 个点。这些点应该均匀分布在墙面的面积上。所有点都应该通过直线连接起来。
2024-10-27
ai绘画相关的教程
以下为一些 AI 绘画相关的教程: 视频教程: 「AI 绘画」软件比较与 stable diffusion 的优势: 「AI 绘画」零基础学会 Stable Diffusion: 「AI 绘画」革命性技术突破: 「AI 绘画」从零开始的 AI 绘画入门教程——魔法导论: 「入门 1」5 分钟搞定 Stable Diffusion 环境配置,消灭奇怪的报错: 「入门 2」stable diffusion 安装教程,有手就会不折腾: 「入门 3」你的电脑是否跑得动 stable diffusion?: 「入门 4」stable diffusion 插件如何下载和安装?: 线稿上色 Midjourney+Stable Diffusion:在学习 AI 绘画这段时间,发现 AI 绘画并不会完全替代设计师,而是可以让出图质量更好,效率更高。比如上面是用 midjourney 生成线稿,PS 稍微做一些修正,再用 controlnet 控制,stable diffusion 上色,多套 AI 组合拳,可以快速生成效果惊艳的图。作者:三思。先欣赏下作品: 1、线稿产出:mj 关键词:Black and white line drawing illustration of a cute cat cartoon IP character,black line sketch,wearing a fortune hat,wearing a collar around the neck,Carrying a huge bag containing scrolls and ingots,matching rope and straps at his wrists,Chinese element style,popular toys,blind box toys,Disney style,white background niji 5 style expressive 2、ps 手动手动重绘错误的地方:有些图出来没有阴影容易飘,可以自己画一个出来 SD 新手:视频教程 从 0 入门 AI 绘画教程:🔥强烈推荐,学完变大神系列章节教学视频: 第一节课:AI 绘画原理与基础界面 第二节课:20 分钟搞懂 Prompt 与参数设置,你的 AI 绘画“咒语”学明白了吗? 第三节课:打破次元壁!用 AI“重绘”照片和 CG 第四节课:AI 绘画模型,“画风”自由切换 第五节课:提高 AI 绘画分辨率的方式 第六节课:LoRa | Hypernetwork 概念简析 第七节课:定向修手修脸,手把手教你玩转局部重绘! 第八节课:提示词补全翻译反推,“终极”放大脚本与细节优化插件 第九节课:LoRA 从原理到实践 第十节课:零基础掌握 ControlNet!
2024-10-25
AI绘画怎么学习
以下是关于学习 AI 绘画的一些建议: 1. 利用专业的学习工具,如《AI 绘画助手》(https://www.coze.cn/store/bot/7387381204275904521?panel=1&bid=6d1aji2c86g1m)。它是一位专业且贴心的 AI 绘画学习导师,能为新手小白和进阶爱好者提供优质实用的指导。 2. 理解原理:掌握复杂的神经网络、生成对抗网络以及卷积神经网络等知识,用通俗易懂的语言解释清楚,理解 AI 绘画背后的神秘机制。 3. 熟悉工具:了解市面上流行的 AI 绘画工具,如 DALLE、MidJourney、Stable Diffusion 等,掌握其使用步骤和独特之处,找到适合自己的工具。 4. 掌握技术:学习风格迁移技术、生成对抗网络在图像生成和编辑中的应用,以及获取高分辨率精美图像的方法。 5. 积累实战案例经验:从零基础起步,逐步创作出令人惊叹的作品,遇到难题时及时答疑解惑,规划清晰明确的学习路径。 6. 参与社群学习:在各大社交平台上,收集和测试 AI 绘画提示词中的核心关键词,规避无效探索,节省时间。可以加入相关社群,如通过扫飞书二维码进群,根据群中的每天给出的关键词,通过出图测试关键词效果,进行创意创作并收录不错的作品。 7. 学会与 AI 对话:记住“学 AI 绘画,学会与 AI 对话”这句话,因为在未来,AI 绘画本身可能价值有限,但学会与 AI 交流是重要的目的。提示不是自然语言,而是一种语言应用。
2024-10-25
学习AI绘画该怎么规划
以下是为您规划的学习 AI 绘画的步骤: 1. 学习 AI 图像生成的原理: 参考学习笔记《生成式 AI 导论 2024》李宏毅(https://bytedance.larkoffice.com/docx/Sj7rdqvv1osuihxWizIcizRGnif ) 学习笔记 Introduction to Image Generation Google AI 课程(https://bytedance.larkoffice.com/docx/IZkedDCJcogldNx11l3cC7uVnCf ) 2. 尝试工具和效果: 明确自己的需求和目标,例如为特定主题(如“电能超级飞侠”)进行创作。 3. 制定学习计划: 逐步推进问题,明确每日需要投入的时间和每周用到的资源。 根据自身情况增加每周学习成果评估的要求。 可以参考他人的经验,如吴珂为儿子制作生日海报的经历。 4. 解决实践中遇到的问题: 针对不同的需求选择合适的风格,如卡通简笔画风格。 处理好素材的局限性,如训练集中人物朝向固定等问题,可以通过镜像处理等方式解决。 不断尝试不同的技术和方法,如 Embedding、CKPT、Lora 等,以达到理想的效果。
2024-10-19
两个人物图合成一张图片,有什么好工具?
以下是一些可以将两个人物图合成一张图片的工具和方法: 1. Midjourney(MJ): 确定人物形象,通过相关提示词生成人物图像。 利用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图在 MJ 中重新生图。 2. Stable Diffusion(SD): 可使用 Roop 插件进行多人物脸部替换。例如生成一张包含两个古风人物的图片,通过图生图调整重绘幅度,并在 Roop 插件中载入相应人物照片形象进行脸部替换,最后使用 PS 扩图。 3. 其他方法: 利用 MJ 画图制作底图,使用 InsightFaceSwap 插件处理脸部,分割裁剪图片、处理后缝合,再用相关软件让图片动起来。 直接在网上寻找能够融合两张照片的软件或项目,若没有则进行纯 P 图,然后利用图生视频的项目完成。
2024-10-28
照片人物与虚拟人合成
以下是关于照片人物与虚拟人合成的相关内容: 使用 Midjourney(MJ)生成人物图片: 确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 MJ 中生成直到得到满意的人物图像。可使用垫图 URL 及相关提示词,如“In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,其中“iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为了确保人物一致性,取 iw 2”。 合成人物和场景: 使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),在 MJ 中重新生图,提示词如“垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 在 StableDiffusion(SD)中绘制一致性多角度头像: 准备工作:准备一张人物的多角度图片,尺寸设置为 1328×800px,放大两倍后保证每张小图都是 512×512px。加上网格图,通过 lineart 来分割不同的块面。设置 controlnet,第一张图选择 openpose_face 得到人物的 15 个面部角度,第二张图选择 lineart_standard得到清晰的表格分区,为防止小图模式下人脸崩坏,可增加 ADetailer 的脸部修复插件。 制作数字人的工具: HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关条款和政策,并注意版权和伦理责任。
2024-10-28
如何利用自动对齐技术,确保16位不同地点的人员录制的同一句口号音频同步且整齐,请推荐具有此功能的音频编辑工具、网站或AI工具,以便将这16段音频精确叠加并融合成一个协调一致的整体
以下是关于利用自动对齐技术确保 16 位不同地点人员录制的同一句口号音频同步且整齐的相关信息及工具推荐: 在音频编辑中,常见的步骤如下: 1. 选择合适的数字音频工作站(DAW),如 Studio One。上传 FLAC 无损格式的音频,只对融合部分进行 Inpaint 处理,保持其他音频信息不变,以避免音质问题。 2. 在 DAW 中对接音轨后,播放试听,并缩放波形图,检查波形是否正确对齐。若出现波形未对齐或播放时有咔哒声等问题,可能是在导出和处理过程中对音频施加了额外的效果器处理,如混响、限制器、压缩等,导致音频前后不一致,影响对接效果。因此,需要确保在不同的导出和处理步骤中,音频不受到额外的处理,或者在每次处理时保持相同的效果设置。 具有此功能的音频编辑工具和网站包括: 1. Studio One:可用于对齐拼接音轨,并进行后续的叠加额外音轨、调整音量和平衡等操作,以丰富音频的层次,注意叠加后各音轨的电平,避免过载或失衡。 2. Udio:具有混音功能,可对现有剪辑进行微妙或明显的变化。在提示框中有新的区域,通过滑块控制混音效果的强度。 此外,阿里的相关研究全面概述了大语言模型自动对齐的主要技术路径,将现有的自动对齐方法分为四大类:利用模型固有偏好实现对齐、通过模仿其他模型行为实现对齐、利用其他模型反馈实现对齐、通过环境交互获得对齐信号,并探讨了自动对齐背后的机理以及实现有效自动对齐的关键因素。但此研究主要针对大语言模型,对于音频对齐的直接应用可能有限。
2024-10-17
如何合成照片
以下是关于合成照片的相关内容: 使用 Midjourney(MJ)生成人物图片: 1. 确定人物形象:如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 MJ 中生成直到得到满意的人物图像。 垫图 URL + “In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2” “iw”取值范围在,不填写默认“iw = 1”,“iw”值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,取“iw 2”。 合成人物和场景: 1. 使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐: 将合成后的图作为垫图(“iw 2”),MJ 重新生图,提示词如:“垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2” 使用 Camera Motion 合成照片: 1. 上传图片:点击“AddImage”上传图片。 2. 输入提示词:在“Prompt”中输入提示词。 3. 设置运镜方向:选择想要的运镜方向,输入。 4. 设置运动幅度:运动幅度和画面主体运动幅度有关,与运镜大小无关,可设置成任意值。 5. 其它:选择好种子(seed),是否高清(HD Quality),是否去除水印(Remove Watermark)。 6. 生成视频:点击“create”,生成视频。 照片数字人工作流及语音合成(TTS)API 出门问问 Mobvoi: 1. 照片数字人工作流 使用文档: 出门问问:语音合成(TTS)API 获取地址 参数及说明: 字段名:text,必填,类型为 String,要合成的文本内容,限制为 1000 字符。支持 ssml 标记语言,使用说明见附录 3。 字段名:appkey,必填,类型为 String,开发者在 AI 开放平台上申请的 appkey。 字段名:signature,必填,类型为 String,签名,通过“appkey + secret + timestamp”进行 md5 加密,得到的 32 位 MD5 值。每次请求实时计算签名,签名有效期为 10 分钟。 字段名:timestamp,必填,类型为 Long,当前时间戳,单位为秒。 字段名:speaker,否,类型为 String,合成音频指定发音人,默认值:cissy_meet,其他发音人传值及计费价格请参考声音商店。 字段名:audio_type,否,类型为 String,合成音频的格式,默认值:mp3,可选值:pcm/mp3/speexwb10/wav,只支持这四种格式中的一种。 字段名:speed,否,类型为 Float,发音人合成的语速,支持小数点后两位,默认值:1.0,可选值:0.5 2.0。 字段名:convert,否,类型为 String,默认值:无,可选值:robot,是否转化为机器声。 Request Header 设置
2024-10-16
有哪些中文 ai 语音合成的项目
以下是一些中文 AI 语音合成的项目: :基于 AI 的语音引擎能够模仿人类语音的情感和韵律。 :基于 NLP 的最先进文本和音频编辑平台,内置数百种 AI 声音。 :使用突触技术和脑机接口将想象的声音转化为合成 MIDI 乐器的脑控仪器。 :为出版商和创作者开发最具吸引力的 AI 语音软件。 :Wondercraft 使用户能够使用文本转语音技术生成播客。 :基于生成机器学习模型构建内容创作的未来。 :从网页仪表板或 VST 插件生成录音室质量的 AI 声音并训练 AI 语音模型。 :演员优先、数字双重声音由最新的 AI 技术驱动,确保高效、真实和符合伦理。 :将书面内容转化为引人入胜的音频,并实现无缝分发。 :专业音频、语音、声音和音乐的扩展服务。 (被 Spotify 收购):提供完全表达的 AI 生成语音,带来引人入胜的逼真表演。 :利用合成媒体生成和检测,带来无限可能。 :一键使您的内容多语言化,触及更多人群。 :生成听起来真实的 AI 声音。 :为游戏、电影和元宇宙提供 AI 语音演员。 :为内容创作者提供语音克隆服务。 :超逼真的文本转语音引擎。 :使用单一 AI 驱动的 API 进行音频转录和理解。 :听起来像真人的新声音。 :从真实人的声音创建逼真的合成语音的文本转语音技术。 :生成听起来完全像你的音频内容。 :为所有人提供开放的语音技术。 在境内深度合成服务算法备案清单(2023 年 6 月)中,相关的有: 讯飞语音识别算法:服务提供者为科大讯飞股份有限公司,应用于讯飞输入法(APP)的文本生成场景,提取语音中声学特征,结合语言模型,识别短音频,生成文本信息。备案编号为网信算备 340104764864601230013 号。 讯飞星火认知大模型算法:服务技术支持者为科大讯飞股份有限公司,应用于开放域对话生成场景,利用文本、代码、prompt 数据及用户反馈数据训练 AI 大模型,服务于问答、咨询类的企业端客户,通过 API 提供文本生成服务。备案编号为网信算备 340104764864601230021 号。 美图图像深度合成类算法:服务提供者为厦门美图网科技有限公司,应用于图像生成场景,基于图像内容理解结果,实现对用户上传照片的艺术化重新生成。涉及美图设计室(APP)、美图秀秀(APP)、美颜相机(APP)等。备案编号为网信算备 350203814951001230015 号。 UC 小蜜智能客服算法:服务提供者为广州市动景计算机科技有限公司,应用于 UC 浏览器(APP)的在线智能客服场景,利用自然语言技术定位用户需求,生成文本、图像、音频、视频等形式的回答。备案编号为网信算备 440106203028801230019 号。 易次元生成合成算法:服务提供者为广州网易计算机系统有限公司,应用于易次元(APP)的对话生成场景,根据用户输入内容,应用对话模型,生成对话文本回复。备案编号为网信算备 440106306769001230011 号。
2024-10-14
AI 出图合成技巧
以下是一些 AI 出图合成的技巧: 方法 1(SD 出图 + AI 视频软件): 在 SD 的 controlnet 中上传原图,选择深度,通过文生图生成图片,然后将生成好的图放在 AI 视频工具中进行视频生成。相关网站:dreamina:https://dreamina.jianying.com/aitool/video/generate 方法 2(MJ 出图 + AI 视频软件): 使用 Midjourney 垫图加上描述出图,再去视频工具中转成视频。可在下载项里的深度图,打开 MJ 官网(https://www.midjourney.com/)上传深度图。局部重绘有一定难度,最终方式可以是分开画,比如先画个被关着的红衣服女孩,再画个二战德国士兵的背影,然后合成,拼在一起再交给 MJ。各种垫图局部重绘也能无中生有。
2024-09-12