Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何用两张照片,合成一张绘画效果的图

Answer

以下是将两张照片合成为一张绘画效果的图的步骤:

  1. 利用 Dalle-3 绘图,根据以下提示词分别把高中和大学时期的内容绘制成两幅四格漫画:
    • 高中:中午,急急忙忙跑到食堂,排长队买饭。
    • 大学:中午,懒洋洋在宿舍点外卖,直接送到宿舍楼下。
  2. 利用 Python 进行图片处理:
    • 统一设置:使用上传的字体,字体颜色黑色。
    • 首先:
      • 在每张图片的上面创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上“高中”,大学的图片写上“大学”)。
      • 文字的字体大小设置成 65px,居中显示。
    • 然后:
      • 在图片下方创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上[高中的文案描述(不用声明是高中)],大学的图片写上[大学的文案描述(不用声明是大学)]),如果句子过长,要注意换行显示。
      • 文字的字体大小设置成 45px,居中显示。
    • 最后把两张图片拼成一张图,高中的图片在左,大学的图片在右。两张图中间放置 50px 的空白区域。

另外,还有一些相关的知识供您参考:

  • Double Exposure 是一种视觉艺术风格,将两个或多个照片合成到一起,创建出具有艺术效果的图像,灵感来自于传统的双重曝光摄影技术。最佳提示词:Double Exposure。
  • 在 Stable Diffusion 中,可以使用【X/Y/Z plot】脚本来做参数对比,例如将 X 轴设置为提示词相关性,取值范围是 1 - 30(+5);将 Y 轴设置为重绘幅度,取值范围是 0 - 1(+0.2)。通过对比找到合适的参数,如提示词相关性在 6 - 11 中间为最佳。还可以使用绘图功能进行局部修改,如增加红色眼镜、去掉衣服上的图案、更换头部或帽子等部分。
Content generated by AI large model, please carefully verify (powered by aily)

References

景淮:漫画趣味高中大学时期对比图 -GPTs 实战

我们这边使用刚才生成的这句进行测试高中:中午,急急忙忙跑到食堂,排长队买饭。大学:中午,懒洋洋在宿舍点外卖,直接送到宿舍楼下。提示词请分别把以上高中和大学时期的内容绘制成两幅四格漫画。[heading3]三)图片处理[content]利用Python分别把对应的文字加在图片下方。请使用python进行以下内容创作统一设置:使用我上传的字体,字体颜色黑色首先1.在每张图片的上面创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上“高中”,大学的图片写上“大学”)2.文字的字体大小设置成65px,居中显示然后1.在图片下方创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上[高中的文案描述(不用声明是高中)]”,大学的图片写上[大学的文案描述(不用声明是大学)]),如果句子过长,要注意换行显示。2.文字的字体大小设置成45px。居中显示。最后把两张图片拼成一张图,高中的图片在左,大学的图片在右。两张图中间放置50px的空白区域效果展示现在直接提示词出图效果还不错,但也留存下出图效果好的Python代码

双重曝光

[title]双重曝光共建者:阿强Double Exposure是一种视觉艺术风格,它将两个或多个照片合成到一起,创建出一个具有艺术效果的图像,灵感来自于传统的双重曝光摄影技术。这种风格通常包括两个主要元素:一个主体和一个与之相融的背景图像。最佳提示词:Double Exposure

【SD】真人转二次元?图生图如此强大

[title]【SD】真人转二次元?图生图如此强大我们使用Stable Diffusion中的【X/Y/Z plot】脚本来做一个参数对比,将X轴设置为提示词相关性,取值范围是1-30(+5),代表着从1到30,每次增加5;将Y轴设置为重绘幅度,取值范围是0-1(+0.2),代表着从0到1,每次增加0.2。这个对比结果,电脑一共需要生成42张图片,结果如下:可以看到,提示词相关性在6—11中间为最佳,大于11之后,画面的色彩和脸型就开始崩坏了,尤其是当重绘幅度变大之后,较高的提示词相关性会让AI走向完全不同的画风。而重绘幅度的大小可以控制生成图与原图的相似度,在对比图中可以看到,0.4时和原图比较接近,0.6时画面就变成了一个小女孩,当然这个数值也会因每幅图的不同而有所差异。通过对比,我们使用提示词相关性7和重回幅度0.5,绘制如下:接下来是绘图功能,比如我们现在想给这个人物增加一个红色的眼镜,可以使用红色的画笔工具做一个简单的描绘,然后在提示词中增加Red glasses,再点击生成。如果我们想去掉衣服上的图案,可以先用吸管吸取黄色部分,然后用画笔涂上。再生成时就没有图案了。绘图功能的话,每次生成都会重新调整整个画面,但是局部重绘的话可以只改变我们涂抹的部分,现在我们将人物的头部涂抹掉,文字提示改为“一个粉色头发的女孩的脸”,点击生成,就可以将头部换掉了。我们再使用局部重绘(手涂蒙版),修改一下帽子的部分,增加提示词“猫耳”,点击生成。

Others are asking
有两张图,一张是手,一张是戒指,如何将戒指套入手上合成一张图
目前没有相关的知识库内容为您提供将手和戒指合成一张图的具体方法。但一般来说,您可以使用专业的图像编辑软件,如 Adobe Photoshop 等。以下是大致的步骤: 1. 打开软件并导入手和戒指的图片。 2. 选择戒指图片,使用抠图工具将戒指抠出。 3. 将抠出的戒指移动到手的图片上,并调整大小、位置和角度,使其看起来像是套在手上。 4. 对合成后的图片进行细节调整,如颜色、光影等,以使合成效果更加自然。 希望这些信息对您有所帮助。
2025-01-17
两张图片转场提示词
以下是关于两张图片转场提示词的相关内容: 在图生图功能中,除了文本提词框外还有图片框输入口,可通过图片给 AI 创作灵感。随便照一张照片拖入,文本输入框旁有两个反推提示词的按钮:CLIP 能通过图片反推出完整含义的句子,如“a young boy sitting on a bench with a toy train and a lego train set on the floor next to him,Adam Rex,detailed product photo,a stock photo,lyco art”;DeepBooru 能反推出关键词组,如“shoes,solo,hat,orange_background,yellow_background,smile,socks,black_hair,sitting,sneakers”。但两种反推方式生成的提示词可能有瑕疵,需手动补充信息,调整宽度和高度使红框匹配图片,同时注意两个重要参数:提示词相关性和重绘幅度。 在美女转绘中,推荐使用麦🍊的写实模型和墨幽人造人模型,提示词不推荐使用质量词,先使用 Deepbooru 反推,借助提示词插件删除无用词,保留与画面主体相关的提示词,如正向提示词“1girl,solo,black_hair,midriff,autolinklora:林鹤皮肤质感调整器差异炼丹功能性 lora 模型_林鹤 v1:0.6autolink”,负向提示词“NSFW,logo,text,blurry,low quality,bad anatomy”。使用皮肤类型的 Lora 是因为很多素材中小姐姐的皮肤磨皮严重,缺乏质感。 在镜头转场方面,包括蒙太奇镜头(用于传达信息、情感或表现时间流逝)、镜头切换(打破时间或空间连续性,营造紧张或错乱效果)、转场镜头(用于平滑过渡)、错位镜头(挑战观众预期,增加神秘感)、渐隐镜头(用于场景转换或时间过渡,营造柔和节奏)、碎片化镜头(表现混乱心境或复杂叙事结构)、无缝过渡镜头(增强影片流畅性)、交错镜头(展示同时发生的事件或加强对比)等。
2024-12-01
有没有ai可以根据两张图片生成视频
目前有一些 AI 工具可以根据图片生成视频,以下为您介绍相关情况: 前 Sora 时代的 AI 短片制作:使用了 Pika、Pixverse、Runway、SVD 四大 AI 视频工具,为每张图片只抽一次卡来生成视频,包括剧情片(如太空舰队交战、宇航员头盔特写等场景)、战争片(如士兵在战壕中准备迎击等场景)、奇幻片等类型。 《冷湖案例》:通过涂抹选区并给出相应的运动方向,利用 PixVerse(https://app.pixverse.ai)等工具生成视频,最后加入配音并进行剪辑。 将小说制作成视频的流程: 小说内容分析:使用如 ChatGPT 等 AI 工具分析小说,提取关键场景、角色和情节。 生成角色与场景描述:用如 Stable Diffusion 或 Midjourney 等工具生成视觉描述。 图像生成:使用 AI 图像生成工具创建图像。 视频脚本制作:将关键点和图像组合成脚本。 音频制作:利用如 Adobe Firefly 等工具将文本转换为语音,添加背景音乐和音效。 视频编辑与合成:使用如 Clipfly 或 VEED.IO 等软件将图像、音频和文字合成视频。 后期处理:进行剪辑、添加特效和转场以提高质量。 审阅与调整:观看视频并根据需要调整。 输出与分享:完成编辑后输出最终视频并分享。 请注意,具体操作步骤和所需工具可能因项目需求和个人偏好不同而有所差异,AI 工具的可用性和功能也可能随时间变化,建议访问工具网址获取最新信息和使用指南。同时,内容由 AI 大模型生成,请仔细甄别。
2024-09-04
是否有对比两张人像相似度的工具
目前有一些可以对比两张人像相似度的工具和技术,它们主要基于计算机视觉和人脸识别技术。以下是一些常见的选择: 1. 在线人脸比对工具 网上有一些免费或付费的在线人脸比对工具,例如 Face++、澄云人脸核身等,可以上传两张人像图片,系统会给出一个相似度评分。 2. Python 人脸识别库 像 face_recognition、dlib、OpenCV 等 Python 库都内置了人脸识别和相似度计算的功能,你可以用几行代码实现图片人脸比对。 3. 人脸识别云服务 一些科技公司提供了人脸识别的云 API 服务,如亚马逊 Rekognition、微软 Azure Face API、百度 AI 云人体分析等,可通过调用 API 获取两张图片的相似度。 4. 开源人脸识别引擎 有些知名的开源人脸识别系统如 FaceNet、ArcFace、InsightFace 等,你可以下载源码在本地部署,利用它们的相似度判断能力。 5. 人工智能应用平台 一些面向普通用户的 AI 平台如 PandorAI、PicoGPT 等,集成了人脸比对的功能模块,提供在线体验或调用接口。 使用这些工具前,通常需要先完成注册和人脸数据采集等准备工作。在选择时你可以考虑性能、便捷性、隐私安全、成本等因素。目前的人脸识别技术虽已相当精准,但也面临一些道德和法律挑战,使用时需谨慎。
2024-04-19
老照片修复用什么
以下是一些用于老照片修复的方法和工具: 1. 使用 SD 中的 ControlNet 模型,特别是其中的 Recolor 新模型,可对黑白老照片进行重新上色。在处理人物照片还原时,可选择 realisian 的写实大模型,提示词直接描述颜色和对应的内容。ControlNet 选择 Recolor 时,预处理器选择“recolor_luminance”效果较好。 2. 超清无损放大器 StableSR:需要使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入指定文件夹,同时安装 StableSR 模块和 VQVAE。通过不同的放大方法测试,如“Ultimate SD upscale”脚本、“后期处理”的放大方法和 StableSR 的放大,StableSR 对原图还原较为精准,重绘效果较好。 3. 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰,但无法使头发、衣服等元素变清晰。之后可将图片发送到图生图中,打开 stableSR 脚本进行放大修复。 相关参考文章: 1. 【SD】用 AI 给老照片上色,岁月不改它模样:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw 2. 【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿:http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487422&idx=1&sn=9cdf7ef37c2acb3c0fc3328d0ba8af74&chksm=c251597af526d06c921ea6728cb2a32bdf1d5f699e19d6ba13b849994e4d01af8a5144132aad&scene=21wechat_redirect 3. 【Stable Diffusion】超清无损放大器 StableSR:http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487403&idx=1&sn=cbb96534fa6f58c37cf9fc64bc7ade0c&chksm=c251596ff526d0792b4bba0e21b69427b23e780824bdc75b22f1073e8bad6f61f30199fc8344&scene=21wechat_redirect
2025-02-18
如何让老照片动起来
以下是一些让老照片动起来的方法和相关信息: 1. 参加“时光印记”AI 公益挑战赛:该挑战赛采集了杨浦 20 位老一辈建设者老照片与故事,期望用 AIGC 技术创作影视频、AIMV、动图。作品要求任选百年主题,创作视频短片、音乐 AIMV 或动态老照片,AI 制作内容不低于 70%,视频短片时长 60 秒以上,音乐 AIMV 至少 30 秒,图片组让老照片动起来 5 10s。报名及创作时间为即日起至 2024 年 11 月 20 日。参赛方式为填写报名问卷和进群获取素材。 2. 使用 Dreamina 即梦工具:不需要🪜,每天有免费额度。注册可用抖音号或手机号,上传照片即可尝试让老照片动起来。 3. 使用 Sora 工具:优点是发布的成果好,集成在 openai 一套里可用,但需要🪜,需要 gmail 注册,需要订阅后才能使用。
2025-02-14
照片变清晰
以下是将照片变清晰的方法: 1. 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰。您可以参考文章——。但此步骤无法将照片中的头发、衣服等其他元素变清晰。 2. 接着将图片发送到图生图当中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。您可以参考文章——。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免对原图产生干扰。 3. 对于修复,需要使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹中。StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹中。还有一个 VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。 4. 在使用清影工具时,输入一张图片和相应的提示词,清影大模型会根据提示将图片转变为视频画面。也可以只输入一张图片,清影大模型将自行发挥想象力把图片扩展为一段有故事的视频。选用尽可能清晰的图片,上传图片比例最好为 3:2(横版),清影支持上传 png 和 jpeg 图像。如果原图不够清晰,可采用分辨率提升工具将图片变清晰。提示词要简单清晰,可选择不写 prompt 让模型自己操控图片动起来,或者明确想动起来的主体并以「主体」+「主题运动」+「背景」+「背景运动」的方式撰写提示词。如果不明确大模型如何理解图片,推荐将照片发送到清言对话框进行识图,明确主体的描述。
2025-02-14
想在手机上通过宠物照片给宠物建模,是宠物可以有一些动态性,需要怎么做?利用 AIGC 能快速的实现吗?
在手机上通过宠物照片给宠物建模并实现一定的动态性,可以考虑以下几种方式: 1. 利用 3D 引擎:目前有一些公司提供通过手机摄像头快速创建虚拟人身体的服务,例如 NextHuman。不过,3D 引擎在拟真程度高的同时,定制化成本也较高。 2. 借助 AIGC:虽然 AIGC 省去了建模流程,能直接生成数字人的展示图片,但可能存在数字人难以保持 ID 一致性、帧与帧连贯性不佳等问题。典型的相关项目有 wav2lip等。但需要注意的是,如果对模型真实度要求较高,AIGC 方式可能不太理想,因为算法发展很快,未来可能会有更好的连贯度生成方式。 目前利用 AIGC 来快速实现可能存在一些挑战,但随着技术的发展,未来有可能更便捷高效地达成您的需求。
2025-02-13
有没有上传8张照片一键生成短视频的ai
以下是一些可以实现上传 8 张照片一键生成短视频的 AI 工具及相关操作: 1. PixVerse: 网址:https://app.pixverse.ai 操作:涂抹选区,给出相应的运动方向,最后加入配音,剪辑一下即可。 2. 出门问问 Mobvoi: 网址:https://openapi.mobvoi.com/pages/videointroduce 操作: 第一步:api 申请,打开网址,找到视频生成>开始体验>登录>创建应用>查看详情,获取自己的 APP key。 第二步:启动 ComfyUI,打开 json 文件。 第三步:在 api 节点输入第一步获取的 key 进行适配,获取 key 后查看详情找到账号和密码进行输入。 第四步:上传一张照片即可。 3. 即梦: 操作:将图片上传至视频生成模块,用简单提示词描绘画面中的动态内容,可生成时长为 3 秒钟的画面。运镜类型可根据剧本中的镜头描绘设置,主要设置以随机运镜为主,生成速度可选择慢速。
2025-02-09
想通过照片抠图,有没有好用的、免费的、无水印的工具?
以下是一些好用、免费且无水印的照片抠图工具: 1. AVAide Watermark Remover:在线工具,使用 AI 技术去除水印,支持多种图片格式,操作简单,可上传图片选择水印区域并保存下载处理后的图片,还提供去除文本、对象等功能。 2. Vmake:提供 AI 去除图片水印功能,可上传最多 10 张图片,适合快速去除水印及社交媒体分享图片的用户。 3. AI 改图神器:提供 AI 智能图片修复去水印功能,可一键去除多余物体、人物或水印,支持粘贴或上传手机图像,操作方便。 此外,还可以使用以下方式进行抠图: 1. Iphone 手机自带的抠图功能、美图秀秀或一些网站,如 https://www.remove.bg/zh ,直接上传图片即可。 希望这些工具能满足您的需求。
2025-02-09
AI 绘画提示词
以下是一些 AI 绘画常用的提示词: 画面构图方面: 人物拍摄:Chest Shot、headshot 爆头。 视角:Wideangle view 广角镜头、CloseUp的横截面图、cinematic shot 电影镜头。 相机相关:canon 5d,1fujifilm xt100,Sony alpha 相机型号焦段光圈。 其他:scenery shot 风景照、bokeh 背景虚化、foreground 前景、background 背景、Detail Shot。 画面氛围和情绪方面:moody 暗黑的、happy 鲜艳的,浅色的、dark 黑暗的、epic detail 超细节的、Brutal 残酷的,破碎的、dramatic contrast 强烈对比的、hopeful 充满希望的、anxious 焦虑的、depressed 沮丧、elated 高兴地、upset 难过的、fearful 令人恐惧的、hateful 令人憎恨的、happy 高兴、excited 兴奋、angry 生气、afraid 害怕。
2025-02-18
AI绘画课程
以下为您推荐的 AI 绘画课程: 【野菩萨】课程: 预习周课程:包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 基础操作课:涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等内容。 ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 免费课程机会:参与 video battle,获胜者可获得课程奖励,包括冠军 4980 课程一份、亚军 3980 课程一份、季军 1980 课程一份,入围奖励 598 野神殿门票一张。 扫码添加菩萨老师助理,了解更多课程信息。 【Stable Diffusion 零基础入门宝典】课程: 作者从事平面设计行业,基于对 Stable Diffusion 的学习和研究,开发了这套课程。 课程初衷是为刚入门或想了解 SD 的小伙伴做全面梳理,因为新人面对众多内容往往不知所措。 课程特色暂未提及。 SD 新手视频教程: 章节教学视频: 第一节课:AI 绘画原理与基础界面 第二节课:20 分钟搞懂 Prompt 与参数设置,你的 AI 绘画“咒语”学明白了吗? 第三节课:打破次元壁!用 AI“重绘”照片和 CG 第四节课:AI 绘画模型,“画风”自由切换 第五节课:提高 AI 绘画分辨率的方式 第六节课:LoRa|Hypernetwork 概念简析 第七节课:定向修手修脸,手把手教你玩转局部重绘! 第八节课:提示词补全翻译反推,“终极”放大脚本与细节优化插件 第九节课:LoRA 从原理到实践 第十节课:零基础掌握 ControlNet!
2025-02-17
你的知识库架构是怎样的,普通人如何迅速找到目标靶向,比如我想学ai绘画
以下是关于您想学习 AI 绘画的相关内容: 1. 知识库提到明天银海老师将详细讲解 AI agent,同时表示知识库内容丰富,您可挑选感兴趣的部分学习,比如较轻松的 AI 绘画等。 2. 强调 AI 绘画是视觉基础,还介绍了针对 AI 绘画学社做的关键词词库精选活动。 3. 讲述了 AI 绘画中的 stable diffusion 扩散模型的运作方式,是通过加噪和去噪,随机生成种子来形成最终图像,还提到生成式 AI 做高清放大可增加细节的原理。 您可以根据以上信息,逐步深入了解 AI 绘画的相关知识。
2025-02-15
Ai绘画,两个月入门
以下是为您提供的 AI 绘画两个月入门的相关内容: 首先,了解一下 AI 绘画的逻辑。就像您学习画画临摹梵高的作品一样,AI 绘画也是通过学习大量的美术风格作品来生成类似风格的作品。例如 Stable Diffusion ,您花四十年学习的梵高风格相当于它的大模型——Checkpoint 。人们将成千上万种美术风格作品训练成模型放入 AI 中,您想画出满意的作品,首先要选对合适的大模型。大模型可以在 C 站(https://civitai.com/)下载,但需要科学上网。 有位叫二师兄的人在二月接触到 AI 绘画,三月啃完 SD 的所有教程并开始炼丹,四月探讨 AI 变现途径,五月因工作变动但仍坚持学习,加入 Prompt battle 社群学习 Midjourney 。 另外,有人分享自己的经历,22 年 12 月学习 AI 绘画,直到最近因公司业务需求重新捡起,短时间内出过上千张图支持多个业务团队。如果想让人主动学习 AI ,有效的方式是让其看到 AI 能高效完成手头工作。生成式 AI 目前还在早期阶段,为其找高价值应用场景或许能持续一二十年,行业龙头可能是最大受益者之一。
2025-02-12
如何学习ai绘画
以下是关于学习 AI 绘画的一些指导: 首先,了解 Stable Diffusion 的工作原理。这就好比学习画画,比如学梵高的风格,要先看他的画并临摹。对于 AI 绘画来说,成千上万的美术风格作品被练成一个模型放在 AI 里,比如 Stable Diffusion 的大模型——Checkpoint,您可以在 C 站(https://civitai.com/,需科学上网)下载不同风格的大模型,如真实系、二次元、游戏 CG 风等。选对合适的大模型是画出符合心意作品的关键。 其次,要学会与 AI 对话,提示词(Prompt)非常重要。提示不是自然语言的简单应用,而是一种特殊的语言应用,它是实现人机交互的形式之一。 另外,还可以参考他人的学习经历,比如二师兄在 2024 年的学习过程。他从二月开始接触 AI 绘画,三月啃完 SD 的教程并开始炼丹,四月尝试 AI 变现途径,五月在没有硬件支持的情况下加入 Prompt battle 社群学习 Midjourney。 总之,学习 AI 绘画需要了解原理、选对模型、掌握提示词技巧,并不断实践和探索。
2025-02-12
ai绘画学习
以下是关于 AI 绘画学习的相关内容: 二师兄的 AI 启蒙之路(2024 年) 2024 年 1 月:购买 4070TiSuper 显卡和 4K160 显示器,为游戏做准备。 2024 年 2 月:在七彩虹售后群获得 AI 绘画的 SD 秋叶安装包和教学视频,开始学习。 2024 年 3 月:啃完 SD 的所有教程,开始炼丹,包括人脸、画风、风景、景观、建筑等,但因图片数据集质量一般且多为公司项目案例图片,lora 仅供自嗨。 2024 年 4 月:与小伙伴探讨 AI 变现途径,尝试用 GPT 和 SD 制作图文故事绘本、小说推文项目,过程中练了一些绘本风格的丹。 2024 年 5 月:因工作变动,电脑运回家,开始无硬件支持的 AI 学习之路,加入 Prompt battle 社群,学习 Midjourney,打磨文生图提示词学习。 AIGC 法律风险研究报告 以 AI 绘画为例,其运行机制有三层:基础逻辑层能完成风格迁移;数据库层需要大量“喂图”进行深度学习;创造性输出层能产出符合文字描述且有美学逻辑的图像。 在第一个阶段中,AI 绘画服务提供者爬取大量数据以供后一阶段使用。美国版权法将获取使用网络数据的行为纳入合理使用范畴,我国虽未明确规定“转换性使用”概念,但司法实践中有参考适用案例。但针对 AI 爬取网络数据的行为,不符合我国《著作权法》中合理使用规定,且举证困难,若认定为侵权行为不利于人工智能行业发展。 如果让我推荐一门 AI 课 预习周课程:包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 基础操作课:涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等内容。 ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 免费课程机会:可以参与 video battle,获胜者可获得课程奖励,包括冠军 4980 课程一份、亚军 3980 课程一份、季军 1980 课程一份,入围可获得 598 野神殿门票一张。扫码添加菩萨老师助理可了解更多课程信息。
2025-02-11
图片合成
以下是关于图片合成的相关介绍: ComfyUI BrushNet: 这个过程类似于小时候的连点成图游戏,现在由电脑在图片上操作。 1. 掩码:像有洞的纸覆盖在图片上,电脑程序通过洞了解需修复部分。 2. 编码器:是电脑的大脑,把需修复图片转换成能理解和处理的信息。 3. 噪声潜在空间:加入随机性让修复部分更自然。 4. BrushNet 和冻结的 UNet:像画家的画笔和调色板,帮助完成修复工作。 5. 去噪和生成图像:去除噪声,创建真实图片部分。 6. 模糊掩码和合成:用特殊技巧将新生成图片和原始图片融合。 Blend叠加: /blend 命令允许快速上传 2 5 张图片,通过对每张图片的概念和美学分析,将它们合并成新图。 与 /imagine 结合多个 。 在输入 /blend 命令后,会提示上传两张照片,可从硬盘拖放或在移动设备从照片库添加。要添加更多图像,选择 optional/options 字段并选 image3、image4 或 image5。 图像叠加默认 1:1 宽高比,可使用可选的 dimensions 字段选择方形(1:1)、肖像(2:3)或横向(3:2)的长宽比。 与其他 /imagine 命令一样,/blend 指令末尾可添加 ,指定在 /blend 命令中的宽高比会覆盖自定义后缀中的宽高比。为获得最佳处理效果,上传与期望结果相同的图像宽高比。
2025-02-10
仿制药合成相关的ai有哪些?
以下是一些与仿制药合成相关的 AI 应用和系统: 1. ChatGPT 引发的范式转移涉及医疗领域,在蛋白质结构预测和合成方面有大量突破。 2. AlphaFold 是由 DeepMind 开发的在蛋白质结构预测方面表现出色的 AI 系统,其预测准确度超过其他系统,为科学家和药物开发提供了巨大帮助。 3. Meta 的蛋白质结构预测 AI 模型 ESMFold,截至目前已经进行了 7 亿次预测。 4. 多伦多大学研究人员开发了一种新的 AI 系统,利用类似 Stable Diffusion、Midjourney 的生成扩散技术创造出自然界中不存在的蛋白质。 5. 华盛顿大学的 David Baker 教授的团队开发了基于 DALLE 的人工智能系统 RF Diffusion,用于根据科学家的需求生成合适的蛋白质结构。 6. 洛桑联邦理工学院的科学家们开发了一种基于神经网络的新工具 PeSTo,可以预测蛋白质如何与其他物质相互作用,速度快、且通用性强。 7. 在 Surrey 大学开发了一种人工智能系统,用于识别个体细胞中的蛋白质模式,这一进展可以用于理解肿瘤的差异并开发药物。 8. 肯特大学的研究团队使用名为 talin 的蛋白质制成凝胶,该凝胶具有吸收冲击的能力,他们的目标是将 talin 蛋白质制成防弹材料。 文献参考: https://www.sciencedaily.com/releases/2023/05/230504121014.htm https://www.wevolver.com/article/pestoanewaitoolforpredictingproteininteractions https://www.sciencedirect.com/science/article/pii/S0958166923000514
2025-02-03
怎么把视频或图片中的人脸进行替换,生产新的合成图片或视频
要把视频或图片中的人脸进行替换,生成新的合成图片或视频,可以参考以下方法: 1. 利用 TecCreative 创意工具箱: 图片换脸:仅需上传原始图片和换脸图片,即可一键实现素材换脸。操作指引为上传原始图片——上传换脸图片——点击开始生成。注意图片大小上限 5M,支持 JPG、PNG 格式。 视频换脸:自动识别视频中的人脸,并将其替换为选择的脸部。操作指引为上传原始视频——上传换脸图片——点击生成。 2. 实战方法: 点击快捷工具中顶部的 JupyterLab,打开这个工具。通过终端输入命令启动 facefusion: 点击顶部的 + 号选项卡,新打开一个终端窗口。 点击终端区域,启动一个终端的选项卡。 在打开的终端窗口中,输入 3 条命令做 3 件事情: 查看文件列表。输入 ls 并按回车,显示当前位置所在目录下的文件列表。 进入 facefusion 目录,输入 cd facefusion 并按回车,进入程序目录。 启动 facefusion。输入:python./run.py executionproviders cuda cpu 启动程序。注意后面的参数 executionproviders cuda cpu 非常重要,如果不加 cuda,则默认不使用 GPU 能力,推理将非常慢。 当出现提示信息时,说明启动成功。 打开 facefusion 软件,需要返回实例列表,点击自定义服务按钮,会打开一个新的浏览器窗口。 在 facefusion 软件界面上,上传准备好的图片、视频后,在右侧可以看到预览效果。点击下方的开始按钮,执行换脸处理。执行完成后,在输出的位置,会出现处理后的视频,输出窗口的右上角有一个下载按钮,点击它可以导出变量后的视频到本地。
2025-02-01
视频合成
视频合成是一个具有一定难度的任务,原因包括: 1. 视频合成需要不同帧之间保持时间一致性,这要求将更多世界知识编码到模型之中。 2. 收集大量高质量、高维度的视频数据,以及配对的文本视频数据更为困难。 如果想用 AI 把小说做成视频,可参考以下制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-02-01
可以将自己原创清唱配乐合成一首完整作品吗
目前的 AI 技术可以帮助您将自己原创清唱配乐合成一首完整作品。有多种相关的软件和工具可供使用,例如一些专业的音频编辑软件,它们具备音频合成、混音等功能,可以将您的清唱和配乐进行整合和优化。但具体的效果可能会受到您的清唱质量、配乐选择以及操作技巧等因素的影响。
2025-01-26