Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

图生图, 如何保持生物形象一致性

Answer

在图生图中保持生物形象一致性,有以下几种方法:

  1. 对于人物和场景一致性问题,可以采用生成动物的方式,动物相对容易保持一致性。
  2. 选择特定的名人或具有特殊属性的人物。
  3. 确定好影片风格,如皮克斯动画风格。
  4. 先确定好人物形象,如明确角色的发型、穿着等特征。
  5. 使用 Midjourney 的新功能 Cref,在需要出现主角人物的地方,保持发型、人脸、衣服等特征。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性效果相对较差,尤其对于亚洲老人,而且 Cref 在画面的审美和构图上有一定破坏性,原则上能不用则不用。例如只有背影时,简单描述特征即可。
Content generated by AI large model, please carefully verify (powered by aily)

References

前Sora时代我最想做的AI短片——使用Pika、Pixverse、Runway、SVD四大AI视频工具

更多写剧本的方法、小技巧、格式还有软件,希望后面有时间可以多写一些。照例,先放上我写的分镜,这是非常粗糙且不规范的分镜,正常的分镜是要更仔细的,所以大家凑活看。与上一次制作不同的是,因为更了解AI生图的局限,所以我这次写的分镜,有百分之八十都用上了。也算提高了效率,但还是写得太粗糙了,下次尽量按照正规格式写得准确一些,如果我的肝还好的话(主要是就只有我和Zoik看就有点偷懒了)……给大家推荐一些编剧相关的书,虽然我觉得写短片看这些书还是太多了,但基本涵盖了常见的剧作书,供参考吧~其实也不用看这么多书,只不过我看到同类型的书就想买来对比,没时间的话,看《救猫咪》或《电影剧本写作基础》的第一册就行。主要还是练习,写。第二步,生图这次生图,我明显感觉到Midjourney的语义理解比之前好了很多。很多人在生图上都遇到了人物和场景一致性的问题。有两个取巧的方式,一个是像我上个视频一样生成动物,动物会比较容易保持一致性,另一个方式是特定的名人/或者有特殊属性的人物。这次我们用的是第二种方式。首先,先确定好影片风格,这次用的是皮克斯动画风格。真的不是我们不做其他题材,是因为这个故事比较适合用动画呈现,后面的片子我们会多尝试别的题材风格。其次,先确定好人物形象。短片有两个主要角色,角色一:扎马尾、穿白色T恤、穿牛仔裤的14岁女孩;角色二:戴眼镜、灰色头发、穿灰色短衬衫的50岁男人。

卡兹克:我们花了10天时间,给CCTV6做了一部AI短片 - 5000字全流程复盘拆解

在图片生成上,我们依然用的是Midjourney,原因依然单纯的很简单:我要的电影感和审美,只有Midjourney可以做出来。很多人问,画面的电影感到底怎么做出来,为什么我的图总是一股子AI感。其实挺简单的,画面的电影感无非就是几个点:画幅,审美、色调、构图、光影、景深等等。我最喜欢用的画幅比例就是,21:9。画幅的比例是会影响生图的构图和光影的,21:9,是出电影感最好的比例。同时在Prompt里,也可以加电影的专用摄影机,比如RED Helium 8K等等。而我们的整体Prompt风格后缀:________.Shot on Sony Venice 2,muted color tones,green and dark gray,award-winning composition,cinematic scene--ar 21:9而在人物一致性上,在有了Midjourney的新功能Cref以后,其实就非常简单了。我们直接先跑了一张主角的定妆照。然后在需要出现主角人物的地方,扔进去Cref。保持发型、人脸、衣服。坦率的讲,Midjourney对亚洲人脸的Cref一致性,要比对欧美的人脸的一致性效果差太多太多了,年轻人还好点,亚洲老人简直惨不忍睹。而且Cref的效果,在画面的审美和构图上,其实是有一定的破坏性的,所以在原则上,是能不用Cref就不用Cref,比如只有背影的时候,写个短发男人黑卫衣就完事了。

开发:PIKA1.0上手评测 - 你就是传奇

能明显感受到,PIKA1.0是启用了一个全新的模型,甚至我感觉不是基于旧有的迭代,而是完全重新做的一个全新的模型。强非常非常多。3D和2D的动画效果更是吊炸天。所以他们的新模型,我会多花一些篇幅和笔墨,来展现一下。首先,文生视频的质量得到了大幅度的提升。我直接写了一段:Prompt:Cinematic,happy laughing girl in office,Pixar style瞬间,匹配皮克斯水平的镜头就出来了。要知道,我只花了1分钟。这效果,我说实话,太特么吓人了。。。。。。而且,这稳定性,这神情。。。爆杀市面上所有的AI视频。再来!A cat flying a plane,Cartoon style在文生图这块,PIKA1.0的新模型稳定的令人害怕。Cinematic,extreme close-up of cars on the road in a jungle,3D rendering不规则构图的汽车行驶在道路上,这个前进的镜头依然稳定的可怕,车上的光影更是表现的极好。无敌。真的无敌。同时,有两个小技巧是,右下角第三个设置里,负面提示(Negative prompt)可以常驻:blurry,out of focus,twisted,deformed。提示词相关性别设太高,可以5~15之间,自己实测下来效果最好。再来说图生视频。图生视频这块,效果也依旧棒。放几个case。(这里因为GIF图比较大所以只能放了每秒10帧的GIF,所以看起来可能有一些卡,这并不是PIKA的原因。)说实话,Runway原本剩的唯一优势就画质好+一致性强点了。。。但是你看看现在的PIKA1.0。。。。。。人的一致性已经逆天了,再加上它强到爆的语义理解,以及幅度巨大的动作。。。。咋比啊。。。这PIKA1.0新模型的质量,特别是它最擅长的3D和3D的动画的质量,真的让人激动到无以复加。

Others are asking
哪个ai工具可以根据现有的网站或截图生成源代码
以下是一些可以根据现有的网站或截图生成源代码的 AI 工具: :借助 GPT4 Vision 的能力,能直接将屏幕截图转换为 HTML/Tailwind CSS,并利用 DALLE 3 的图像生成能力生成相似图像。 此外,还有一些与网站制作相关的 AI 工具: Wix ADI 。基于用户提供的信息自动生成定制化网站,提供多个设计选项和布局,集成了 SEO 工具和分析功能。 Bookmark:网址为 。通过询问用户几个简单问题快速生成网站,提供直观的拖放编辑器,包括多种行业模板和自动化营销工具。 Firedrop:网址为 。其 AI 设计助手 Sacha 可根据用户指示创建和修改网站设计,提供实时编辑和预览功能,包含多种现代设计风格和自定义选项。 The Grid:网址为 。其 AI 设计助手 Molly 可以自动调整网站的设计和布局,基于内容和用户互动进行优化,支持多种内容类型。 在 AI 代码生成和开发工具方面: :由 Wingware 开发的专为 Python 编程设计的开发环境,集成了多种功能,年度许可证起价 179 美元/月。 :开源的 AI 开发助手,能根据产品需求生成完整的代码库,遵循 MIT 许可证。 :Sourcegraph 的 AI 工具,作为全面的编程助手能理解整个代码库,个人使用免费。
2025-02-18
免费图生视频AI有哪些
以下是一些免费的图生视频 AI 工具: 1. Pika:出色的文本生成视频 AI 工具,擅长动画制作,支持视频编辑。 2. SVD:若熟悉 Stable Diffusion,可安装此最新插件,能在图片基础上生成视频,由 Stability AI 开源。 3. Adobe Firefly:支持文生视频、图生视频、视频翻译,免费用户赠送生成 2 个视频。访问。 4. 混元:腾讯视频模型,目前只支持文生视频,图生视频即将上线。 更多的文生视频的网站可以查看这里: 内容由 AI 大模型生成,请仔细甄别。
2025-02-17
图生图, 如何保持幻想生物形象一致性
要在图生图中保持幻想生物形象的一致性,可以参考以下方法: 1. 对于 Midjourney ,可以采用特定的名人或有特殊属性的人物形象,先确定好影片风格,比如皮克斯动画风格,然后确定好人物形象,如角色的发型、穿着等细节。 2. 利用 Midjourney 的新功能 Cref ,先跑一张主角的定妆照,在需要出现主角人物的地方扔进去 Cref ,以保持发型、人脸、衣服等的一致性。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性,尤其是亚洲老人的一致性效果相对较差,且 Cref 在画面的审美和构图上有一定的破坏性,所以原则上能不用就不用,比如只有背影时,简单描述即可。 3. 生成动物形象,动物相对更容易保持一致性。
2025-02-14
图生视频指令参考
以下是关于图生视频的指令参考: Morphstudio 中: 文生视频:提示词指令为“/video”。举例:“/video 你好世界比例 16:9动作幅度为 5镜头拉近每秒 30 帧秒数为 5 秒” 图生视频:提示词指令为“/animate一只在行走的猫比例 16:9动作幅度为 5相机向上移动每秒 30 帧” 参数说明: “ar”(只针对 MorphVideo 机器人):用来设置视频的画面比例,如 16:9、4:3、1:1、3:4、9:16 等。 “motion”:调整视频中的运动强度,数值越低运动越微妙,数值越高运动越夸张。 “camera”:控制摄像头移动,如 Zoom(镜头拉近/拉远)、Pan(摄像机向上/向下/向左/向右移动)、Rotate(相机顺时针旋转或逆时针旋转)、Static(相机静态)。 “fps”:视频的帧率,默认每秒 24 帧。 “s”(只针对 MorphVideo 机器人):设置视频的时长,单位是秒。 此外,还有其他案例: Vidu 大家测试中,有“公子在宣武门前站着说话,气场强大,头发和衣衫随风飘动,气体流动,手指向远方”“小孩子向画面右侧奔跑,后面腾起一路尘土”“公子扔出手中球体法器,法器升空爆出万丈金光,公子惊奇的看着”等提示词生成的视频效果。 桂大羊的教程中,通过性格特征和时代背景描绘人物提示词、上传角色参考图,根据剧本创作提取场景提示词,采用文生图模式并进行垫图操作,确立台词、剧本、风格、人物形象、画面场景后,使用即梦进行图生视频,上传图片至视频生成模块,用简单提示词描绘动态内容,可生成 3 秒钟视频,运镜类型可根据剧本镜头描绘设置,以随机运镜为主,生成速度可选择慢速。
2025-02-13
图生视频指令
以下是关于图生视频的指令: 1. Morphstudio: 文生视频:提示词指令为`/video`,举例:`/video 你好世界比例 16:9动作幅度为 5镜头拉近每秒 30 帧秒数为 5 秒` 图生视频:提示词指令为`/animate一只在行走的猫比例 16:9动作幅度为 5相机向上移动每秒 30 帧` 参数说明: `ar`(只针对 MorphVideo 机器人):用来设置视频的画面比例,如 16:9、4:3、1:1、3:4、9:16 等。 `motion`:调整视频中的运动强度,数值越低运动越微妙,数值越高运动越夸张。 `camera`:控制摄像头移动,包括 Zoom(镜头拉近/拉远)、Pan(摄像机向上/向下/向左/向右移动)、Rotate(相机顺时针旋转或逆时针旋转)、Static(相机静态)。 `fps`:视频的帧率,默认每秒 24 帧。 `s`(只针对 MorphVideo 机器人):设置视频的时长,单位是秒。 2. Runway: 图片搞定之后,拖到 runway 里面去图生 4s 视频。(runway 是收费的,可在闲鱼或淘宝买号找免费的) 进入 runway 官网首页,点击 start with image,然后直接将图片拖进来。 动画幅度尽量用 3,5 有时候会乱跑。 啥都不用改,直接点击生成即可。 注意:不需要等进度条转完,可以直接继续往里放图片,可以同步执行。 直接点删除,然后重新上传下面的图即可(最多可以放几个没数,可自行测试) 3. Pika: 生成视频频道在 Discord 上,点击邀请链接(https://discord.gg/pika)加入频道。 生成视频的指令: `/create`为文字生成视频指令。 `/animate`为图片生成视频指令。 `/encrypt_image`为图片+文字生成视频指令。 常用指令参数: `gs xx`:引导比例,较高的值使其与文本更相关(推荐范围为 824)。 `neg xxx`:负面提示(指定在视频中不希望出现的内容)。 `ar xx:xx`:宽高比(例如 16:9、9:16、1:1、4:5)。 `seed xxx`:生成过程中增加一致性的种子数。 `motion xx`:所需运动强度(仅支持 0/1/2)。 `fps xx`:视频的帧率。
2025-02-13
图生图 / img2img:上传一张图片,然后系统会在这个图片的基础上生成一张新图片,修改一些提示词(Prompt)来改变新图片的效果 , 给我推荐这类大模型
以下为您推荐可用于图生图(img2img)的大模型: 1. Stable Diffusion(SD)模型:由 Stability AI 和 LAION 等公司共同开发,参数量约 1B,可用于文生图、图生图、图像 inpainting、ControlNet 控制生成、图像超分等任务。在图生图任务中,SD 模型会根据输入的文本提示,对输入图片进行重绘以更符合文本描述。输入的文本信息通过 CLIP Text Encoder 模型编码成机器能理解的数学信息,用于控制图像生成。 2. Adobe Firefly image 2 模型:上周发布了 Beta 测试版本,增加了众多功能,模型质量提升。默认图片分辨率为 20482048,对图片的控制能力增强,具有更高质量的图像和插图生成、自定义选项和改进的动态范围。支持生成匹配(img2img),应用预先选择的图像集中的风格或上传自己的风格参考图像以创建相似图像,还有照片设置、提示建议、提示链接共享、反向提示词等功能。
2025-02-12
给我5个midjourney确保场景一致性的Sample提示词
以下是 5 个 Midjourney 确保场景一致性的 Sample 提示词: 1. Scifi movie scene. In the silverwhite space environment, from the overtheshoulder lens on the right side of the man with short hair and navy blue jumpsuit, a transparent virtual screen appeared on the wall in front of him. Behind there is the silhouette of another female employee with long blue hair, operating another screen. Rendered in a C4D style inspired by Unreal Engine, with high resolution and rich detail. sref url cref url ar 16:9 style raw sw 30 cw 100 2. In a magical forest, a fairy with colorful wings is sitting on a huge mushroom. The sunlight filters through the leaves, creating dappled patterns on the ground. cref https://my.image.host/fairy.jpg s 800 3. On a sandy beach at sunset, a couple is walking hand in hand, leaving footprints in the sand. The ocean waves crash gently in the background. cref https://my.image.host/couple.jpg ar 9:16 4. In a medieval castle courtyard, a knight in shining armor is training with a sword. The flags are fluttering in the wind. cref https://my.image.host/knight.jpg s 700 5. At a busy city street corner, a street musician is playing a guitar, surrounded by a crowd of people. The buildings are towering in the background. cref https://my.image.host/musician.jpg ar 4:3
2025-02-14
文生图人物一致性
以下是关于文生图人物一致性的相关内容: 在使用 ControlNet 进行文生图时,首先进入文生图界面填写提示词生成一张图。然后将图片拖入 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,保真度数值越高对图片的参考越强。在没有明确指向性提示词的情况下,人物形象能保持一致,但表情、动作、服装会有随机不同程度的变化。可以通过添加关键词来给人物换装、更改服装和表情、更改动作和表情、更改姿态、环境和表情等,例如添加“红裙子”“黑色校服、哭泣”“抱手、生气”“在花丛中奔跑、开心”“红色棒球帽,时尚卫衣,在商场逛街”。通过一系列测试,这个功能在绘制系列插画、漫画、小说插图等工作时,能保持主角形象的统一,也能根据情况实时调整,后期配合 lora 潜力巨大。 另外,在 PIKA1.0 新模型中,人的一致性已经逆天,再加上其强大的语义理解和大幅度的动作,在文生图方面表现出色。
2025-02-11
多人物场景,人物一致性如何保证
在多人物场景中保证人物一致性可以参考以下方法: 1. 在使用 Midjourney 出图时,多角色情况下,放弃参考角色(cref 提示),只用参考风格(sref 提示)。这样的好处是不会出现奇怪的组合,坏处是出图较随机。 2. 多用局部重绘,虽然具有随机性,但多试几次能得到一致性较好的图。 3. 出图时先只出一个主要角色和场景。当出现多角色场景时,把其他角色抠图粘贴过来。比如老虎向兔子认错的场景,若兔子和老虎不一致,可先出稳定的老虎,再粘贴兔子以保证一致性。 4. 按照“三个确定”的 SOP 处理: 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 确定图片角色一致性:在保证构图风格没问题的基础上,保证人物一致性。先保证构图再确认角色一致性,因为 MJ 在重绘时,将角色在镜头中的位置挪动处理较难,固定位置重绘局部内容相对容易,若先保证人物内容,会很依赖 MJ 抽卡,随机性大。
2025-02-10
AI图片制作视频如何保持人脸一致性的工具
以下是一些关于在 AI 图片制作视频中保持人脸一致性的工具和方法: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。 2. PixVerse:其“角色(Character)”新功能能实现 AI 生成视频中的角色保持一致。用户只需单击“Character”功能,上传符合要求的真实人脸图像,点击创建自定义角色,训练一个新角色,然后可使用自定义角色生成视频,可在 AI 生成视频中轻松切换场景,同时保持同一角色身份。 3. Midjourney:在有了 Midjourney 的新功能 Cref 以后,可在一定程度上保持人物一致性。先跑一张主角的定妆照,然后在需要出现主角人物的地方,扔进去 Cref 以保持发型、人脸、衣服。但 Midjourney 对亚洲人脸的一致性效果,尤其是亚洲老人的一致性效果较差,且 Cref 在画面的审美和构图上有一定的破坏性,所以能不用则不用。 需要注意的是,目前对于场景一致性,基本上还没有任何有效的解决办法。
2025-01-31
图的角色 用 cref 去控制一致性 风格可以用 sref 去控制
在 Midjourney 中,cref 和 sref 是用于引用图片的功能,它们有以下区别和使用方法: 1. 角色参考(cref): 作用:保持图像角色的一致性。 使用方法:在提示后添加“cref”,紧接着指向人物参考图像的 URL。例如:/imagine prompt beautiful girlcref。可以使用“cw”调整参考图像对生成图像的影响程度,数值范围从 0 到 100。强度 100(“cw 100”)是默认值,会使用面部、头发和衣服,cw 为 0 的话仅保证脸部一致。基础格式为“cref 图片链接,cw 100”。 参考链接: 2. 风格参考(sref): 作用:生成类似风格的图片,保持画风的一致性。 使用方法:在提示后添加“sref”,紧接着指向风格参考图像的 URL。例如:/imagine prompt beautiful girlsref。可以使用“sw”调整参考风格对生成图像的影响程度,数值范围从 0 到 1000。基础格式为“sref 图片链接,sw 100”。 参考链接: 如果想引用一张图,但只是把它作为新图的一部分,可以使用“sref”或“cref”,并通过调整“sw”或“cw”的值来控制引用图像的影响程度。例如:/imagine prompt beautiful girlsrefsw 500。这样,生成的图像将会在保持原有风格的同时,融入一部分引用图像的风格。
2025-01-13
基于参考图片人物形象生成指定迪士尼风格的图片
以下是关于基于参考图片人物形象生成指定迪士尼风格图片的相关内容: 在 Midjourney 中,生成指定迪士尼风格的图片可以通过以下方式: 1. 角色参考(cref):cref 的功能是保持图像角色的一致性。使用方法是在提示后添加 cref,并紧接着指向人物参考图像的 URL。您可以使用 cw 来调整参考图像对生成的图像的影响程度,数值范围从 0 到 100。 2. 风格参考(sref):sref 的功能是生成类似风格的图片,保持画风的一致性。使用方法是在提示后添加 sref,并紧接着指向风格参考图像的 URL。您可以使用 sw 来调整参考风格对生成的图像的影响程度,数值范围从 0 到 1000。 如果想引用一张图,但只是把它作为新图的一部分,可以使用 sref 或 cref,并通过调整 sw 或 cw 的值来控制引用图像的影响程度。 生成一张 Disney 风格的头像的具体步骤如下: 1. 选一张比较满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,然后在聊天框发送(记得点击回车或发送按钮)。 2. 图片会上传到服务器并生成一张唯一的链接,点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,复制下来。 3. 使用这个链接加 prompt 提示词来发送给 Midjourney,Midjourney 会根据需求生成特定的图片,这就是 Midjourney 的以图绘图。 此外,在生成 3D 效果图时,如生成可爱的拟人小鹿角色,可以在即梦图片生成界面中导入参考图,参考选项为参考轮廓边缘,生图模型选择 图片 2.0,输入包含角色、细节描述、场景、风格材质等的提示词,生成图片。
2025-02-12
我想用自己训练的卡通形象lora生成一张元宵节放孔明灯的海报,应该怎么制作
以下是用自己训练的卡通形象 lora 生成元宵节放孔明灯海报的制作方法: 1. 关键词: 模型:dreamshaper_8 正关键词:,white,white_background,CGposterrender bsw <lora:电商新年海报 2024_v1.0:0.4>,gold,<lora:新年红包封面_v1.0:0.6>,new year,<lora:gcbottle:0.3> 中文的关键词:(杰作,高分辨率,高品质,高分辨率)中国建筑,红色主题,剪纸,中国结,纸灯笼,中国图案,金色,中国元素,红色背景 2. ControlNet 设置: 预处理器:depth_leres 模型:control_v11f1p_sd15_depth 权重:0.75 预处理器:softedge_pidinet 模型:control_v11p_sd15_softedge 权重:0.3 3. lora 资源: https://www.liblib.ai/modelinfo/bddf824e232f4124991c05a26027504d https://www.liblib.ai/modelinfo/983703dd48134e43983b84abfcb44308 第三个东方瓷器 lora 已经下架(请至 AGI 之路百度云下载) 链接:https://pan.baidu.com/s/10hYM8i2y2Li9OlT2oD1qOQ 密码:asub 您可以参考以上步骤进行制作,同时您还可以访问以下链接获取更多相关信息: 作者小红书:https://www.xiaohongshu.com/user/profile/5cfd0e600000000016029764?wechatWid=803c253b00ed4224d3a2adcd80b46ed7&wechatOrigin=menu 通往 AGI 之路小红书教程:http://xhslink.com/OOeHsy AI 春晚阶段性纪实:https://waytoagi.feishu.cn/wiki/MI0UwhfXJiRH9ak4dwxcwqPVnIh
2025-02-08
如何用自己的形象做卡通数字人?
以下是用自己的形象做卡通数字人的方法: 1. 简单提示词方法: 在聊天窗口输入/imainge找到/imagine prompt,然后把刚才的链接放进去,然后空格。 加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数。 设置参数: iw 1.5是设置参考图片的权重,数值越高与参考的图片越接近,默认是0.5,最大是2,可选择中间的某个值并调整。 s 500设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为01000间任意整数。 v 5是指用midjourney的第5代版本,这一代的最真实,目前v5需要订阅付费,不想付费可以使用v 4。 no glasses是指不戴眼镜,如果你不喜欢戴眼镜的图片,可以戴上这个设置,让它不戴眼镜。 完整的提示词如下simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5。如果对生成的效果不满意,可以调整s和iw的值来进行多次尝试。 2. 剪映生成数字人方法: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。 选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。剪映App会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。 左下角会提示渲染何时完成,然后可点击预览按钮查看生成的数字人效果。 增加背景图片: 直接删除先前导入的文本内容,因为视频中的音频已包含文字内容。 鼠标点击下方代表文字的轨道,或点击软件中间文字内容,按删除键删去文字。 点击左上角的“媒体”菜单,并点击“导入”按钮,选择本地的一张图片上传。 选择一张图片上传,点击图片右下角的加号,将图片添加到视频的轨道上(会覆盖数字人)。 书架图片所在的轨道会在视频轨道的下面添加一条新轨道。 点击轨道最右侧的竖线,向右拖拽,直到视频的最后,与视频对齐。 背景图片所在的轨道若没选中,鼠标点击一下这个轨道即可。 在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口,并将数字人拖动到合适的位置。 3. 复杂提示词方法: 如果觉得简单提示词生成效果不好,可以选择更为复杂一点的提示词,比如:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5。 不同照片生成:如果对照片风格不满意,可以换一张新的照片使用上面的提示词重新生成。 其他调整:如果觉得Disney风格的头像太过卡通,可以把提示词里面的Disney都换成Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的boy换成girl。每次会生成4张图片,如果对某一张图片满意,点击下方的U1~U4生成大图,如果对风格满意但是需要调整,点击下方的V1~V4进行修改。
2025-02-07
我想用AI生成一个固定形象
以下是关于生成固定形象的一些方法和示例: AI 女友麦洛薇: 人设固定:通过保存包含知识图谱信息的 json 文件在本地来控制人设,实现不会忘记基本特征及与他人或事的关系,适合创造动漫或游戏角色。接入飞书后,对其基本信息提问能准确回答。 永久记忆:与麦洛薇对话时,她会学习未知信息,将其抽取实体和关系存入知识图谱,保证不会因上下文窗口不足而溢出,能从知识图谱提取被丢弃的记忆。 SD 中绘制一致性多角度头像: 实现角色一致性的最佳方法是使用 LoRA,但训练 LoRA 需至少 15 20 张图片的训练集。 准备工作:准备一张人物的多角度图片,尺寸设置为 1328×800px,放大两倍后保证每张小图为 512×512px,加上网格图,设置 controlnet 等。 7 大方向生成 AI 人物形象: 人物服装选择:可使用万能固定句式「主题」+「风格」+「材质」+「元素」+「玄学佐料」,如“Chinese dress”的示例,通过添加材质装饰细节可使服装更精致。
2025-01-08
设计虚拟形象的
以下是关于设计虚拟形象的相关内容: 品牌虚拟代言人: 品牌自建虚拟代言人的原因:明星代言存在风险,如塌房、受《广告法》约束、代言多个产品导致消费者心智混乱等。 虚拟代言人的优势:成本低,行为和说话可控,可扩展性强,可定制性高,可追踪性好。 虚拟代言人的劣势:影响力相对明星代言人较弱,从出道到产生影响力需要漫长积累过程。 自建虚拟人的方式:有的基于传统品牌虚拟形象革新,如海尔的“海尔兄弟”、肯德基的“山德士上校”;有的基于真人偶像形象设计,如天猫的“千喵”、聚划算的“刘一刀”;有的创建全新的虚拟代言人,如屈臣氏的“屈晨曦 Willson”、欧莱雅的“M 姐”、SKII 的“Yumi”等。 品牌代言人:品牌代言人是企业为影响消费者购买行为聘请或塑造的有魅力的人,消费者会因对代言人的喜爱延伸到产品和品牌。但明星塌房事件让品牌选择明星代言有所顾虑,不少品牌开始与虚拟偶像合作或自建虚拟代言人。 用 AI 制作可动交互虚拟形象(支持面捕): MidJourney 生成形象设计:包括初步生成,一边尝试一边修改关键词,选择中意的形象精修,使用 PS 对图像进行处理(如调整颜色、抠图、锐化、优化细节),使用 PS 制作海报底图(异兽名字+原文简介)。 需要注意的是,虚拟形象的核心是内容,企业需要有持续创作优质内容的能力,否则打造虚拟形象的意义不大。
2025-01-04
关于生物医药科研方面,哪些AI比较适合
以下是一些在生物医药科研方面适合的 AI: 1. ChatGPT 和 Google Bard:在日常工作生活中很有用,极大加速了医疗健康生物制药的研究,在抗癌、抗衰老、早期疾病防治等研究应用中起着重要作用。 2. Scite.ai:是为研究人员、学者和行业专业人员打造的创新平台,提供引用声明搜索、自定义仪表板和参考检查等工具,能简化学术工作。(https://scite.ai/) 3. Scholarcy:是一款科研神器,能从文档中提取结构化数据,并通过知识归纳引擎生成文章概要,包含关键概念、摘要、学术亮点、学术总结、比较分析、局限等板块的内容。(https://www.scholarcy.com/) 此外,AI 在生物医药科研领域有很多最新进展,例如: 1. AI 提前三年诊断胰腺癌,如果当年有这个,也许乔布斯还在世:https://hms.harvard.edu/news/aipredictsfuturepancreaticcancer 2. 两名高中生与医疗技术公司 Insilico Medicine 及其人工智能平台 PandaOmics 合作,发现了与胶质母细胞瘤相关的三个新靶基因,这些基因对于有效对抗这种癌症至关重要:https://finance.yahoo.com/news/teenagegeniusesaiuncovercancer163541619.html 3. AI 帮助抗衰老;由 Integrated Biosciences 领导的一项最新研究通过使用人工智能筛查了超过 800,000 种化合物,专家们发现了三种高效的药物候选物,其药理学性质优于目前已知的抗衰老物质:https://www.earth.com/news/artificialintelligenceidentifiesnewantiagingcompounds/ 4. 使用 AI 寻找阿尔兹海默症的治疗方法;亚利桑那大学与哈佛大学共同利用人工智能对健康神经元在疾病进展过程中的分子变化研究,以识别阿尔茨海默病的原因和潜在药物靶点:https://medicalxpress.com/news/202305scientistsaidrugalzheimer.html 现在,我们正处于一个革命的起点,AI 正在工业化生物制药和医疗保健,被应用于从药物设计和诊断到医疗保健交付和后勤功能的各个方面。
2024-09-09
生物化学相关的AI工具
在生物化学领域,有许多AI工具可以帮助研究人员和学生进行数据分析、模拟实验、文献搜索和学习。以下是一些主要的AI工具和资源: 数据分析和模拟 a. 分子动力学模拟 GROMACS:用于分子动力学模拟和分析,适用于研究生物分子,如蛋白质、脂质和核酸的结构和动力学。 AMBER:分子动力学模拟软件包,用于模拟生物分子系统。 AutoDock:用于分子对接和虚拟筛选,帮助预测配体与受体的结合模式。 b. 计算化学 Gaussian:用于电子结构计算,帮助研究分子轨道和化学反应机制。 ORCA:开源量子化学软件包,适用于各种电子结构计算。 文献搜索和管理 a. 文献搜索 PubMed:国家生物技术信息中心(NCBI)提供的生物医学文献数据库,包含大量生物化学相关文献。 Google Scholar:学术搜索引擎,提供广泛的科学文献搜索。 b. 文献管理 Mendeley:文献管理和研究协作平台,帮助组织和分享研究文献。 Zotero:开源文献管理工具,支持多种文献格式和引用样式。 学习和研究辅助 a. AI 辅助学习 Quizlet:使用AI生成学习卡片,帮助记忆生物化学概念和术语。 Khan Academy:提供生物化学相关的免费在线课程和互动练习。 b. 智能笔记工具 Notion:多功能笔记工具,适用于组织和管理生物化学笔记和实验记录。 Evernote:支持多设备同步和智能搜索,帮助管理学习和研究笔记。 数据库和知识库 a. 生物数据库 PDB :提供蛋白质和核酸的三维结构数据。 UniProt:包含蛋白质序列和功能信息的综合数据库。 b. 化学数据库 PubChem:提供化学分子和化合物的信息,包括结构、性质和生物活性数据。 ChEMBL:生物活性药物和生物分子数据库,适用于药物发现和设计。 实验设计和分析 a. 实验数据分析 GraphPad Prism:用于生物统计学分析和图形制作,适用于生物化学实验数据分析。 Bioinformatics.org:提供各种生物信息学工具和资源,帮助分析生物化学实验数据。 b. 实验设计 DOE 工具:如JMP,帮助优化实验设计,提高实验效率和数据质量。 实施步骤 1. 确定需求:根据你的研究或学习需求,确定需要使用的AI工具和资源。 2. 选择工具:从上述列表中选择适合的工具,并了解其功能和使用方法。 3. 数据准备:收集和整理实验数据、文献和学习材料,准备输入到AI工具中进行分析和处理。 4. 使用和学习:使用AI工具进行数据分析、模拟实验、文献管理和学习,根据需要调整和优化使用策略。 5. 持续改进:根据分析结果和学习进展,不断调整和优化工具的使用,提高研究和学习效率。 通过这些步骤,你可以有效地利用AI工具进行生物化学研究和学习,提高效率和准确性。如果你有具体的研究课题或学习目标,可以告诉我,我可以提供更详细的建议和指导。
2024-07-11
大模型在电子信息、生物医药、金融、教育以及通用领域分别有哪些应用
大语言模型(Large Language Models,LLMs),如GPT系列、Llama等,因其强大的语言理解和生成能力,在多个行业中有着广泛的应用。以下是大语言模型在不同领域的应用实例: 电子信息领域 自动化编程:辅助代码生成和调试,提高开发效率。 技术文档编写:自动生成或辅助编写技术文档和用户手册。 智能客服:提供24/7的技术支持和客户咨询服务。 生物医药领域 文献分析:快速总结和解释科研论文,加速药物发现过程。 临床试验设计:辅助设计临床试验方案,提高试验设计的效率和准确性。 患者沟通:帮助医生和患者之间更有效地沟通,提供个性化的健康建议。 金融领域 市场分析报告:自动生成市场分析报告和投资摘要。 风险评估:分析金融文档,辅助风险管理和合规性检查。 智能投顾:提供个性化的投资建议和资产管理服务。 教育领域 个性化学习:根据学生的学习进度和兴趣推荐定制化的学习内容。 作业辅助:帮助学生完成作业,提供语言学习和写作辅助。 课程开发:辅助教师设计课程内容和教学计划。 通用领域 自然语言理解:用于各种语言处理任务,如文本分类、情感分析等。 内容生成:自动生成新闻文章、营销文案、社交媒体帖子等。 语音识别与合成:提高语音识别系统的准确性,生成自然听起来的语音。 其他跨领域应用 搜索引擎优化(SEO):帮助优化网站内容,提高搜索引擎排名。 多语言翻译:提供高质量的机器翻译服务。 聊天机器人:在客户服务、在线购物等领域提供自动化的交互体验。 大语言模型通过其强大的文本处理能力,正在不断推动各行各业的智能化转型。然而,这些模型也存在一些挑战,如可能产生偏见、误导性信息(俗称“幻觉”)以及对大量计算资源的需求。因此,在使用这些模型时,需要谨慎考虑其局限性,并结合人类的判断和干预。
2024-04-24