直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

推荐让图片中的人物动起来的软件

回答

以下为能让图片中的人物动起来的软件及相关方法:

  1. 方法一:利用 MJ 画图先画出想要的底图,然后使用 InsightFaceSwap 插件处理脸部,因该插件对多人脸部同时处理效果不佳,需先对图片进行分割裁剪,分别处理后再缝合,最后利用可灵或其他软件让图片动起来。
  2. 方法二:在网上寻找能直接融合两张照片的软件或项目,直接对图片进行融合,若没有则进行纯 P 图处理,然后利用图生视频的项目完成。

此外,还有一些关于图片处理的相关知识:

  • 在 Stable Diffusion 中,通过添加关键词、调整重绘幅度等操作可以实现局部重绘和背景修改。例如,利用 PS 制作精确蒙版,在重绘时选择重绘非蒙版区域,调整提示词等。
  • 利用醒图或美图秀秀等 App 可以调整脸部,如在醒图中关注人像->面部重塑->面部->比例,调整上庭、中庭、下庭。
  • 对于 MJ 画图,若直出的皮肤缺乏质感,可使用醒图的人像->手动美颜->皮肤肌理功能。若想快速调整光源,可试试 Luminar。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AI 带你穿越时空,去拥抱儿时的自己

其实关于现在的图转视频,很容易做到让图片中的人物动起来,甚至做一些互动性的动作。不只是可灵很多图转视频的软件都可以做到。所以关键点其实是怎么让AI把两张照片更好的结合起来。那我们现在来思考下怎么样实现这个需求,其实一下子就想到了大概两种做法。下面我们分别尝试一下,看看效果。[heading3]一)方法一[content]利用MJ画图,先画出来一张想要的底图。然后使用InsightFaceSwap这个插件来换脸或者说让脸部更像。但是因为这个插件对多人脸部同时处理的效果并不好,所以我们先需要进行图片的分割裁剪,分别利用插件处理后,再把图片重新缝合。最后利用可灵或者其他软件来让图片动起来。流程如下[heading3]二)方法二[content]这个方法必要依赖于现有的项目,就是直接在网上寻找有没有直接能够融合两张照片的软件或者项目。直接对图片进行融合。如果没有那就是纯P图了...然后利用图生视频的项目完成内容。因为这个没什么操作感~我们先放在后面,大家想要简单点的处理办法可以直接翻到后面。

【SD】玩转局部重绘,哪里不行点哪里

[title]【SD】玩转局部重绘,哪里不行点哪里添加关键词(Yellow flowers:1.2),点击生成,图片就像神笔马良一样生出了一朵花。如果我们想让这张照片变成横的,就需要扩展它的背景,可以在图生图中选择“缩放后填充空白”,重绘幅度0.5,并将宽度从512增加到1200。生成后不仅对背景做了补充,甚至还将人物进行了补全,但是背景拉伸的重复度太高,这时可以适当增加重绘幅度。当重绘幅度为0.58的时候,背景已经比较正常了。但是随着重绘幅度的增大,可以看见人物的细节也产生了一定的改变。有什么办法可以既不改变人物,又能修改背景呢?这里就需要用到一点PS的帮助了,我们保存这张图进入PS,对主体人物抠像。点击选择-主体,可以得到这个人物的选区。对选区填充白色,对背景填充黑色,就可以得到这个人物形象的精确蒙版。我们进入“上传重绘蒙版”的界面,上面放置需要重绘的图像,下面放置PS中制作好的蒙版。在Stable Diffusion中,蒙版的白色区域是默认重绘的区域,如果只想改变背景的话,可以切换到“重绘非蒙版区域”。将提示词调整为铺满了鲜花的场景:detailed background filled with(many:1.1)(colorful:1.1)(flowers):1.1,(quality:1.1),(photorealistic:1.1),(resolution:1.1),(sharpness:1.1),(cinematic lighting),depth of field,Canan EOS R6,135mm,1/1250s,f/2.8,ISO 400。重绘幅度拉高到0.9,点击生成。可以看到,人物原封不动,而场景产生了大变化,成为了一片花海。

莱森:利用一致性MJ 出海马体写真的教程来啦

[title]莱森:利用一致性MJ出海马体写真的教程来啦[heading2]视频教程:如果你不控制变量一个个调整,就会觉得「怎么眼睛嘴巴合在一起就不像我了?」此时,用醒图(英文版叫做hypic)或者美图秀秀等App调整脸部,拖拖修图进度条就好了~完成度就从50%->80%甚至更高!如果你用的是醒图,我建议关注一下【人像->面部重塑->面部->比例】,调整一下上庭、中庭、下庭。其他备注1:在转绘这部分有一个重点案例是照片-> Minecraft这种风格幅度变化很大的。有小伙伴的问题是发现即便--sw风格权重拉满了还是复制不了像素小人风格。经过实验发现:原因是--cw太高。猜想原理:cref提取的人物本身包含了一定程度的风格特性。MJ把这部分特质也当成了「作为你character的一部分」。调低cw发现成功复制,猜想正确。(见视频)其他备注2:cref和sref还可以同时参考多张url,那是不是说我只要上传同一个人不同角度的照片,就更容易直出呢?实验发现不是..用语言描述的感觉是:MJ它会把多张照片理解为多张人脸,直接把形状揉在一起。结果非常容易畸形。补充笔记3:如果你觉得MJ直出的皮肤缺乏质感(过于光滑),那么还是打开醒图【人像->手动美颜->皮肤肌理】就可以了。如果你想快速调整光源但又不想学PS,那就试试Luminar吧。可以直接官方下载和购买完整版,或者如果你是macos订阅了setapp也能使用有基础功能的Luminar版本。视频如下

其他人在问
AI和软件测试行业的实践想法
目前知识库中暂时没有关于 AI 和软件测试行业实践想法的相关内容。但一般来说,在软件测试行业中应用 AI 可以考虑以下几个方面: 1. 利用机器学习算法进行测试用例的自动生成和优化,提高测试覆盖度和效率。 2. 运用自然语言处理技术对测试需求和文档进行分析,提取关键信息,辅助测试计划的制定。 3. 通过 AI 模型对软件的历史缺陷数据进行学习,预测可能出现的新缺陷类型和位置。 4. 借助图像识别和语音识别等技术,实现对软件界面和交互的自动化测试。 您可以根据实际情况和具体需求,进一步探索和创新 AI 在软件测试行业中的应用。
2024-10-18
国内适合短视频脚本写作的ai软件
以下是一些适合国内短视频脚本写作的 AI 软件: 1. ChatGPT + 剪映:ChatGPT 可生成视频小说脚本,剪映能根据脚本自动分析出视频所需的场景、角色、镜头等要素,并生成对应素材和文本框架,能快速实现从文字到画面的转化,节省时间和精力。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户提供文本描述,Pictory 帮助生成相应视频内容。 4. VEED.IO:提供 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. Runway:AI 视频创作工具,能将文本转化为风格化的视频内容,适用于多种应用场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可根据文本脚本生成视频。 这些工具各有特点,适用于不同的应用场景和需求,能够帮助内容创作者、教育工作者、企业和个人快速生成吸引人的视频内容。 此外,在制作 AI 短片时,声音部分可以使用 11labs 进行英文对白制作,国内可以使用出门问问的魔音工坊。对于剪辑,13 分钟的短片用剪映较方便,更长篇幅或追求更好效果可能需要使用 PR/FCP/达芬奇等传统剪辑软件。
2024-10-18
国内有专门做短视频脚本的ai软件
以下是一些国内专门做短视频脚本的 AI 软件: 1. ChatGPT + 剪映:ChatGPT 可生成视频小说脚本,剪映能根据脚本自动分析出视频所需的场景、角色、镜头等要素,并生成对应素材和文本框架,可快速实现从文字到画面的转化,节省时间和精力。 2. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可根据文本脚本生成视频。 3. 出门问问的魔音工坊:在国内可用,具有情绪调节控件。 此外,制作 AI 短片还涉及到声音制作、故事创作、剪辑等方面: 1. 声音制作:可使用 11labs 进行英文对白制作,通过标点符号改变语音效果;国内可尝试魔音工坊。 2. 故事创作:故事来源包括原创(如自身经历、梦境、想象等)和改编(如经典 IP、名著、新闻、二创等)。剧本写作可从自身或朋友经历改编入手,或对短篇故事进行改编,多与他人讨论以修改和进步。 3. 剪辑:对于 13 分钟的短片,剪映较为方便;更长篇幅可能需要使用 PR/FCP/达芬奇等传统剪辑软件。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-18
国内有专门做新媒体平台运营的ai软件
目前国内专门用于新媒体平台运营的 AI 软件相对较少,但有一些具备相关功能的工具。例如,一些智能写作助手可以帮助生成文案内容,部分数据分析工具能够通过 AI 算法提供运营策略建议。不过,这些工具可能并非完全专注于新媒体平台运营的所有方面。
2024-10-18
国内有适合做新媒体平台创意思路的ai软件,例如抖音、小红书等,
目前对于适合国内新媒体平台(如抖音、小红书等)创意思路的 AI 软件,还没有明确的定论。但我们可以先从内容创作的角度来思考。之前汉青老师分享时提到,生成式 AI 的内容与传统社交媒体内容共存,如小红书、抖音、微信等。短期内,大家可能因新鲜感获得流量红利,但最终人们在意的仍是高质量的内容。 我们虽掌握了各种先进工具,如在 MJ 里用关键词出图、用 SD 做复杂工作流、制作炫酷宣传片等,但在此我们先不讨论工具,而是专注于内容。让节奏慢下来,认真感受真实世界,关注身边通常被一扫而过的普通人。 比如偶然在朋友朋友圈刷到的题材:“这两张照片其实是在同一条街道上拍下的,只不过年轻的女孩在街上,孤独的老人在围墙里。”“这张照片传递两种关系、一种爱意,年轻人手牵着怀孕的爱人,老母亲扶着女儿坐上电动车,这应该是这个世界最稳固的两种关系,而现在他们相遇在一张照片当中。”“很多人把生活当中的便利,比如电商快递外卖速度快便宜看着是我们的移动互联网优势,其实唯一的优势是我们的劳动力,无数个在深夜独自啃着馒头的年轻人支撑着美团阿里的市值...放大镜头看你会发现这其实是一个非常年轻的女孩子,她瘦小,即使戴了头盔也比后面的箱子高不了多少,她进食的时候甚至都没玩手机——我骑车路上看到过很多快递小哥都是边骑车边刷短视频,这至少说明他们对生活中的乐子还充满期待,而图中的女孩看着让人垂头丧气,不仅是她,也包括我。” 关于如何与 AI 结合来为新媒体平台创作优质内容,目前还没想好,也没完全想明白,需要慢慢思考和探索。
2024-10-18
AI混音软件
以下是为您整理的关于 AI 混音软件的相关信息: 在游戏 PV《追光者》的制作中,团队尝试使用了分离人声的 AI 软件,对游戏宣传音乐进行人声去除和剪辑处理。但在实际应用中发现,大部分 AI 音乐难以满足紧张刺激场景画面所需的特定要求。 以下为您列举一些人工智能音频初创公司及其相关产品: :由 AI 驱动的软件引擎,可生成音乐,能对手势、动作、代码或其他声音作出反应。 :全球最大的音乐教育平台。 :用于创作歌曲和音频录制的应用程序。 :提供无缝录音室体验的一体化在线协作平台。 :专业音频、语音、声音和音乐的扩展服务。 :视频编辑的音频解决方案。 :由 AI 驱动的音乐工作室。 :通过直观的软件/硬件生态系统为音乐演奏者提供世界级声音的民主化访问。 :AI 音频插件和社区,弥合 AI 研究与创意之间的差距。 :为音乐人、制作人和内容创作者提供 AI 驱动的混音服务。 :为创作者提供的在线音乐软件,包括音乐母带处理、数字音乐发行、分期付款插件、免费样本包和协作工具。 (被 Meta 收购):为创作者提供的音频和视频编辑软件。 :音乐人的应用程序。 (前身为 Tonz):实时神经信号处理。 :奥地利制造的音频软硬件。 此外,VoiceSwap 推出了 StemSwap 工具,这是一个基于浏览器的工具,允许用户从完全混音的曲目中轻松快速地更改人声。它可以将歌曲分成四部分,隔离人声,并将其转换为其他歌手的声音。用户可以从授权歌手名单中选择新声音,并下载完整混音或各个音轨。
2024-10-17
生成分享图片工具
以下为一些生成分享图片的工具及相关方法: 1. Midjourney V6:可用于生成场景模型。 放大工具:Comfy Ui、Magnific Ai、Upscayl 深度图:Leia Pix 法线图:Shadermap 2. 辅助工具生成透明背景图像: 安装好插件后,在生成图片时勾选“layerdiffusion enabled”。 在“layerdiffusion method”中选择生成透明图像的模式,如“Only Generate Transparent Image”。 提示中输入透明物体的描述,如“玻璃杯”,点击生成可得到透明背景的玻璃杯图像。 也可上传背景图像,在“layerdiffusion method”中选择“From Background to Blending”,然后生成透明图像。 反之,也可以先生成透明的前景,然后选择“From Foreground to Blending”模式,生成背景。 特定模型: layer_xl_transparent_attn:用于将 Stable Diffusion XL 模型转化为透明图像生成器的模型。 layer_xl_transparent_conv:与 layer_xl_transparent_attn 类似,通过修改 conv 层的 offset 实现。 layer_xl_fg2ble:用于将 XL 模型转化为前景图像到混合图像的生成模型。 layer_xl_fgble2bg:用于基于前景和混合图像生成背景的模型。 layer_xl_bg2ble:将 XL 模型转化为根据背景图像生成混合图像的模型。 layer_xl_bgble2fg:将 XL 模型转化为根据背景和混合图像生成前景的模型。 vae_transparent_encoder:图像编码器,用于从像素空间中提取潜在偏移,帮助透明图像的生成。 vae_transparent_decoder:图像解码器,输出真实的 PNG 图像。 3. Aimwise WaytoAGI 百家号文旅分享中的方法: 开启 controlnet 边缘类模型,导入需要处理的 logo,调整合适的 cn 参数。 开启 controlnet IP adapter 功能性模型,导入风格参考图,调整合适的 cn 参数,可快速进行风格迁移和融合,提升出图效率。
2024-10-18
ai现在拍摄一本书的图片能够识别到这是什么书么
目前的 AI 技术在拍摄一本书的图片并识别其是什么书方面已经取得了一定的进展。 在图像识别领域,神经网络发挥着重要作用。例如,对于识别印刷体图片,通常会先将图片转换为黑白,调整至固定尺寸,然后与数据库中的内容进行对比以得出结论。但实际情况较为复杂,存在多种字体、不同拍摄角度等多种例外情况,单纯依靠添加规则的方法不可行,而神经网络专门处理这类未知规则的情况。 不过,要准确识别一本书,还面临一些挑战,如书籍的版本、封面设计的多样性等。但随着技术的不断发展和数据的积累,未来 AI 识别一本书的准确性有望不断提高。 同时,也有一些相关的实验和研究,比如通过设计工作流让 AI 自举式地进行创造,从作家的作品中提取名场面并转译成绘画指令等。
2024-10-17
怎么用AI绘制一个我指定的动漫人物原型的各类图片,例如日漫《好想告诉你》中的黒沼爽子
要使用 AI 绘制指定的动漫人物原型,如日漫《好想告诉你》中的黑沼爽子,您可以按照以下步骤进行: 1. 选择合适的 AI 绘画工具:目前有许多在线的 AI 绘画平台和软件可供选择,例如 DALL·E2、StableDiffusion 等。 2. 明确描述特征:在输入描述时,尽可能详细地描述黑沼爽子的外貌特征,包括发型(如黑色的长直发)、眼睛(如大而明亮的眼睛)、服装(如校服的款式和颜色)、表情(如羞涩的微笑)等。 3. 参考相关图片:如果可能,找到黑沼爽子的官方图片或其他粉丝绘制的作品,作为参考提供给 AI 绘画工具,以帮助其更好地理解您的需求。 4. 不断调整和优化:根据生成的初步结果,对描述进行调整和优化,例如修改某些特征的描述、增加更多细节等,以获得更符合您期望的图片。 需要注意的是,AI 绘画的结果可能会受到多种因素的影响,不一定能完全符合您的预期,但通过不断尝试和优化,您有机会获得较为满意的作品。
2024-10-17
有可以查询图片的快速方法吗?
以下为一些快速查询图片的方法: 1. 利用 Perplexity.AI 的 Search Images 功能:点击搜索结果旁的加号,可快速浏览并选择与主题紧密相连的图片资源。在挑选图片时,要避免使用带有水印、画质不清晰或分辨率较低的图片。图片出处主要在 twitter 和官方网站。 2. 对于 Midjourney 生成的图片: 作业 ID 是其唯一标识符,格式类似于 9333dcd0681e4840a29c801e502ae424,可以在图像文件名的第一部分、网站上的 URL 和图像文件名中找到。 在网页上,可通过选择...> Copy...>作业 ID 来在作品库中查找任何图像的作业 ID。 从 URL 中,可在打开作品的网页链接末尾找到 Job ID。 从文件名中,Job ID 在文件名的最后一部分。 使用表情符号✉️可以将已完成的作业发送到私信中,私信中将包括图像的 seed 号和作业 ID,但✉️表情符号只适用于您自己的作业。 3. 如果不喜欢用模板找封面图,可根据文章内容搜索匹配的封面。比如在公众号中搜索同行的封面,直接“拿来主义”。若文章正文里没有封面图,可用壹伴浏览器插件的“查看封面”按钮(需会员),或者使用秘塔 AI 搜索工具,输入文章链接获取封面。相关在线工具链接:https://www.mgpaiban.com/tool/wxfm.html ,为方便使用可将其收藏。
2024-10-16
有相关图片识别的相关知识和工具么?
以下是关于图片识别的相关知识和工具: 知识: 图片识别中,对于印刷体图片的识别,可能先将图片变为黑白、调整为固定尺寸,再与数据库对比得出结论。但实际情况复杂,存在多种字体、拍摄角度等例外情况,传统基于规则的方法不可行。 神经网络专门处理未知规则的情况,其发展得益于生物学研究支持和数学方向的指引,能处理如手写体识别等未知情况。 图像融合是将两个或多个图像合成为一个新的图像,以获得更全面和丰富的信息,可通过像素级、特征级和决策级融合等技术实现,在多个领域有应用。 目标检测是在图像或视频中准确识别和定位特定对象,多模态信息融合可提高其性能和鲁棒性。 工具和参考文献: 推荐阅读《这就是 ChatGPT》这本书,有助于深入了解相关内容。 以下是一些相关的参考文献: VisionLanguage Models for Vision Tasks:A Survey Visual Instruction Tuning towards GeneralPurpose Multimodal Model:A Survey ViTs are Everywhere:A Comprehensive StudyShowcasing Vision Transformers in Different Domain Multimodal Foundation Models:From Specialists to GeneralPurpose Assistants VisionLanguage Pretraining:Basics,Recent Advances,and Future Trends An Image is Worth 16x16 Words:Transformers for Image Recognition at Scale COGVLM:VISUAL EXPERT FOR LARGE LANGUAGE MODELS CogAgent:A Visual Language Model for GUI Agents AppAgent:Multimodal Agents as Smartphone Users Gemini:A Family of Highly Capable Multimodal Models QwenVL:A Versatile VisionLanguage Model for Understanding,Localization,Text Reading,and Beyond arxiv:ChatVideo:A Trackletcentric Multimodal and Versatile Video Understanding System arxiv:Video Understanding with Large Language Models:A Survey arxiv:Vid2Seq:LargeScale Pretraining of a Visual Language Model for Dense Video Captioning CSDN 博客:视频理解多模态大模型(大模型基础、微调、视频理解基础) CSDN 博客:逐字稿| 9 视频理解论文串讲(下)【论文精读】_视频理解论文串讲(下) Youtube:Twostream Convolutional Networks for Action Recognition in Videos arxiv:Is SpaceTime Attention All You Need for Video Understanding? 相关算法: 图像融合的相关算法有:小波变换、基于金字塔变换的多分辨率融合、基于区域的图像融合、基于特征的图像融合等。 目标检测的相关算法有:基于深度学习的目标检测算法(如 RCNN、Fast RCNN、Faster RCNN、YOLO、SSD 等)、基于传统计算机视觉技术的目标检测算法(如 HOG、SIFT、SURF 等)。
2024-10-16
现在最新的 AI 生成图片产品有哪些
目前最新的 AI 生成图片产品主要有以下这些: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格供选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,能将上传的照片转换为芭比风格,效果出色。 此外,还有一些用于设计海报的 AI 产品: 1. Canva(可画):https://www.canva.cn/ ,是受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可协助选择颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ ,智能设计工具采用先进人工智能技术,自动分析和生成设计方案。 3. VistaCreate:https://create.vista.com/ ,简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面,可快速创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 以下是图像生成的 Top30 AI 产品数据: |排名|产品名|分类|6 月访问量(万 Visit)|相对 5 月变化| |||||| |1|Adobe firefly|图像生成|28890|0.053| |2|Freepik|图像生成|8341|0.076| |3|Shutterstock|图像生成|6389|0.068| |4|Civitai|图像生成|2592|0.046| |5|Leonardo.Ai|图像生成|1680|0.027| |6|Midjourney|图像生成|1673|0.109| |7|Yodayo|图像生成|1554|0.044| |8|Ideogram|图像生成|1140|0.081| |9|Picsart Al|图像生成|1103|0| |10|Sea Art AI|图像生成|912|0.018| |11|PixAI|图像生成|899|0.07| |12|Openart|图像生成|650|0.074| |13|NovelAI|图像生成|639|0.052| |14|Playground|图像生成|631|0.065| |15|Krea|图像生成|611|0.119| |16|nightcafe|图像生成|606|0.039| |17|Media.io|图像生成|551|0.086|
2024-10-16
生成人物图像哪个AI最好
以下为一些生成人物图像较好的 AI 工具及相关信息: PhotoMaker:可以根据文字描述生成人物照片,能混合不同人物特征创造新形象,还能改变照片中人物的性别、年龄。网址:https://photomaker.github.io 。 在人物构图的视角选择方面,有以下几种常见视角: 正视角:拍摄对象正对着相机的姿态,使人像呈现出正面的视角。咒语关键词:Front view 。生成思路:正视角的年轻女孩。生成咒语:young girl,front view,ar 16:9 。 后视角:从被摄对象的背后拍摄的视角,以被摄对象的背部为主要构图元素。咒语关键词:Back view angle & Back angle 。生成思路:后视角的年轻女孩。生成咒语:young girl,back view angle,ar 16:9 。 侧视角:观察或拍摄物体或场景时从侧面的角度观察,可用于展示物体的形状和轮廓,或创造深度和距离的感觉。咒语关键词:Side view & Shoulder level view 。生成思路:侧视角的年轻女孩。生成咒语:young girl,Side view,ar 16:9 。 仰视角:观察或拍摄物体或场景时从底部的角度观察,通常会让物体看起来更为庞大和高大,具有一定的视觉冲击力和震撼效果。咒语关键词:Bottom view & Low angle view 。生成思路:仰视角的年轻女孩。生成咒语:young girl,low angle view,ar 16:9 。 俯视角。 此外,还有 Sam Altman 与 Bill Gates 关于 GPT 的未来讨论,以及 Portkey AI 网关这一连接多种 AI 模型的工具。
2024-10-12
如何在midjourney中只进行照片背景修改,而不修改人物姿态和表情
在 Midjourney 中只修改照片背景而不修改人物姿态和表情,您可以参考以下方法: 1. 得益于cref,midjourney 能够迅速达成角色一致性的目的而无需 Lora。其中,cref 代表 character reference(角色参考);cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。如果您只想关注人脸,请调低到 0。您不需要对角色原图使用/describe 来贴近目标生成角色的形象,因为cref 会帮您完成这件事情。 2. 风格复制和服装的替换,则应当用提示词(prompt)和sref,默认值 100,越高越接近参考图像的风格。 3. 如果遇到“形似而神不似”的问题,即 MJ 直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有一些细微的差距,您可以按照以下步骤操作: 使用/settings 确保您处于模式并且 Remix 设置为打开。 选择带有您想要更改的面部的图像。使用将其从网格中分离出来,然后选择。 由于您已经开启了 Remix,您将能够编辑提示。 从提示中删除cref 和cw。一旦删除了它们,修改提示以对面部进行更改。例如,您可以慷慨地选择面部的下半部分,并添加“清洁剃须”来除去胡须。您可以尝试使用小的负权重,例如 tattoos::0.5 来移除纹身。 注意:当您对更改满意时,请确保不要再次添加cref 到提示中!一旦添加回来,“面部交换”将再次发生,那些不需要的属性将重新出现。 4. 有时,Midjourney 在正确将角色放置在背景中时会遇到一些困难。如果结果不连贯(例如,您看到头部朝后或图像被奇怪地裁剪),请尝试将 stylize增加到 800 1000。您也可以尝试将cw 同时降低到低于 100 的值,视情况而定。
2024-10-10
生图后,人物的模样及服装等统一,用哪一款
在保持人物模样及服装等统一方面,如果使用 Midjourney ,有以下相关信息: 1. Midjourney 有新功能 Cref ,可以先跑一张主角的定妆照,在需要出现主角人物的地方,扔进去 Cref 以保持发型、人脸、衣服。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性,比对欧美的人脸的一致性效果差,年轻人的效果相对较好,亚洲老人的效果惨不忍睹。而且 Cref 的效果在画面的审美和构图上有一定的破坏性,所以原则上能不用 Cref 就不用,比如只有背影的时候,写个短发男人黑卫衣就可以。 2. 对于人物一致性,还有两个取巧的方式,一个是生成动物,动物会比较容易保持一致性,另一个方式是特定的名人或有特殊属性的人物。 3. 在使用 Cref 时,您可以在提示词后添加 cref URL 并附上人物图像的 URL ,还可以使用 cw 来修改参考强度,强度 100(cw 100)为默认值,会使用人物的脸、头发和衣服,强度 0(cw 0)时则只关注脸(适合改变服装或发型等)。Cref 不仅适用于 Niji 和普通的 Midjourney 模型,还可以与 sref 结合使用。在网页版 alpha 中,您可以通过拖拽或粘贴图像到想象栏,选择相应图标来设置图像为图像提示、风格参考或人物参考,Shift + 选择一个选项可以将一张图像用于多个类别。
2024-10-10
使用人物Lora生成的图片中有多个人物时,怎么让人物的形象各不相同?
在 Stable Diffusion 中,若使用人物 Lora 生成的图片中有多个人物并想让人物形象各不相同,可参考以下方法: 1. 在提示词中输入数量词(如 2girls 或 3boys 等),再加上各自的描述提示词。若刷图成功率不高,可配合 openpose 控制,做一个多人骨架,以生成多人物构图。 2. 需使用不同的 Lora 来区分人物,但单纯靠提示词可能行不通。 3. 分区控制思路: Multidiffusion 的做法:启用 Tiled Diifusion,打开分区提示词控制,创建文生图画布。启用不同区域,分别填写背景、不同人物的描述词和 Lora。增加 controlnet 的 openpose 控制来稳定人物,但可能存在分区生成的人物连续性低、lora 控制不强等问题。 Latent Couple 的做法(文中未提及,需进一步探索)。 此外,关于 Lora 模型: 1. Lora 可以固定照片的特征,如人物特征、动作特征和照片风格。 2. 点击“生成”下面的第三个按钮,找到 Lora 选项,可添加下载保存到电脑的 Lora 模型,Lora 可叠加使用,但新手不建议使用太多,且 Lora 之间用英文逗号隔开,每个 Lora 后面的数字用于调整权重,一般只会降低权重。选择 Lora 应根据最初想要生成的照片类型决定。
2024-09-27
如何用midijurney生生人物一致性
在 Midjourney 中实现人物一致性,主要通过以下方式: 1. Midjourney V6 更新了角色一致性命令“cref ”。您可以根据需要重复此过程,但要注意不要过多操作,以免丧失保真度。添加角色参考图像,并选择一个“cw”以达到效果。Midjourney 能够从参考图像中识别的角色属性将与提示混合,从而创建出角色的最终表现。您可以通过使用“cw N”参数(cref 权重)来大致控制转移,其中 N 的值可以从 1 到 100,默认值为 100。“cw”参数不会改变角色参考图像的强度/影响力,其作用如下: “cw 100”的值(默认值)将捕捉整个角色。 “cw 99 到cw 1”之间的值将开始捕捉较少的整个角色,仅集中于转移面部。 “cw 0”的值将仅捕捉面部,大致类似于面部替换。且无法关闭面部的转移。 2. 在群像人物一致性保持及空间深度控制方面,以双人画面人物一致性的保持为例,分为 5 步: Step 1:将初始图(A)以及人物图(B)作为风格(sref)及人物(cref)的参考内容,提示词中需要注意: 描述好空间关系(下方画线部分),视角问题可以略过(风格参考会自带角度)。 成功输出图(C),可能会遇到女同事 Lisa 无法保持跟初始图(A)一致的问题。其中:sref 为风格参考,cref 为人物参考,cw 范围为 0 100,默认 100 但建议写上去确保万无一失。 Step 2:找到已生成的 Lisa 纯人物的图,提取图片链接(url)做准备工作。 Step 3:基于 Step 1 生成的构图清晰但人物失控的成图(C)基础上,进行重绘 Vary Region,步骤为: 框选需要被替换的人物。 然后将 Step 2 准备好的链接,贴入框内界面 cref 后面,注意先把原始的 cref(即红色部分)删掉。
2024-09-23
推荐一下国内可以通过对话微调的预训练模型
以下是为您推荐的国内可以通过对话微调的预训练模型相关信息: 为优化 Llama2 的中文能力,可使用以下数据: 网络数据:互联网上公开的网络数据,包括百科、书籍、博客、新闻、公告、小说等高质量长文本数据。 :中文 Wikipedia 的数据。 :中文悟道开源的 200G 数据。 :Clue 开放的中文预训练数据,经过清洗后的高质量中文长文本数据。 竞赛数据集:近年来中文自然语言处理多任务竞赛数据集,约 150 个。 :MNBVC 中清洗出来的部分数据集。 社区提供预训练版本 Atom7B 和基于 Atom7B 进行对话微调的模型参数供开放下载,关于模型的进展详见社区官网 https://llama.family。 另外,关于会话补全(Chat completions): gpt3.5turbo 和 textdavinci003 两个模型能力相似,但前者价格只是后者的十分之一,在大部分情况下更推荐使用 gpt3.5turbo。 gpt3.5turbo 模型不支持微调。从 2023 年 3 月 1 日起,只能对基于 GPT3.5 的模型进行微调。有关如何使用微调模型的更多细节,请参阅微调指南。 从 2023 年 3 月 1 日起,OpenAI 会将您通过 API 发送的数据保留 30 天但不会使用这些数据来提升模型。 关于安仔:Coze 全方位入门剖析 免费打造自己的 AI Agent(国内版): 目前国内版暂时只支持使用“云雀大模型”作为对话引擎,其携带上下文轮数默认为 3 轮,可修改区间是 0 到 30,具体轮数可根据业务需求决定。 在 Bot 编排页面的“技能”区域,可为 Bot 配置所需技能。不懂插件时,可选择区域右上角的“优化”按钮让 AI Bot 根据提示词自动选择插件。也可自定义添加所需插件,点击插件区域的“+”号选择加入具体插件。 在 Bot 编排页面的“预览与调试”区域,可测试 Bot 是否按预期工作,可清除对话记录以开始新的测试,确保 Bot 能理解用户输入并给出正确回应。
2024-10-18
推荐一下个人可以使用的通过对话微调的模型
以下是一些个人可以使用的通过对话微调的模型相关信息: 会话补全(Chat completions): GPT3.5 系列中,gpt3.5turbo 和 textdavinci003 有相似能力,但 gpt3.5turbo 价格仅为 textdavinci003 的十分之一,在多数情况下更推荐使用 gpt3.5turbo。不过,gpt3.5turbo 不支持微调,从 2023 年 3 月 1 日起,只能对基于 GPT3.5 的模型进行微调。 微调(Finetuning): 案例研究: 客户支持聊天机器人:通常包含相关上下文、对话摘要及最近消息,可能需要几千个示例处理不同请求和客户问题,建议审查对话样本确保代理消息质量,可使用单独文本转换微调模型生成摘要。 基于技术属性列表的产品描述:将输入数据转换为自然语言很重要,确保完成基于所提供描述,若常查阅外部内容,自动添加此类内容可提高性能,若描述基于图像,提取图像文本描述可能有帮助。 模型(Models): GPT3.5 模型可理解和生成自然语言或代码,其中功能最强大、最具成本效益且针对聊天优化的型号是 gpt3.5turbo,建议使用它而非其他 GPT3.5 模型,因其成本更低。 gpt3.5turbo:功能强大,针对聊天优化,成本低,会使用最新模型迭代更新,最大 Token 数 4096,训练数据截至 2021 年 9 月。 gpt3.5turbo0301:2023 年 3 月 1 日的快照,不会更新,仅在 2023 年 6 月 1 日结束的三个月内提供支持,最大 Token 数 4096,训练数据截至 2021 年 9 月。 textdavinci003:能完成任何语言任务,支持文本中插入补全,最大 Token 数 4097,训练数据截至 2021 年 6 月。 textdavinci002:与 textdavinci003 类似,使用监督微调而非强化学习训练,最大 Token 数 4097,训练数据截至 2021 年 6 月。 codedavinci002:针对代码完成任务优化,最大 Token 数 8001,训练数据截至 2021 年 6 月。 请注意,OpenAI 模型具有不确定性,相同输入可能产生不同输出,将温度设置为 0 可使输出大部分具有确定性,但可能仍有少量可变性。
2024-10-18
ai建站推荐
以下为您推荐一些 AI 建站工具: 1. 即时设计:https://js.design/ 这是一款可在线使用的「专业 UI 设计工具」,为设计师提供更加本土化的功能和服务,相较于其他传统设计工具,更注重云端文件管理、团队协作,并将设计工具与更多平台整合,一站搞定全流程工作。 2. V0.dev:https://v0.dev/ Vercel Labs 推出的 AI 生成式用户界面系统。每个人都能通过文本或图像生成代码化的用户界面。它基于 Shadcn UI 和 Tailwind CSS 生成复制粘贴友好的 React 代码。 3. Wix:https://wix.com/ Wix 是一款用户友好的 AI 工具,可让您在没有任何编码知识的情况下轻松创建和自定义自己的网站,提供广泛的模板和设计供您选择,以及移动优化和集成电子商务功能等功能。Wix 建站工具通过拖放编辑、优秀模板和 250 多种 app,能帮助不同领域的用户创建所有种类的网站。 4. Dora:https://www.dora.run/ 使用 Dora AI,可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。支持文字转网站,生成式 3D 互动,高级 AI 动画。 在选择 AI 网站制作工具时,您可以考虑以下因素: 1. 目标和需求:确定您的网站目标(例如个人博客、商业网站、在线商店)和功能需求。 2. 预算:有些工具提供免费计划或试用版,但高级功能可能需要付费订阅。 3. 易用性:选择一个符合您技术水平的工具,确保您能够轻松使用和管理网站。 4. 自定义选项:检查工具是否提供足够的自定义选项,以满足您的设计和功能需求。 5. 支持和资源:查看是否有足够的客户支持和学习资源(如教程、社区论坛),帮助您解决问题。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-18
推荐5个自动写文档工具
以下为您推荐 5 个自动写文档工具: 1. Grammarly:不仅是语法和拼写检查工具,还提供排版功能,可改进文档整体风格和流畅性。 2. QuillBot:AI 驱动的写作和排版工具,能改进文本清晰度和流畅性,保持原意。 3. PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 4. Wordtune:AI 写作助手,可重新表述和改进文本,使其更清晰专业,保持原始意图。 5. Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的工具取决于您的具体需求,如文档类型、出版标准和个人偏好。对于学术论文,Latex 和 Overleaf 是受欢迎的选择;对于一般文章和商业文档,Grammarly 和 PandaDoc 等可能更适用。
2024-10-18
帮我推荐一些国内能使用的以图生图的AI吧
目前国内能使用的以图生图的 AI 主要有以下几种: 1. Artguru AI Art Generator:这是一个在线平台,能够生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:一种 AI 工具,可以将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 此外,国外的 Leonardo 也是一款不错的文生图 AI 应用。它支持用户上传自己 DIY 的模型,尤其是 Lora 模型,为用户提供了丰富的模型选择,能够生成非常高质量的图片。但需要注意的是,Leonardo 存在访问限制的问题。
2024-10-18
帮我推荐以图生图的AI吧
以下为您推荐一些好用的以图生图的 AI 产品: 1. Artguru AI Art Generator:这是一个在线平台,能够生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:一种 AI 工具,可以将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍存在一些局限,比如偶尔会出现性能不稳定、生成内容不当等问题。 此外,在使用以图生图的过程中,还可以参考以下方法: 从游戏截图升级到 KV 品质:游戏内截图距离内容丰富、构成美观的画面有差距时,可以手动用 PS 添加一些信息丰富画面。比如简单粗暴的背景贴人物合成,使用游戏截图和立绘均可;通过一些简单加工,更形象地帮助 AI 知道您想要什么。甚至可以使用 PS beta 版的 AI 工具生成一些元素来修饰图片。如果想有更加定制化的背景、人物动作、构图视角,可以结合 3D 软件定制内容。首先对于没有绑定的模型,推荐使用 ACCURIG(的一键绑定软件,它对于身体权重的计算和对手指的绑定比 MIXAMO 识别效果更好,且可以一键绑定标准的 UE 模型骨骼,方便后续进入引擎复用动作。之后在 maya 中一键生成 adv 控制器,K 好动作。 用 AI 快速做一张满意的海报:首先准备一张真实照片作为样图,然后在无界 AI 找到图生图功能。别忘了,图生图也要加关键词。如果要改变画面内容,比如父亲头发颜色,“二次元强度”改为 70%。根据出图效果,进一步修改或增加提示词作为约束。例如,父亲的白发难以识别,就在人物关键词的基础上,增添“父亲一头白发”等修饰词。
2024-10-18