直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

生成人物图像哪个AI最好

回答

以下为一些生成人物图像较好的 AI 工具及相关信息:

  • PhotoMaker:可以根据文字描述生成人物照片,能混合不同人物特征创造新形象,还能改变照片中人物的性别、年龄。网址:https://photo-maker.github.io 。 在人物构图的视角选择方面,有以下几种常见视角:
    • 正视角:拍摄对象正对着相机的姿态,使人像呈现出正面的视角。咒语关键词:Front view 。生成思路:正视角的年轻女孩。生成咒语:young girl,front view,--ar 16:9 。
    • 后视角:从被摄对象的背后拍摄的视角,以被摄对象的背部为主要构图元素。咒语关键词:Back view angle & Back angle 。生成思路:后视角的年轻女孩。生成咒语:young girl,back view angle,--ar 16:9 。
    • 侧视角:观察或拍摄物体或场景时从侧面的角度观察,可用于展示物体的形状和轮廓,或创造深度和距离的感觉。咒语关键词:Side view & Shoulder level view 。生成思路:侧视角的年轻女孩。生成咒语:young girl,Side view,--ar 16:9 。
    • 仰视角:观察或拍摄物体或场景时从底部的角度观察,通常会让物体看起来更为庞大和高大,具有一定的视觉冲击力和震撼效果。咒语关键词:Bottom view & Low angle view 。生成思路:仰视角的年轻女孩。生成咒语:young girl,low angle view,--ar 16:9 。
    • 俯视角。

此外,还有 Sam Altman 与 Bill Gates 关于 GPT 的未来讨论,以及 Portkey AI 网关这一连接多种 AI 模型的工具。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

7大方向快速生成合心意的AI人物形象

[title]7大方向快速生成合心意的AI人物形象[heading2]二、人物构图的视角选择通过随机生成的图片来看,通过后视角关键词的约束,目前随机出来人物都是展现人物背面的,结果相对来说是较好的,那么我们就继续来看一看其它的视角。3.侧视角侧视角是指观察或拍摄物体或场景时从侧面的角度观察。在视觉艺术中,侧面视角可以用于展示物体的形状和轮廓,或者创造深度和距离的感觉,同时可以用于捕捉被摄对象的侧面,突出其特征和特点。咒语关键词:Side view & Shoulder level view生成思路:侧视角的年轻女孩生成咒语:young girl,Side view,--ar 16:9通过随机生成的图片来看,通过侧视角关键词的约束,目前随机出来人物也都是侧面的形象,结果相对来说也是较好的,那么我们就继续来看一看其它的视角。4.仰视角仰视角是指观察或拍摄物体或场景时从底部的角度观察。在人物构图中,仰视角可以用于捕捉俯瞰等场景,或者突出被摄对象的底部特征,这个视角通常会让物体看起来更为庞大和高大,具有一定的视觉冲击力和震撼效果。咒语关键词:Bottom view & Low angle view生成思路:仰视角的年轻女孩生成咒语:young girl,low angle view,--ar 16:9通过随机生成的图片来看,通过仰视角关键词的约束,目前随机出来人物的形象,结果看起来确实是仰视角,但是从摄影角度来看的话,只有第三、第四张照片构图会符合大众审美以外,其它图片的角度的图片都是有一定问题存在的,那么是什么问题造成的呢?我们一会儿深究!现在先继续来看一看其它的视角。5.俯视角

7大方向快速生成合心意的AI人物形象

[title]7大方向快速生成合心意的AI人物形象[heading2]二、人物构图的视角选择视角可以按照相机相对于被拍摄对象的位置,分为正面、背面和侧面。当然,拍摄角度不仅限于这三个方向,还可以有更多不同的角度选择,这需要根据被拍摄对象和拍摄需求来选择合适的角度。测试:不加入关键词的AI生成的图片会是什么样子?生成思路:年轻的女孩生成咒语:young girl,--ar 16:9通过随机生成的8张来看,由于没有其他关键词的约束,目前随机出来默认的人物形象偏欧美风,人物视角的比例偏差也都保持在了正面和侧面,那么我们现在可以通过增加构图视角的关键词来限定人物呈现的视角。我们来看看增加不同视角之后的样子吧。1.正视角正视角是指在人像构图时,拍摄对象正对着相机的姿态,使人像呈现出正面的视角。咒语关键词:Front view生成思路:正视角的年轻女孩生成咒语:young girl,front view,--ar 16:9通过随机生成的图片来看,由于受到正视角关键词的约束,目前随机出来人物都是偏正面的,结果相对来说是较好的,那么我们就继续来看一看其它的视角。2.后视角后视角是指从被摄对象的背后拍摄的视角,也就是以被摄对象的背部为主要构图元素的拍摄方式。这种视角可以营造出一种神秘或者引人遐想的氛围。咒语关键词:Back view angle & Back angle生成思路:后视角的年轻女孩生成咒语:young girl,back view angle,--ar 16:9

XiaoHu.AI日报

[title]XiaoHu.AI日报[heading2]1月15日1⃣️ 📸 PhotoMaker -创造个性化人物图像:-可以根据文字描述生成人物照片。-能混合不同人物特征创造新形象。-改变照片中人物的性别、年龄。🔗 https://photo-maker.github.io 🔗 https://x.com/xiaohuggg/status/1746861045027869072?s=20 2⃣️ 💬 Sam Altman与Bill Gates关于GPT的未来讨论:-强调多模态能力,特别是对视频的理解。-讨论GPT的可靠性和错误减少。-讨论GPT连接外部数据源的潜力,如电子邮件、日历。🔗 https://x.com/xiaohuggg/status/1746822924433272968?s=20 3⃣️ 🌐 Portkey AI网关-连接多种AI模型的工具:-提供简单API接口,连接超过100种大语言模型。-包括OpenAI、Anthropic等知名AI服务。-体积仅45kb,处理速度提升9.9倍。-灵活配置,方便切换不

其他人在问
我在中国互联网哪里可以学到很好的ai技术
在中国互联网上,您可以通过以下途径学习很好的 AI 技术: 1. 学术论文:通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库搜索相关论文,了解 AI 技术的研究成果。 2. 专业书籍:查找与 AI 相关的专业书籍,深入学习 AI 知识。 3. 在线课程和教程: 参加 Coursera、edX、Udacity 等平台上的 AI 课程。 在 YouTube 等视频平台上查找教程和演示视频。 4. 技术论坛和社区: 加入如 Stack Overflow、Reddit 的 r/AI 等相关论坛和社区,与专业人士交流学习。 关注 AI 相关的博客和新闻网站,了解最新技术动态。 5. 开源项目和代码库:在 GitHub 等开源平台上探索 AI 相关项目,了解其应用和实现。 6. 企业案例研究:研究如 Autodesk、Siemens 等公司在 AI 领域的应用案例,了解实际项目中的效果。 对于新手学习 AI,您可以: 1. 了解 AI 基本概念: 阅读「」部分,熟悉术语和基础概念。 浏览入门文章,了解历史、应用和发展趋势。 2. 开始 AI 学习之旅: 在「」中找到初学者课程,推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习并获取证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块,掌握提示词技巧。 4. 实践和尝试:实践巩固知识,使用各种产品创作,并在知识库分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解工作原理和交互方式。
2024-10-18
ai数字人直播
以下是关于 AI 数字人直播的相关信息: AI 数字人直播盈利方式: 1. 直接卖数字人工具软件,分为实时驱动和非实时驱动两类。实时驱动在直播时能改音频话术,真人接管,市面标准零售价一年 4 6 万往上。非实时驱动一个月 600 元,效果差,类似放视频的伪直播,市场价格混乱,存在靠发展代理割韭菜的情况。 2. 提供数字人运营服务,按直播间成交额抽佣。 AI 直播卖货适用品类和场景: 1. 适用于不需要强展示的商品,如品牌食品饮料。不适用于服装,因过品快且衣服建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,涉及主播话术、套路和调动直播间氛围能力等。 4. 电商直播分为达播跟店播,数字人直播在店播中的效果最好,数据基本能保持跟真人一样。 AI 直播的壁垒和未来市场格局: 1. 从长期看,技术上没壁垒,但目前仍有技术门槛,如更真实的对口型、更低的响应延迟等。单纯靠开源算法拼的东西,实时性、可用性不高。 2. 不会一家独大,可能有 4 5 家一线效果的公司,大多为二三线效果公司。因为它只是工具,迁移成本低。 3. 真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜、不考虑客户效果的公司,售后问题麻烦。 4. 有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等全环节打通服务,会绑定商家,竞争难度大。 数字人简介: 数字人是指运用数字技术创造出来的人,虽现阶段不能像科幻作品中的人型机器人一样具备高度智能,但已在生活各类场景中出现,且随着 AI 技术发展迎来应用爆发。目前业界没有准确定义,一般根据技术栈不同分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,表现质量与手动建模精细程度及动捕设备精密程度直接相关。随着视觉算法进步,在无昂贵动捕设备时,也可通过摄像头捕捉人体骨骼和人脸关键点信息,达到不错效果。
2024-10-18
AI在科研领域中的应用有哪些,以及国内外情况对比
AI 在科研领域中的应用广泛,特别是在医疗健康方面: 抗癌方面:AI 能够提前诊断胰腺癌,如相关研究表明其有可能提前三年做出诊断。 抗衰老方面:通过筛查大量化合物,发现高效的药物候选物,其药理学性质优于已知的抗衰老物质。 早期疾病防治方面:例如在帕金森病的研究中,利用神经网络分析患者体液中的生物标志物,可在症状出现前几年发现疾病。 发现新靶基因:两名高中生与医疗技术公司合作,借助 AI 发现了与胶质母细胞瘤相关的三个新靶基因。 寻找治疗方法:如亚利桑那大学与哈佛大学共同利用人工智能对健康神经元在疾病进展过程中的分子变化进行研究,以识别阿尔茨海默病的原因和潜在药物靶点。 国内外情况对比: 在医疗 AI 领域,中美存在较大差异。美国医疗支出占 GDP 比重约 17%,中国约 7%。美国医生独立行医,有独立决策权,议价能力和意愿较强;中国政府和医院集采议价能力强,采购流程复杂。此外,由于存在“灰色收入”“医患不信任”“考核评比”等问题,中国医院、医生对于可能记录、审查自己言行的应用普遍持抵触态度。在中国的落地场景中,“AI 协助医生”不如“AI 独立诊断”,机械套用美国的 AI 医疗应用模式在中国基本行不通。
2024-10-18
AI在科研当中的运用
AI 在科研中的运用十分广泛,特别是在医疗领域: 抗癌方面:AI 能够提前三年诊断胰腺癌,有助于尽早开展治疗。 抗衰老方面:通过筛查大量化合物,发现高效的药物候选物。 早期疾病防治方面:例如在帕金森病的第一个症状出现前几年,就可通过分析患者体液中的生物标志物进行发现。 胶质母细胞瘤研究方面:两名高中生与医疗技术公司合作,借助 AI 发现了与该癌症相关的三个新靶基因。 阿尔兹海默症治疗方面:亚利桑那大学与哈佛大学共同利用人工智能对健康神经元在疾病进展过程中的分子变化进行研究,以识别疾病的原因和潜在药物靶点。 此外,在新工业革命中,AI 正在使生物制药和医疗保健产业化,被应用于从药物设计、诊断到医疗保健交付和后勤功能的各个方面。 AI 在其他科研领域也有众多应用场景,如: 金融服务:包括风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:涵盖产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:涉及预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(此处未给出具体应用,您可补充更多相关问题以获取更详细的信息)
2024-10-18
我打算用AI创业,你有什么建议吗
以下是关于用 AI 创业的一些建议: 1. 关注数据飞轮效应:如果打算做 ToC 场景的创业,要重视数据飞轮带来的正反馈效应,因为 C 端能带来的数据优势可能是在 AI 早期决胜的关键。 2. 探索垂直模型:有专业壁垒的垂直模型也许是机会所在,很多高价值、特定领域的工作流程依赖于丰富的专有数据集。 3. 明确产品方向:大模型产品可以朝着个性化(给它装上“记忆”,成为工作助理或陪伴者)和场景化(给它装上“手”和“眼睛”)两个方向发展。 4. 及早行动:现在就开始探索生成性 AI,提前布局的公司将来会具有优势。 5. 寻找市场空白:市场地图的某些部分已经拥挤,而其他区域仍空旷,应将努力集中在尚未探索的区域。 6. 针对不同群体的建议: 技术爱好者:从小项目开始,探索 AI 编程工具,参与 AI 社区,构建 AI 驱动的项目。 内容创作者:利用 AI 辅助头脑风暴,建立 AI 写作流程,探索多语言内容,优化 SEO。 7. 注重实践和迭代:AI 的学习和应用,用起来、有效迭代大于一切,形成正确的底层工作逻辑,按节奏确定目标和复盘。 8. 组织公司架构:AI 创业要从 AI 效率、变革的角度去组织公司架构。 9. 把握融资节奏:在当下 AI 火热的状态,创始人要把握好融资节奏。
2024-10-18
有什么比较好的AI制作视频的AI工具
以下是一些比较好的 AI 制作视频的工具: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):适用于创建小说中的场景和角色图像的 AI 图像生成工具。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,能生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 此外,还有以下文字生成视频的 AI 产品: 1. Pika:擅长动画制作,并支持视频编辑。 2. SVD:可在 Stable Diffusion 图片基础上直接生成视频。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 4. Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。 如果您想创作 AI 短片,除了使用相关工具,还需要考虑故事来源。比如通过原创(直接经验),基于您或周围人的经历、做过的梦、想象的故事等;或者通过改编(间接经验),对经典 IP、名著、新闻、二创等进行改编。在剧本写作方面,虽然编剧有一定门槛,但短片创作相对简单,可从自身或朋友经历改编入手,也可对触动您的短篇故事进行改编。多与他人讨论故事,有助于修改和进步。
2024-10-18
怎样按照语义生成图像
按照语义生成图像的方法主要有以下几种: 1. 在 ComfyUI 中: 条件输入:右侧的条件输入包括语义图、文本、已有图像等,表示生成图像时的上下文信息。通过多个节点模块实现,如文本提示,用户可输入文本作为生成图像的主要条件;语义图用于输入图像的语义信息,通过“条件控制”节点实现;已有图像可作为条件输入以指导最终生成的图像。CLIP 模型对图中的文本、语义图等条件信息进行编码,并通过交叉注意力机制引导图像生成。用户可通过文本输入节点、图像输入节点等调整条件及权重以达到特定效果。 编码器和解码器:编码器将输入图像映射到潜在空间,解码器将潜在表示映射回像素空间生成输出图像。在 ComfyUI 中,编码器可以是预训练的扩散模型的一部分,用户可通过加载不同模型或自定义节点实现编码过程,通过“图像输出”节点得到最终生成结果。 2. 在 OpenAI 中: 图像生成端点:允许在给定文本提示的情况下创建原始图像,生成的图像大小可为 256x256、512x512 或 1024x1024 像素,较小尺寸生成速度更快。可使用参数一次请求 1 10 张图像。描述越详细,越有可能获得想要的结果,可探索 DALL·E 预览应用程序中的示例获取更多提示灵感。 图像编辑端点:通过上传蒙版编辑和扩展图像。遮罩的透明区域指示应编辑图像的位置,提示应描述完整的新图像,而不仅仅是擦除区域。上传的图片和遮罩必须是小于 4MB 的正方形 PNG 图片,且尺寸相同。 此外,GPT 4 也具备根据详细说明生成图像的能力,例如生成“一只青蛙跳进银行,问出纳员:你有免费的荷叶吗?出纳员回答:没有,但我们提供低利息的池塘升级贷款”的 2D 图像,以及“一个由浮岛、瀑布和桥梁组成的幻想景观,天空中有一只飞龙和一个位于最大岛上的城堡”的 3D 模型,并能完成添加、重新定位、重新着色对象和改变飞龙轨迹等任务。
2024-10-18
倒推图像关键词
在图像创作中,倒推图像关键词有以下几种方式和相关要点: 对于图生图功能,除了文本提词框外还有图片输入口,可通过图片给与 AI 创作灵感。随便照一张照片拖入后,文本输入框旁有两个反推提示词的按钮,CLIP 能通过图片反推出完整含义的句子,DeepBooru 能反推出关键词组。但两种方式生成的提示词可能存在瑕疵,需要手动补充信息。补充后调整宽度和高度,使红框匹配图片,同时注意两个重要参数:提示词相关性和重绘幅度。 关键词接龙时,将润色后的关键词组合起来形成完整的图像描述,确保每个关键词都能在最终图像中得到体现。 在视频转绘制作中,因为要对所有图片进行转换,关键词编写尽可能描述大概画面即可,推荐的公式是质量词+人物描述+环境描述+Lora。例如赛博风格转绘用到的正向提示词和反向提示词。
2024-10-16
国内可直接编辑或创建图像文件的最好用AI有哪些?
以下是一些国内可直接编辑或创建图像文件且好用的 AI 工具: 1. 无界 AI:可用于快速制作海报底图,并完成主题海报排版。操作流程包括确定主题与文案、选择风格与布局、生成与筛选、配文与排版。 2. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 3. Retrato:将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 4. Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具有细节的全新视觉作品。 5. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,可将上传的照片转换为芭比风格。 6. 可灵:由快手团队开发,用于生成高质量的图像和视频,但价格相对较高。 7. 通义万相:在中文理解和处理方面表现出色,用户可选择多种艺术和图像风格,生成图像质量较高,操作界面简洁直观,用户友好度高,且目前免费,每天签到获取灵感值即可。但存在一定局限性,如某些类型的图像因国内监管要求无法生成,处理非中文语言或国际化内容可能不够出色,处理多元文化内容时可能存在偏差。
2024-10-15
如何用ai进行图像算法识别
以下是关于 AI 在图像算法识别方面的相关内容: 在图像识别方面,AI 技术自身带来的造假难题可由其自身的同僚互鉴打假来解决。目前已有不少网站通过对大量图片数据的抓取和分析,给出对画作属性的判断可能性,例如 ILLUMINARTY(https://app.illuminarty.ai/)。但在测试过程中,可能存在一些问题,如结构严谨的真实摄影作品会被误识别为 AI 作图,这是因为鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。 另外,CNN(卷积神经网络)的结构基于两类细胞的级联模型,主要用于模式识别任务,在计算上更有效、快速,已应用于自然语言处理和图像识别等领域。 在汽车行业,AI 也有广泛应用: 1. 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定,实现自主导航和驾驶,如特斯拉、Waymo 和 Cruise 等公司在开发和测试。 2. 车辆安全系统:用于增强自动紧急制动、车道保持辅助和盲点检测等系统的性能。 3. 个性化用户体验:根据驾驶员偏好和习惯调整车辆设置。 4. 预测性维护:分析车辆实时数据预测潜在故障和维护需求。 5. 生产自动化:用于汽车制造的生产线自动化,提高效率和质量控制。 6. 销售和市场分析:帮助汽车公司分析市场趋势、消费者行为和销售数据。 7. 电动化和能源管理:优化电动汽车的电池管理和充电策略。 8. 共享出行服务:优化路线规划、车辆调度和定价策略。 9. 语音助手和车载娱乐:如 Amazon Alexa Auto 和 Google Assistant 等。 10. 车辆远程监控和诊断:提供实时诊断和支持。
2024-10-15
用ai进行图像识别
AI 在图像识别方面的应用较为广泛,以下为您介绍一些相关内容: 在自动驾驶技术中,利用 AI 进行图像识别、传感器数据分析和决策制定,使自动驾驶汽车能够自主导航和驾驶,如特斯拉(Tesla)、Waymo 和 Cruise 等公司都在开发和测试自动驾驶汽车。 BERT 理念被应用于机器视觉领域,通过将图片分割处理,ViT 模型得以实现图像识别。 在深度学习中,图像识别实际是将图片转化为大量的图像单个像素点 RGB 值作为输入,再大量标注输出,形成神经网络。
2024-10-15
ai图像识别
以下是关于 AI 图像识别的相关内容: 判断一张图片是否为 AI 生成的方法: 通过画面风格、物品 bug 等细节进行辨别。但需注意,AI 在不断修正作图 bug,相关方法可能随时失效。 利用专门的网站,如 ILLUMINARTY(https://app.illuminarty.ai/),通过对大量图片数据的抓取和分析来判断,但可能存在误判,如将结构严谨的真实摄影作品识别为 AI 作图。 关于鉴别 AIGC 的讨论: 培养鉴别 AI 生成图片的技能需要训练大脑模型。 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。 另外,人工智能在汽车行业有广泛应用: 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定。 车辆安全系统:如自动紧急制动、车道保持辅助和盲点检测等。 个性化用户体验:根据驾驶员偏好和习惯调整车辆设置。 预测性维护:分析车辆实时数据预测潜在故障和维护需求。 生产自动化:用于汽车制造的自动化生产线。 销售和市场分析:分析市场趋势、消费者行为和销售数据。 电动化和能源管理:优化电动汽车电池管理和充电策略。 共享出行服务:优化路线规划、调度车辆和定价策略。 语音助手和车载娱乐:如 Amazon Alexa Auto 和 Google Assistant 等。 车辆远程监控和诊断:远程监控车辆状态并提供实时诊断和支持。
2024-10-15
生成分享图片工具
以下为一些生成分享图片的工具及相关方法: 1. Midjourney V6:可用于生成场景模型。 放大工具:Comfy Ui、Magnific Ai、Upscayl 深度图:Leia Pix 法线图:Shadermap 2. 辅助工具生成透明背景图像: 安装好插件后,在生成图片时勾选“layerdiffusion enabled”。 在“layerdiffusion method”中选择生成透明图像的模式,如“Only Generate Transparent Image”。 提示中输入透明物体的描述,如“玻璃杯”,点击生成可得到透明背景的玻璃杯图像。 也可上传背景图像,在“layerdiffusion method”中选择“From Background to Blending”,然后生成透明图像。 反之,也可以先生成透明的前景,然后选择“From Foreground to Blending”模式,生成背景。 特定模型: layer_xl_transparent_attn:用于将 Stable Diffusion XL 模型转化为透明图像生成器的模型。 layer_xl_transparent_conv:与 layer_xl_transparent_attn 类似,通过修改 conv 层的 offset 实现。 layer_xl_fg2ble:用于将 XL 模型转化为前景图像到混合图像的生成模型。 layer_xl_fgble2bg:用于基于前景和混合图像生成背景的模型。 layer_xl_bg2ble:将 XL 模型转化为根据背景图像生成混合图像的模型。 layer_xl_bgble2fg:将 XL 模型转化为根据背景和混合图像生成前景的模型。 vae_transparent_encoder:图像编码器,用于从像素空间中提取潜在偏移,帮助透明图像的生成。 vae_transparent_decoder:图像解码器,输出真实的 PNG 图像。 3. Aimwise WaytoAGI 百家号文旅分享中的方法: 开启 controlnet 边缘类模型,导入需要处理的 logo,调整合适的 cn 参数。 开启 controlnet IP adapter 功能性模型,导入风格参考图,调整合适的 cn 参数,可快速进行风格迁移和融合,提升出图效率。
2024-10-18
除了生成式ai还有什么ai
以下是除生成式 AI 之外的一些常见的 AI 类型: 1. 监督学习型 AI:使用标记的数据进行训练,以预测未来的值。 2. 无监督学习型 AI:专注于在原始数据中发现模式。 3. 深度学习型 AI:使用人工神经网络处理复杂模式,可使用标记和未标记的数据进行半监督学习。 4. 强化学习型 AI:通过与环境的交互和奖励机制来学习最优策略。 在游戏领域,早期的游戏中的计算机控制对手是简单脚本程序,而现在由于更快的微处理器和云技术,能够构建大型神经网络,在高度复杂的领域中识别模式和表示。未来,多代理系统可能会成为建模推理和社会学习过程的主流方式。在生成式 AI 的下一个阶段,推理研发成果将渗透到应用层,特定领域中获取真实世界数据和构建特定认知架构仍是挑战。
2024-10-18
提示词生成网站
以下是为您精选的一些提示词生成网站: |站点名|网站介绍|地址| |||| |MidLibrary|Midjourney 最全面的流派、艺术技巧和艺术家风格库|| |MidJourney Prompt Tool|类型多样的 prompt 书写工具,点击按钮就能生成提示词修饰部分|| |OPS 可视化提示词|有 Mid Journey 的图片风格、镜头等写好的词典库,方便快速可视化生成自己的绘画提示词|| |AIart 魔法生成器|中文版的艺术作品 Prompt 生成器|| |IMI Prompt|支持多种风格和形式的详细的 MJ 关键词生成器|| |Prompt Hero|好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT & Midjourney|| |OpenArt|AI 人工智能图像生成器|| |img2prompt|根据图片提取 Prompt|| |MidJourney 提示词工具|专门为 MidJourney 做的提示词工具,界面直观易用|| |PromptBase|Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板|| |AiTuts Prompt|精心策划的高质量 Midjourney 提示数据库,提供广泛的不同风格|| || |NovelAI tag 生成器|设计类 Prompt 提词生成器|| |魔咒百科词典|魔法导论必备工具,简单易用的 AI 绘画 tag 生成器|| |KREA|设计 AI 的 Prompt 集合站,create better prompts|| |Public Prompts|免费的 prompt 合集,收集高质量的提示词|| |AcceleratorI Prompt|AI 词汇加速器,加速 Prompt 书写,通过按钮帮助优化和填充提示词|| |MidJourney.TalkGame.Ai|野菩萨出品||
2024-10-18
deforum中初始化为什么不能以视频路径的视频进行风格转变?而是随机生成新视频?是哪里出现了问题?
很抱歉,目前知识库中没有关于“deforum 中初始化不能以视频路径的视频进行风格转变,而是随机生成新视频的原因及问题所在”的相关内容。但一般来说,出现这种情况可能是由于以下原因: 1. 视频格式或编码不兼容:deforum 可能不支持您所提供的视频的特定格式或编码方式。 2. 参数设置错误:可能在初始化过程中的某些参数设置不正确,导致无法按照预期使用指定视频进行风格转变。 3. 软件版本问题:您使用的 deforum 版本可能存在缺陷或不具备该功能。 建议您检查视频格式和编码,确认参数设置是否正确,并尝试更新到最新版本的 deforum 以查看是否能解决问题。
2024-10-18
是否有AI生成简历的功能
有许多 AI 工具可以帮助您生成简历,以下为您列举一些: 1. Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型,能为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 2. Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的各个方面,包括写作、编辑、格式化和优化。 3. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,您还可以查看这里:https://www.waytoagi.com/category/79 。 以上工具都能助您快速、高效地创建出专业的简历,您可根据自身需要选择最适合的工具。希望上述回答对您有所帮助! 内容由 AI 大模型生成,请仔细甄别。
2024-10-18
如何使用AI协助短视频文案生成?
以下是使用 AI 协助短视频文案生成的方法: 1. 利用 ChatGPT 生成短视频选题文案:表明身份,描述需求,提出回答要求,可参考美妆行业的例子。 2. 用 ChatGPT 生产短视频文案:将需求与框架结合,让 ChatGPT 为您生成。 3. 生成虚拟数字人短视频: 第一步:打开网站(需科学上网),如 https://studio.did.com/editor 。 第二步:在右侧文字框输入从 ChatGPT 产生的内容,选择想要的头像、不同的国家和声音,然后点击右上角的 Create Video ,等待生成。 生成好数字人视频后,结合产品做讲解即可发布用于视频带货。 4. 通过 ChatGPT 生成文案,将其复制到支持 AI 文字转视频的工具内,实现短视频自动生成。如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。 5. 前期利用 ChatGPT 生成文案,包括: 生产视频脚本:把选题告诉 ChatGPT,它能生成包括具体场景和转场画面的完整视频脚本。 筛选 BGM:告诉 ChatGPT 视频的情绪,它能为您筛选背景音乐。
2024-10-18
怎么用AI绘制一个我指定的动漫人物原型的各类图片,例如日漫《好想告诉你》中的黒沼爽子
要使用 AI 绘制指定的动漫人物原型,如日漫《好想告诉你》中的黑沼爽子,您可以按照以下步骤进行: 1. 选择合适的 AI 绘画工具:目前有许多在线的 AI 绘画平台和软件可供选择,例如 DALL·E2、StableDiffusion 等。 2. 明确描述特征:在输入描述时,尽可能详细地描述黑沼爽子的外貌特征,包括发型(如黑色的长直发)、眼睛(如大而明亮的眼睛)、服装(如校服的款式和颜色)、表情(如羞涩的微笑)等。 3. 参考相关图片:如果可能,找到黑沼爽子的官方图片或其他粉丝绘制的作品,作为参考提供给 AI 绘画工具,以帮助其更好地理解您的需求。 4. 不断调整和优化:根据生成的初步结果,对描述进行调整和优化,例如修改某些特征的描述、增加更多细节等,以获得更符合您期望的图片。 需要注意的是,AI 绘画的结果可能会受到多种因素的影响,不一定能完全符合您的预期,但通过不断尝试和优化,您有机会获得较为满意的作品。
2024-10-17
如何在midjourney中只进行照片背景修改,而不修改人物姿态和表情
在 Midjourney 中只修改照片背景而不修改人物姿态和表情,您可以参考以下方法: 1. 得益于cref,midjourney 能够迅速达成角色一致性的目的而无需 Lora。其中,cref 代表 character reference(角色参考);cw 则代表 character weight(参考权重),默认为 100,会参考角色的人脸和服装特点。如果您只想关注人脸,请调低到 0。您不需要对角色原图使用/describe 来贴近目标生成角色的形象,因为cref 会帮您完成这件事情。 2. 风格复制和服装的替换,则应当用提示词(prompt)和sref,默认值 100,越高越接近参考图像的风格。 3. 如果遇到“形似而神不似”的问题,即 MJ 直出和原人物在眼睛、眉毛、鼻子等其他地方的大小、间距有一些细微的差距,您可以按照以下步骤操作: 使用/settings 确保您处于模式并且 Remix 设置为打开。 选择带有您想要更改的面部的图像。使用将其从网格中分离出来,然后选择。 由于您已经开启了 Remix,您将能够编辑提示。 从提示中删除cref 和cw。一旦删除了它们,修改提示以对面部进行更改。例如,您可以慷慨地选择面部的下半部分,并添加“清洁剃须”来除去胡须。您可以尝试使用小的负权重,例如 tattoos::0.5 来移除纹身。 注意:当您对更改满意时,请确保不要再次添加cref 到提示中!一旦添加回来,“面部交换”将再次发生,那些不需要的属性将重新出现。 4. 有时,Midjourney 在正确将角色放置在背景中时会遇到一些困难。如果结果不连贯(例如,您看到头部朝后或图像被奇怪地裁剪),请尝试将 stylize增加到 800 1000。您也可以尝试将cw 同时降低到低于 100 的值,视情况而定。
2024-10-10
生图后,人物的模样及服装等统一,用哪一款
在保持人物模样及服装等统一方面,如果使用 Midjourney ,有以下相关信息: 1. Midjourney 有新功能 Cref ,可以先跑一张主角的定妆照,在需要出现主角人物的地方,扔进去 Cref 以保持发型、人脸、衣服。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性,比对欧美的人脸的一致性效果差,年轻人的效果相对较好,亚洲老人的效果惨不忍睹。而且 Cref 的效果在画面的审美和构图上有一定的破坏性,所以原则上能不用 Cref 就不用,比如只有背影的时候,写个短发男人黑卫衣就可以。 2. 对于人物一致性,还有两个取巧的方式,一个是生成动物,动物会比较容易保持一致性,另一个方式是特定的名人或有特殊属性的人物。 3. 在使用 Cref 时,您可以在提示词后添加 cref URL 并附上人物图像的 URL ,还可以使用 cw 来修改参考强度,强度 100(cw 100)为默认值,会使用人物的脸、头发和衣服,强度 0(cw 0)时则只关注脸(适合改变服装或发型等)。Cref 不仅适用于 Niji 和普通的 Midjourney 模型,还可以与 sref 结合使用。在网页版 alpha 中,您可以通过拖拽或粘贴图像到想象栏,选择相应图标来设置图像为图像提示、风格参考或人物参考,Shift + 选择一个选项可以将一张图像用于多个类别。
2024-10-10
推荐让图片中的人物动起来的软件
以下为能让图片中的人物动起来的软件及相关方法: 1. 方法一:利用 MJ 画图先画出想要的底图,然后使用 InsightFaceSwap 插件处理脸部,因该插件对多人脸部同时处理效果不佳,需先对图片进行分割裁剪,分别处理后再缝合,最后利用可灵或其他软件让图片动起来。 2. 方法二:在网上寻找能直接融合两张照片的软件或项目,直接对图片进行融合,若没有则进行纯 P 图处理,然后利用图生视频的项目完成。 此外,还有一些关于图片处理的相关知识: 在 Stable Diffusion 中,通过添加关键词、调整重绘幅度等操作可以实现局部重绘和背景修改。例如,利用 PS 制作精确蒙版,在重绘时选择重绘非蒙版区域,调整提示词等。 利用醒图或美图秀秀等 App 可以调整脸部,如在醒图中关注人像>面部重塑>面部>比例,调整上庭、中庭、下庭。 对于 MJ 画图,若直出的皮肤缺乏质感,可使用醒图的人像>手动美颜>皮肤肌理功能。若想快速调整光源,可试试 Luminar。
2024-10-09
使用人物Lora生成的图片中有多个人物时,怎么让人物的形象各不相同?
在 Stable Diffusion 中,若使用人物 Lora 生成的图片中有多个人物并想让人物形象各不相同,可参考以下方法: 1. 在提示词中输入数量词(如 2girls 或 3boys 等),再加上各自的描述提示词。若刷图成功率不高,可配合 openpose 控制,做一个多人骨架,以生成多人物构图。 2. 需使用不同的 Lora 来区分人物,但单纯靠提示词可能行不通。 3. 分区控制思路: Multidiffusion 的做法:启用 Tiled Diifusion,打开分区提示词控制,创建文生图画布。启用不同区域,分别填写背景、不同人物的描述词和 Lora。增加 controlnet 的 openpose 控制来稳定人物,但可能存在分区生成的人物连续性低、lora 控制不强等问题。 Latent Couple 的做法(文中未提及,需进一步探索)。 此外,关于 Lora 模型: 1. Lora 可以固定照片的特征,如人物特征、动作特征和照片风格。 2. 点击“生成”下面的第三个按钮,找到 Lora 选项,可添加下载保存到电脑的 Lora 模型,Lora 可叠加使用,但新手不建议使用太多,且 Lora 之间用英文逗号隔开,每个 Lora 后面的数字用于调整权重,一般只会降低权重。选择 Lora 应根据最初想要生成的照片类型决定。
2024-09-27
如何用midijurney生生人物一致性
在 Midjourney 中实现人物一致性,主要通过以下方式: 1. Midjourney V6 更新了角色一致性命令“cref ”。您可以根据需要重复此过程,但要注意不要过多操作,以免丧失保真度。添加角色参考图像,并选择一个“cw”以达到效果。Midjourney 能够从参考图像中识别的角色属性将与提示混合,从而创建出角色的最终表现。您可以通过使用“cw N”参数(cref 权重)来大致控制转移,其中 N 的值可以从 1 到 100,默认值为 100。“cw”参数不会改变角色参考图像的强度/影响力,其作用如下: “cw 100”的值(默认值)将捕捉整个角色。 “cw 99 到cw 1”之间的值将开始捕捉较少的整个角色,仅集中于转移面部。 “cw 0”的值将仅捕捉面部,大致类似于面部替换。且无法关闭面部的转移。 2. 在群像人物一致性保持及空间深度控制方面,以双人画面人物一致性的保持为例,分为 5 步: Step 1:将初始图(A)以及人物图(B)作为风格(sref)及人物(cref)的参考内容,提示词中需要注意: 描述好空间关系(下方画线部分),视角问题可以略过(风格参考会自带角度)。 成功输出图(C),可能会遇到女同事 Lisa 无法保持跟初始图(A)一致的问题。其中:sref 为风格参考,cref 为人物参考,cw 范围为 0 100,默认 100 但建议写上去确保万无一失。 Step 2:找到已生成的 Lisa 纯人物的图,提取图片链接(url)做准备工作。 Step 3:基于 Step 1 生成的构图清晰但人物失控的成图(C)基础上,进行重绘 Vary Region,步骤为: 框选需要被替换的人物。 然后将 Step 2 准备好的链接,贴入框内界面 cref 后面,注意先把原始的 cref(即红色部分)删掉。
2024-09-23