直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

要想写实,需哪些模型

回答

写实风格的图片绘制需要考虑以下几个方面:

  1. 模型选择:可以选择麦橘、墨幽等模型大佬的系列模型,如麦橘写实、麦橘男团、墨幽人造人等,这些模型在生成写实风格的图片方面表现出色。
  2. lora 选择:lora 可以帮助控制图片效果及质量。可以多看看广场上做得好看的帖子,了解他们使用的lora。
  3. 提示词设置:使用英文写提示词,用单词和短语的组合去表达需求,单词、短语之间用英文半角逗号隔开。同时,可以使用负向提示词来避免产生不想要的内容。
  4. 其他设置:如 VAE、CLIP 跳过层等,可以根据需求进行调整。

总的来说,写实风格的图片绘制需要综合考虑模型、lora、提示词等多个因素,并进行不断地尝试和调整,以达到满意的效果。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

小田:视频转绘制作视频过程中不可或缺的一环

这里因为我们做的是美女相关的,所以我直接推荐你使用麦🍊的写实模型和墨幽人造人这两个模型具体下载地址如下:这里提示词不推荐使用质量词因为本来这两个模型里面的出图质量就很高了,而且本身就是写实的模型所以加了反而会影响整体的画面。这里我们要记住我们的核心是美女。我们只需要保证她的脸好看就行了。所以提示词我推荐你先使用反推,Deepbooru。然后借助提示词插件删除一些没有用的提示词尽量只保留和画面主体相关的提示词就可以了。主要受人物主体描述+皮肤质感增强+整体细节增强的Loar就可以了https://www.liblib.art/modelinfo/73f99b12a74b4519bec1ccbaca78f0a8(皮肤质感)提示词可以参考我这个,具体还是要看你个人实践。正向提示词:1girl,solo,black_hair,midriff,autolinklora:林鹤-皮肤质感调整器-差异炼丹功能性lora模型_林鹤v1:0.6autolink,负向提示词:NSFW,logo,text,blurry,low quality,bad anatomy,说一下为啥要使用皮肤类型的Lora,因为很多的小姐姐就是你原本的素材磨皮太严重了。。就像旁边这张图一样皮肤都没什么质感了。

Tusiart简易上手教程

1.定主题:你需要生成一张什么主题、什么风格、表达什么信息的图。2.选择基础模型Checkpoint:按照你需要的主题,找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型,比如说麦橘写实、麦橘男团、墨幽人造人等等,效果拔群。3.选择lora:在你想要生成的内容基础上,寻找内容重叠的lora,帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面,他们都在用什么lora。4.ControlNet:控制图片中一些特定的图像,可以用于控制人物姿态,或者是生成特定文字、艺术化二维码等等。也是高阶技能,后面再学不迟。5.局部重绘:下篇再教,这里不急。6.设置VAE:无脑选择前面提到的840000这个即可。7.Prompt提示词:用英文写你想要AI生成的内容,不用管语法也不要写长句,仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。

Liblibai简易上手教程

1.定主题:你需要生成一张什么主题、什么风格、表达什么信息的图。(没错我是喜欢看plmm多点)2.选择Checkpoint:按照你需要的主题,找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型,比如说麦橘写实、麦橘男团、墨幽人造人等等,效果拔群。3.选择lora:在你想要生成的内容基础上,寻找内容重叠的lora,帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面,他们都在用什么lora。4.设置VAE:无脑选840000那一串就行。5.CLIP跳过层:设成2就行。6.Prompt提示词:用英文写你想要AI生成的内容,不用管语法也不要写长句,仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。7.负向提示词Negative Prompt:用英文写你想要AI避免产生的内容,也是一样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。

其他人在问
我想改变一个图片的风格,要区别于一般的滤镜,例如写实照片变成3D模型的
目前知识库中没有关于将写实照片转变为 3D 模型风格的具体方法和相关内容。但一般来说,要实现这种效果可能需要使用专业的图像处理软件,如 Adobe Photoshop、Blender 等。在这些软件中,可能会涉及到一些复杂的操作,例如建模、材质设置、光照调整等。您也可以尝试使用一些在线的 AI 图像处理工具,部分工具可能具备将照片转换为 3D 风格的功能。不过具体的效果和操作方式可能因工具而异。
2024-08-17
麦橘写实v7
麦橘写实 V7 是由 majicMIX 系列作者开发的 AI 模型,真实系模型世界排名第一。该模型在各大模型平台全面上线,可在 C 站、吐司和 liblib.ai 等平台上下载。V7 模型的发布引起了广泛的关注,许多插画师和设计师都对其进行了试用和评价。 宗 rich 是一位资深游戏美术和神级插画师,他在抖音上分享了自己使用麦橘写实 V7 模型创作的作品。这些作品细节拉满,让人惊叹不已。他的创作过程和心得也在文章中进行了介绍,让读者更好地了解了麦橘写实 V7 模型的特点和应用场景。 此外,文章还介绍了麦橘写实 V7 模型的主题创作活动,鼓励读者一起参与创作,展示自己的才华和创意。同时,文章也提供了麦橘写实 V7 模型的返图欣赏,让读者可以更好地了解该模型的创作效果和应用前景。 总的来说,麦橘写实 V7 是一款非常优秀的 AI 模型,具有很高的真实度和表现力。它的发布为插画师和设计师提供了更多的创作工具和灵感,也为 AI 绘画的发展注入了新的活力。
2024-06-06
Dall·E照片级写实风格提示词
以下是一些可以尝试在 DALLE 中使用的提示词,来生成照片级的写实风格图像: 1. "一张拥有极高分辨率和令人惊艳的细节的照片..." 2. "拍摄于自然光线下,无滤镜,无修饰的写实..." 3. "使用高端相机和镜头拍摄的,能看到每一个毛孔的超高分辨率..." 4. "逼真到仿佛能从画面中嗅到气味的写实风格..." 5. "照片般的写实效果,清晰可见皱纹、纹理和细微表情..." 6. "令人难以区分真实照片与渲染图像的无与伦比的写实画面..." 7. "展现出 的肌肤质感、织物褶皱和光线细节..." 8. "使用热成像相机和光学变焦镜头拍摄的近乎真实的..." 9. "胶片级细节,颗粒感和动态光比的顶尖图像..." 10. "具备媲美 artsation.com 摄影作品般的逼真写实效果..." 这些提示词都强调了写实、细节、分辨率、真实感等关键词,有助于 DALLE 生成出照片般的高分辨率写实图像。你也可以继续探索其他组合,找到最佳的提示方式。
2024-04-18
国内外好用的图生视频模型
以下是一些国内外好用的图生视频模型: 可灵(国内,免费) 网址:https://klingai.kuaishou.com/ 支持文生视频、图生视频。 支持图生视频首尾帧功能。 提示词可使用中文。 文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸。 图生视频除了不可运镜控制以外,其他跟文生视频基本相同。 默认生成 5s 的视频。 ETNA(国内) 网址:https://etna.7volcanoes.com/ 由七火山科技开发的文生视频 AI 模型。 可以根据用户简短的文本描述生成相应的视频内容。 生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps。 文生视频,支持中文,时空理解。 关于可灵的文生视频效果,测试者 Austin 周安鑫进行了以下测试: 1. 场景识别:包括室内和室外,如客厅的沙发、液晶电视、漂亮的波斯猫、超现实主义的蜿蜒河流、茂密森林、灿烂花海、碧绿草坪等。 2. 物体识别:涵盖静态和动态物体,如水晶球、跳动的火焰、翱翔的飞鸟、闪烁的流星、飞溅的水珠等。 3. 人物识别:包括面部和姿态,如一个人笑容灿烂、一个人惊恐愤怒,一位芭蕾舞女孩在冰面上跳舞等。 4. 动作识别:包含基本和复杂动作,如短跑运动员快速奔跑、赛车手驾驶跑车激烈漂移等。 5. 事件检测:有简单和复杂事件,如一位帅哥在喝水、外星文明和地球进行星际大战等。 6. 环境变化:涉及光线和天气,如奇幻的极光舞动变幻、城市写字楼灯光忽明忽暗、闪电交加、乌云密布、台风、大雨等。 7. 多对象场景:包括单一和多对象场景,如 1 个飞行员驾驶战斗机翱翔太空、海军指挥航母战斗群展开激烈战斗等。 8. 特殊场景:有遮挡和非标准场景,如城市大雾遮挡摩天大楼、一边是神秘海底世界,一边是梦幻糖果屋。 9. 细节检测:包含小物体和微表情,如崭新的苹果电脑屏幕上播放电影、瞳孔收缩、脸颊泛红、嘴唇微微颤抖。
2024-09-19
你自己使用的是什么模型
以下是关于模型的相关信息: 新的 gpt3.5turbo 模型针对会话进行了优化,原始的 GPT3.5 模型针对文本补全进行了优化。 用于创建嵌入和编辑文本的端点有自己的一组专用模型。 在 AI 输入框下方有一个下拉列表,允许选择要使用的模型。默认情况下,Cursor 已准备好使用的模型包括:GPT4o、GPT4、Claude 3.5 Sonnet、cursorsmall。其中,cursorsmall 是 Cursor 的自定义模型,不如 GPT4 智能,但速度更快,用户可无限制访问。您可以在 Cursor Settings > Models > Model Names 下添加其他模型。 谷歌一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是名为 PaLM 2 的模型。 Anthropic 发布了 Claude 2,其最值得注意的是有非常大的上下文窗口,与其他大型语言模型相比,不太可能恶意行事。
2024-09-19
推荐下好用的具备图像OCR能力的大模型
目前在具备图像 OCR 能力的大模型方面,一些较为知名和好用的包括百度的文心大模型、阿里云的通义大模型等。但大模型的性能和适用场景可能会因具体需求和使用场景的不同而有所差异。您可以根据自己的具体需求进一步评估和选择。
2024-09-19
AI 大模型命名 带有-instruct的含义
AI 大模型中带有“instruct”通常与指令微调相关。在大模型的训练过程中,指令微调是其中一个重要阶段。此阶段模型被训练以理解并执行具体指令,例如翻译文本等,从而能够回答问题。指令微调阶段输入的内容通常包括三个部分,如“Instruct:请你翻译下面这段话”“Input:一段英文”“Output:一段中文”。通过指令微调,模型能够更好地按照人类的期望和具体要求进行输出。
2024-09-19
你是基于哪个AI大模型的
我是 WaytoAGI 专属问答机器人,基于 Aily 和云雀大模型。 Aily 是飞书团队旗下的企业级 AI 应用开发平台,提供了简单、安全且高效的环境,帮助企业轻松构建和发布 AI 应用,推动业务创新和效率提升。 云雀是由字节跳动研发的语言模型,通过便捷的自然语言交互,能够高效地完成互动对话、信息获取、协助创作等任务。 此外,还有一些免费的大模型接口,如阿里的通义千问大模型接口,可创建 API key。智谱 AI(ChatGLM)、科大讯飞(SparkDesk)也有免费接口,但国内的大模型大多限制一定免费额度的 Token。 谷歌的 Gemini 大模型(gemini 1.5)、海外版 Coze 的 GPT4 模型是免费且能图片识别,但需要给服务器挂梯子。想使用的话,可参考张梦飞同学写的教程。 在深入了解 AI 运作原理和众多落地产品后,重新思考 AI 大模型引发的变革。此前曾有疑问,大模型与智能语音技能的 NLU 存在差异。语音技能 NLU 是通过一系列规则、分词策略等训练而成,运作逻辑规律可观测,具有 ifelse 式逻辑性。而大模型凭借海量数据在向量空间中学习知识的关联性形成,运作逻辑难以观测,脱离了 ifelse 的层面。
2024-09-19
如果我需要一名助手帮我运营跨境电商的线上店铺,我需要一些精准的关键词就可以训练模型吗?
训练模型来协助运营跨境电商线上店铺,仅依靠一些精准的关键词通常是不够的。模型的训练需要多方面的数据和信息,包括但不限于产品的详细描述、客户的评价和反馈、市场趋势、竞争对手的情况等。精准的关键词可以作为其中的一部分输入,但不足以全面有效地训练模型以达到理想的辅助运营效果。
2024-09-19