Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

要想写实,需哪些模型

Answer

写实风格的图片绘制需要考虑以下几个方面:

  1. 模型选择:可以选择麦橘、墨幽等模型大佬的系列模型,如麦橘写实、麦橘男团、墨幽人造人等,这些模型在生成写实风格的图片方面表现出色。
  2. lora 选择:lora 可以帮助控制图片效果及质量。可以多看看广场上做得好看的帖子,了解他们使用的lora。
  3. 提示词设置:使用英文写提示词,用单词和短语的组合去表达需求,单词、短语之间用英文半角逗号隔开。同时,可以使用负向提示词来避免产生不想要的内容。
  4. 其他设置:如 VAE、CLIP 跳过层等,可以根据需求进行调整。

总的来说,写实风格的图片绘制需要综合考虑模型、lora、提示词等多个因素,并进行不断地尝试和调整,以达到满意的效果。

Content generated by AI large model, please carefully verify (powered by aily)

References

小田:视频转绘制作视频过程中不可或缺的一环

这里因为我们做的是美女相关的,所以我直接推荐你使用麦🍊的写实模型和墨幽人造人这两个模型具体下载地址如下:这里提示词不推荐使用质量词因为本来这两个模型里面的出图质量就很高了,而且本身就是写实的模型所以加了反而会影响整体的画面。这里我们要记住我们的核心是美女。我们只需要保证她的脸好看就行了。所以提示词我推荐你先使用反推,Deepbooru。然后借助提示词插件删除一些没有用的提示词尽量只保留和画面主体相关的提示词就可以了。主要受人物主体描述+皮肤质感增强+整体细节增强的Loar就可以了https://www.liblib.art/modelinfo/73f99b12a74b4519bec1ccbaca78f0a8(皮肤质感)提示词可以参考我这个,具体还是要看你个人实践。正向提示词:1girl,solo,black_hair,midriff,autolinklora:林鹤-皮肤质感调整器-差异炼丹功能性lora模型_林鹤v1:0.6autolink,负向提示词:NSFW,logo,text,blurry,low quality,bad anatomy,说一下为啥要使用皮肤类型的Lora,因为很多的小姐姐就是你原本的素材磨皮太严重了。。就像旁边这张图一样皮肤都没什么质感了。

Tusiart简易上手教程

1.定主题:你需要生成一张什么主题、什么风格、表达什么信息的图。2.选择基础模型Checkpoint:按照你需要的主题,找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型,比如说麦橘写实、麦橘男团、墨幽人造人等等,效果拔群。3.选择lora:在你想要生成的内容基础上,寻找内容重叠的lora,帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面,他们都在用什么lora。4.ControlNet:控制图片中一些特定的图像,可以用于控制人物姿态,或者是生成特定文字、艺术化二维码等等。也是高阶技能,后面再学不迟。5.局部重绘:下篇再教,这里不急。6.设置VAE:无脑选择前面提到的840000这个即可。7.Prompt提示词:用英文写你想要AI生成的内容,不用管语法也不要写长句,仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。

Liblibai简易上手教程

1.定主题:你需要生成一张什么主题、什么风格、表达什么信息的图。(没错我是喜欢看plmm多点)2.选择Checkpoint:按照你需要的主题,找内容贴近的checkpoint。一般我喜欢用模型大佬麦橘、墨幽的系列模型,比如说麦橘写实、麦橘男团、墨幽人造人等等,效果拔群。3.选择lora:在你想要生成的内容基础上,寻找内容重叠的lora,帮助你控制图片效果及质量。可以多看看广场上做得好看的帖子里面,他们都在用什么lora。4.设置VAE:无脑选840000那一串就行。5.CLIP跳过层:设成2就行。6.Prompt提示词:用英文写你想要AI生成的内容,不用管语法也不要写长句,仅使用单词和短语的组合去表达你的需求。单词、短语之间用英文半角逗号隔开即可。7.负向提示词Negative Prompt:用英文写你想要AI避免产生的内容,也是一样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。

Others are asking
我想用gpt4写实习契约,想让它写的有水平一些,该怎么办
以下是一些利用 GPT4 写有水平实习契约的建议: 1. 先确定实习契约的大纲目录,可以参考老师提供的示例或相关模板,也可以用手机识别截图获取。 2. 明确整体的语言风格和特色,比如要求逻辑清晰、层层递进、条理分明。您可以把范文提供给类似 Claude 2 的工具,让其总结语言风格。 3. 详细描述实习契约的各项条款,包括实习的时间、地点、职责、报酬、保密条款等。 4. 注意语言表达的准确性和规范性,避免模糊不清或产生歧义的表述。 需要注意的是,GPT4 有时会产生语法无效或语义不正确的内容,您需要仔细检查和修改。
2024-11-22
我想改变一个图片的风格,要区别于一般的滤镜,例如写实照片变成3D模型的
目前知识库中没有关于将写实照片转变为 3D 模型风格的具体方法和相关内容。但一般来说,要实现这种效果可能需要使用专业的图像处理软件,如 Adobe Photoshop、Blender 等。在这些软件中,可能会涉及到一些复杂的操作,例如建模、材质设置、光照调整等。您也可以尝试使用一些在线的 AI 图像处理工具,部分工具可能具备将照片转换为 3D 风格的功能。不过具体的效果和操作方式可能因工具而异。
2024-08-17
麦橘写实v7
麦橘写实 V7 是由 majicMIX 系列作者开发的 AI 模型,真实系模型世界排名第一。该模型在各大模型平台全面上线,可在 C 站、吐司和 liblib.ai 等平台上下载。V7 模型的发布引起了广泛的关注,许多插画师和设计师都对其进行了试用和评价。 宗 rich 是一位资深游戏美术和神级插画师,他在抖音上分享了自己使用麦橘写实 V7 模型创作的作品。这些作品细节拉满,让人惊叹不已。他的创作过程和心得也在文章中进行了介绍,让读者更好地了解了麦橘写实 V7 模型的特点和应用场景。 此外,文章还介绍了麦橘写实 V7 模型的主题创作活动,鼓励读者一起参与创作,展示自己的才华和创意。同时,文章也提供了麦橘写实 V7 模型的返图欣赏,让读者可以更好地了解该模型的创作效果和应用前景。 总的来说,麦橘写实 V7 是一款非常优秀的 AI 模型,具有很高的真实度和表现力。它的发布为插画师和设计师提供了更多的创作工具和灵感,也为 AI 绘画的发展注入了新的活力。
2024-06-06
Dall·E照片级写实风格提示词
以下是一些可以尝试在 DALLE 中使用的提示词,来生成照片级的写实风格图像: 1. "一张拥有极高分辨率和令人惊艳的细节的照片..." 2. "拍摄于自然光线下,无滤镜,无修饰的写实..." 3. "使用高端相机和镜头拍摄的,能看到每一个毛孔的超高分辨率..." 4. "逼真到仿佛能从画面中嗅到气味的写实风格..." 5. "照片般的写实效果,清晰可见皱纹、纹理和细微表情..." 6. "令人难以区分真实照片与渲染图像的无与伦比的写实画面..." 7. "展现出 的肌肤质感、织物褶皱和光线细节..." 8. "使用热成像相机和光学变焦镜头拍摄的近乎真实的..." 9. "胶片级细节,颗粒感和动态光比的顶尖图像..." 10. "具备媲美 artsation.com 摄影作品般的逼真写实效果..." 这些提示词都强调了写实、细节、分辨率、真实感等关键词,有助于 DALLE 生成出照片般的高分辨率写实图像。你也可以继续探索其他组合,找到最佳的提示方式。
2024-04-18
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
大语言模型、多模态、数据、算力、算法、预训练、微调、RAG、自注意力机制、transformer、token、神经网络、向量、scaling law这些内容的含义
以下是对您所提到的这些内容含义的解释: 大语言模型:是一种基于大量文本数据进行训练的语言处理模型,其工作原理包括训练数据、算力、模型参数等。在训练数据一致的情况下,模型参数越大能力越强。 多模态:指能够处理多种不同类型的数据模态,如文本、图像、音频等,并将它们融合进行理解和生成。 数据:是大语言模型训练和应用的基础,包括各种文本、图像、音频等信息。 算力:指用于支持大语言模型训练和运行的计算能力。 算法:是大语言模型实现各种功能的数学和逻辑方法。 预训练:在大语言模型中,先在大规模数据上进行无特定任务的初步训练。 微调:基于通用大模型,针对特定领域任务提供数据进行学习和调整,以适应特定领域的需求。 RAG:检索增强生成,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。其工作流程包括检索、数据库索引、数据索引、分块、嵌入和创建索引、增强、生成等步骤。 自注意力机制:是 Transformer 架构中的重要部分,能理解上下文和文本关联,通过不断检索和匹配来寻找依赖关系,处理词和词之间的位置组合,预测下一个词的概率。 Transformer:是大语言模型训练架构,用于翻译等任务,具备自注意力机制。 Token:在自然语言处理中,是文本的基本单位。 神经网络:是大语言模型的基础架构,模拟人脑神经元的连接和信息处理方式。 向量:在大语言模型中,用于表示文本等数据的数学形式。 Scaling Law:关于大语言模型规模和性能之间关系的规律。
2025-02-18
大模型产品对比
以下是对一些大模型产品的对比介绍: 智谱清言:由智谱 AI 和清华大学推出,基础模型为 ChatGLM 大模型。2023 年 10 月 27 日,智谱 AI 于 2023 中国计算机大会(CNCC)上推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。 模型特点:在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三。更擅长专业能力,但代码能力有优化空间,知识百科稍显不足,是很有竞争力的大模型。 适合应用:场景广泛,可优先推进在 AI 智能体方面相关的应用,包括任务规划、工具使用及长文本记忆相关场景,在较复杂推理应用上效果不错,也适用于广告文案、文学写作。 其他大模型产品: OpenAI 发布 GPT4 科大讯飞发布星火 1.0 及升级至星火 3.0 百度发布文心一言 1.0 及升级至 V3.5 清华开源 ChatGLM 360 发布 360 智脑 1.0 及升级至智脑 4.0 复旦开源 MOSS 元语开源 ChatYuan 阿里云发布通义千问 1.0 及开源 Qwen7B 商汤科技发布商量 1.0 及升级至商量 2.0、商量 3.0 昆仑万维发布天工 1.0 出门问问发布序列猴子 华为发布盘古 3.0 西湖心辰发布西湖大模型 云从科技发布从容大模型 理想汽车发布 MindGPT OPPO 发布 AndesGPT vivo 发布 BlueLM 小米发布大模型 MiLM 元象科技开源 XVERSE13B Google 发布多模态大模型 Gemini 上海人工智能实验室开源 InternLM20B 百川智能发布 Baichuan2—Turbo 关于大模型在营销方面的应用: 大模型在实体类产品的营销标语生成上表现较好,虚拟类产品相对欠佳。可能是因为大模型训练数据中实体类语料多,更能调用已有知识加工,而虚拟类产品非标准品,大模型认识不足。 情绪价值在营销领域有很多用武之地,除快消商品外,很多产品的营销需要反复沟通,虚拟产品对感性成交依赖更大,大模型在这方面仍有很大发展空间。
2025-02-18
我想创业,花多少钱,能够搭建一个视频领域的AI模型
在视频领域搭建 AI 模型的成本因多种因素而异。对于创业者或小公司来说,这个领域存在一定的挑战。 腾讯的混元 AI 视频模型目前只支持文生视频,且已开源免费。 在模型供应商方面,不同供应商的特点和成本有所不同: 智谱 GLM4V 是通用视觉类大模型,为拍立得最早使用的模型,接口响应速度快,指令灵活性差一些,调用成本为 0.05 元/千 tokens。 阿里云百炼 qwenvlplus 也是通用视觉类大模型,是拍立得目前使用的模型,指令灵活性比较丰富,接口调用入门流程长一些,密钥安全性更高,调用成本为 0.008 元/千 tokens,训练成本为 0.03 元/千 tokens。 阶跃星辰是通用视觉类大模型,响应速度快,支持视频理解,输入成本为 0.005 0.015 元/千 tokens,输出成本为 0.02 0.07 元/千 tokens。 百度 PaddlePaddle 是 OCR 垂直小模型,文本识别能力补齐增强,私有化部署有服务费,API 调用在 0.05 0.1 元/次。 此外,获取高质量数据的难度较高,大厂在该领域的护城河深厚。大公司在争取大模型 API 客户方面更具优势,且开源大模型的发展可能会影响创业公司的业务。去年为大客户定制一个大模型的最高订单额可达 1000 万元,而今年则快速降到了百万元级别乃至更低。
2025-02-18
你的底层大模型用的是哪个?
目前常见的大型语言模型多采用右侧只使用 Decoder 的 Decoderonly 架构,例如我们熟知的 ChatGPT 等。这些架构都是基于谷歌 2017 年发布的论文“attention is all you need”中提出的 Transformer 衍生而来,其中包括 Encoder 和 Decoder 两个结构。 大模型的特点在于: 1. 预训练数据非常大,往往来自互联网上的论文、代码、公开网页等,一般用 TB 级别的数据进行预训练。 2. 参数非常多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。 大模型之所以能有效生成高质量有意义的回答,关键在于“大”。例如 GPT1 的参数规模是 1.5 亿,GPT2 Medium 的参数规模是 3.5 亿,到 GPT3.5 时,参数规模达到惊人的 1750 亿,参数规模的增加实现了量变到质变的突破,“涌现”出惊人的“智能”。 大模型的预训练机制是指其“脑袋”里存储的知识都是预先学习好的,预训练需要花费相当多的时间和算力资源。在没有其他外部帮助的情况下,大模型所知道的知识信息总是不完备且滞后的。
2025-02-18
怎么用大模型构建一个属于我自己的助手
以下是用大模型构建属于自己的助手的几种方法: 1. 在网站上构建: 创建百炼应用获取大模型推理 API 服务: 进入百炼控制台的,在页面右侧点击新增应用,选择智能体应用并创建。 在应用设置页面,模型选择通义千问Plus,其他参数保持默认,也可以输入一些 Prompt 来设置人设。 在页面右侧提问验证模型效果,点击右上角的发布。 获取调用 API 所需的凭证: 在我的应用>应用列表中查看所有百炼应用 ID 并保存到本地。 在顶部导航栏右侧,点击人型图标,点击 APIKEY 进入我的 APIKEY 页面,创建新 APIKEY 并保存到本地。 2. 微信助手构建: 搭建,用于汇聚整合多种大模型接口,并获取白嫖大模型接口的方法。 搭建,作为知识库问答系统,将大模型接入用于回答问题,若不接入微信,搭建完成即可使用其问答界面。 搭建接入微信,配置 FastGpt 将知识库问答系统接入微信,建议先用小号以防封禁风险。 3. 基于 COW 框架构建: COW 是基于大模型搭建的 Chat 机器人框架,可将多模型塞进微信。 基于张梦飞同学的更适合小白的使用教程:。 实现功能包括打造属于自己的 ChatBot(文本对话、文件总结、链接访问、联网搜索、图片识别、AI 画图等)、常用开源插件的安装应用。 注意事项: 微信端因非常规使用有封号危险,不建议主力微信号接入。 只探讨操作步骤,请依法合规使用。 大模型生成的内容注意甄别,确保操作符合法律法规要求。 禁止用于非法目的,处理敏感或个人隐私数据时注意脱敏,以防滥用或泄露。 支持多平台接入,如微信、企业微信、公众号、飞书、钉钉等。 支持多模型选择,如 GPT3.5/GPT4.0/Claude/文心一言/讯飞星火/通义千问/Gemini/GLM4/LinkAI 等。 支持多消息类型,能处理文本、语音和图片,以及基于自有知识库进行定制的企业智能客服功能。 支持多部署方法,如本地运行、服务器运行、Docker 的方式。
2025-02-17