Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我想用AI生成一个固定形象

Answer

以下是关于生成固定形象的一些方法和示例:

  • AI 女友麦洛薇
    • 人设固定:通过保存包含知识图谱信息的 json 文件在本地来控制人设,实现不会忘记基本特征及与他人或事的关系,适合创造动漫或游戏角色。接入飞书后,对其基本信息提问能准确回答。
    • 永久记忆:与麦洛薇对话时,她会学习未知信息,将其抽取实体和关系存入知识图谱,保证不会因上下文窗口不足而溢出,能从知识图谱提取被丢弃的记忆。
  • SD 中绘制一致性多角度头像
    • 实现角色一致性的最佳方法是使用 LoRA,但训练 LoRA 需至少 15 - 20 张图片的训练集。
    • 准备工作:准备一张人物的多角度图片,尺寸设置为 1328×800px,放大两倍后保证每张小图为 512×512px,加上网格图,设置 controlnet 等。
  • 7 大方向生成 AI 人物形象
    • 人物服装选择:可使用万能固定句式「主题」+「风格」+「材质」+「元素」+「玄学佐料」,如“Chinese dress”的示例,通过添加材质装饰细节可使服装更精致。
Content generated by AI large model, please carefully verify (powered by aily)

References

AI 女友麦洛薇(0 代码 comfyui 搭建,知识图谱稳定人设,无限上下文,永久记忆,可接入飞书)

下面,我将从人设固定、永久记忆、多模态这三个方面来演示AI女友麦洛薇的效果。[heading2]1、人设固定[content]为了稳定人设,需要先将一个包含知识图谱信息的json文件保存在本地。人设的稳定就是依靠这个知识图谱来控制人设,从而达成不会忘记自己的基本特征,以及与其他人或事之间关系的效果。非常适合用来创造动漫或游戏角色,绕开微调获得稳定的人设。以下是给AI女友麦洛薇设定的人设:通过接入飞书的节点,将麦洛薇部署到飞书后,对她的基本信息提问,可以准确的回答出自己的人设。这是通过用户提问获取相关的实体和关系,从人设的知识图谱上获取精确信息,以实现这一功能。[heading2]2、永久记忆[content]与麦洛薇对话时,对于她不知道的信息,她会加以学习,所谓学习,就是将用户信息抽取出实体和关系,存入知识图谱中。通过只返回最近的对话轮次到上下文中,就可以保证不会因为上下文窗口不足而溢出,又因为有知识图谱的加入,保证了被丢弃的记忆可以从知识图谱这一永久记忆中提取出来。当我将我的名字以及关于我的信息告知麦洛薇时,麦洛薇就会修改知识图谱,真正的记住了我说的话。可以看到本地的json文件里已经多了一条关于ailm相关的信息。完美地实现了永久记忆的功能。

【SD】角色设计的福音!绘制一致性多角度头像

作者:白马少年介绍:SD实践派,出品精细教程发布时间:2023-09-22 19:00原文网址:https://mp.weixin.qq.com/s/uUPX5w25rNwKNjdVO6J81w如何让我们在SD中绘制的角色保持一致,这是人们长久以来在探索AI绘画的领域当中一直寻求解决的问题。目前来看,实现这个目标最好的方法就是使用LoRA。但是要训练一个LoRA,我们首先要至少有一个15到20张图片的训练集。在一个固定的形象中,最重要的是面部五官,其次是体型、服装、配饰之类的。所以,我们在收集训练集的过程当中,收集形象的头部图片是很重要的。现实中的人物我们可以通过照片来进行训练,但如果是我们在AI中生成的虚构角色呢?我们就要让这个虚构角色能稳定输出多张不同角度的图片才能达到训练集的要求。今天,我们就来学习一下,如何创建一个虚构人物的多视图角色表。[heading1]#01[heading1]准备工作[content]首先,我们要准备一张人物的多角度图片。这张图一共有15个不同的视图,它的主要作用是可以使用openpose来控制形象的面部角度。尺寸设置的是1328×800px,这样的话,当我们放大两倍之后就能保证每张小图都是512×512px。【一个小知识:稳定扩散输出尺寸必须能被8整除。这个工作表的设置方式是由8像素的分割线和256×256像素的图像组成。】再加上一个网格图,通过lineart来分割不同的块面。接下来,我们来设置controlnet,第一张图选择openpose_face,得到人物的15个面部角度。第二张图选择lineart_standard(from white bg&black line),可以得到清晰的表格分区。为了让小图模式下的人脸不会崩坏,我们可以在增加一个ADetailer的脸部修复插件。

7大方向快速生成合心意的AI人物形象

服装要想玩的细致,也是需要了解很多服装相关的知识点,不过这里可以使用一个万能固定句式来尝试「主题」+「风格」+「材质」+「元素」+「玄学佐料」主题:汉服、长羽绒服、连衣裙、礼服裙...风格:简约、现代、复古、朋克、英伦亚文化、文艺复兴、洛可可、超现实主义...材质:棉布、羊毛、丝绸、皮革、工艺...元素:形状、纹理、颜色、细节、图案、配件...感觉要学习的知识有好多好多....服装示例咒语关键词:Chinese dress生成思路:一个穿着中国清代宫廷刺绣旗袍,宽袖渐变红色加上刺绣雪纺面料,镶钻工艺,上面还有金丝雀和白玫瑰元素等刺绣元素咒语:1 girl,she was wearing a Chinese dress,wide sleeves gradient red x embroidered chiffon fabric,qing dynasty palace embroidery,canary and white roses element,embroidered hosta,x diamond-encrusted craftsmanship,elegant,fairy air,digital rendering,super lifelike,super detailed,luxury,movie lighting,super clear details,super clear materials,close-up,complex textures,octane rendering,Zbrush,8K,Vray super lifelike,--ar 9:16前面4张只使用了Chinese dress生成后,服装比较素也没有颜色,服装的细节也比较少。后面2张添加了材质装饰细节之后,服装就比较精致。大家可以通过这个万能的固定句式去尝试一下关于服装的细节。

Others are asking
P图的AI
以下是关于 P 图的 AI 相关信息: Adobe Photoshop 推出了新的更新,提供了更快的速度、更强的功能和更高的精度。改进了核心成像和设计工作流程,包括自动消除图像中常见干扰以及将 3D 模型引入 2D 设计的功能,还扩展了生成式 AI 功能以加速和丰富构思及资产生产。同时,开发过程中负责任并始终尊重创作者的权利。您可以通过了解更多。 无界 AI 网址为:https://www.wujieai.cc/ ,新用户扫码注册可领取积分。基础关键词包括女生和男生的相关描述,还有关键词分类,如人物、环境、光照、画幅视角、画质提升和画面风格等方面的详细内容。
2025-02-19
普通人怎么开展ai应用层的创业
对于普通人开展 AI 应用层的创业,以下是一些建议和分析: 1. 基础设施层:布局投入确定性强,但资金需求巨大,入行资源门槛高,未来更多由“国家队”负责。普通人若无强资源,应谨慎入局,可考虑“合作生态”的切入机会。 2. 技术层:处于技术爆炸期,迭代速度极快。若团队规模不大,需慎重考虑技术迭代风险。基础通用大模型研发烧钱且竞争激烈,非巨无霸公司不建议考虑。 3. 应用层:是一片广阔蓝海,当前从业者增加,虽有相关产品涌现,但成熟应用和“杀手级”应用较少,对于普通个体和小团队,强烈推荐重点思考和布局,拥有超级机会和巨大发展空间。 在应用层创业的具体方向上,比如智能体领域: 智能体可以简单理解为 AI 机器人小助手,类似移动互联网中的 APP 应用。 有很多公司已关注 AI 应用层的产品机会,如在 C 端,有社交方向的用户注册后先捏自己的 Agent 再聊天等有趣场景;在 B 端,有帮助商家搭建 Agent 的机会。 国内有众多智能体开发平台,如字节的扣子、腾讯的元器、Dify.AI 等。
2025-02-19
目前市面上免费的生成图片的AI工具有哪些?
目前市面上免费的生成图片的 AI 工具主要有以下几种: 1. 文生图工具: DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真图片。 StableDiffusion:开源工具,可生成高质量图片,支持多种模型和算法。 MidJourney:因高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 您可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 2. 图生图工具: Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感,丰富创作过程。 Retrato:将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具有细节的全新视觉作品。 Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,将上传的照片转换为芭比风格,效果好。 3. 图片生成 3D 建模工具: Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型。 Meshy:支持文本生成 3D、图片生成 3D 以及 AI 材质生成。 CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象,再转换为 3D 模型。 Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域的模型生成。 VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供多种功能。 需要注意的是,这些工具可能存在一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。内容由 AI 大模型生成,请仔细甄别。
2025-02-19
普通人和小企业在大企业垄断的ai时代该如何破局
在大企业垄断的 AI 时代,普通人和小企业可以考虑以下破局方式: 1. 对于普通人: 关注并参与关于在 AGI 降临的世界中个体如何生存、创造价值以及新的分配方式的思考、讨论和争取。 2. 对于小企业: 利用欧盟的相关政策,如监管沙盒等措施降低合规成本,促进科技创新。具体包括制约单方面强加给中小企业和初创企业的不公平合同条款,采取规制格式合同的方式使显著不公平的条款无效,促进监管沙盒广泛而平等的参与,并减免参加费用和提供部署前服务等增值服务,适当降低评估费用或其他合规要求,在处罚规定中考虑中小企业的利益和经济活力,相关准则的制定充分考虑中小企业需求以降低合规负担。 在 AI 产业链中,应用层存在超级机会和巨大发展空间,小企业可以重点思考和布局应用层。但基础设施层入行资源门槛较高,需谨慎入局,可考虑“合作生态”的切入机会;技术层迭代速度快,规模不大的团队须慎重考虑“技术迭代风险”,基础的通用大模型非巨无霸公司不建议考虑。
2025-02-19
零基础学习ai
以下是为零基础学习 AI 提供的建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 知识库提供了很多实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,还有一个案例供您参考:二师兄来自上海,是典型的 80 后,房地产行业从业二十年,计算机零基础。2024 年 2 月,他在七彩虹的售后群中,因老哥分享用 AI 绘画的心得,要了 SD 秋叶安装包,下载了教学视频,迈出了 AI 学习的第一步。之后他不断学习和实践,如在 3 月啃完 SD 的所有教程并开始炼丹,4 月与小伙伴探讨 AI 变现途径,5 月加入 Prompt battle 社群,开始 Midjourney 的学习。
2025-02-18
AI数据分析
以下是关于 AI 数据分析的相关内容: ChatGPT 助力数据分析: 本文重点介绍了 AI 与数据分析结合的应用,通过实际案例与相关技巧,描述了 ChatGPT 如何助力数据分析。 实现了两种方式支持多维数据分析: SQL 分析:分析平台自身使用情况,输入一句话可分析用户配置图表相关数据。用户描述想分析的内容,后台连接 DB,附带表结构信息让 AI 输出 SQL 语句,校验为 SELECT 类型后执行返回结果数据,再传给 GPT 分析,最后输出分析结论和建议并返回前端页面渲染图表。 个性化分析:平台支持上传数据,可提供数据信息辅助分析,前端解析文件后传给 GPT 分析,后续步骤与 SQL 分析一致。 分析完成后展示结果数据的图表和分析结论,图表支持折线图和柱状图可随意切换。 生成式 AI 季度数据报告 2024 月 1 3 月: 作者包括郎瀚威 Will、张蔚 WeitoAGI、江志桐 Clara 等。 报告涵盖总体流量概览、分类榜单、文字相关(个人生产力、营销、教育、社交)、创意相关(图像、视频)、音频大类、代码大类、Agent、B2B 垂类等方面。 涉及数据准备、分类标准图谱准备、赛道分析、竞争分析等内容。
2025-02-18
提示词生成
以下是关于提示词生成的相关内容: ComfyUI 中的提示词生成: 在 ComfyUI 里使用 MiniCPM 做图片提示词反推与文本提示词生成,可以和 flux 模型配合生成图片。建议使用量化版本的模型(int4 结尾)以节省显存。 安装方法: 1. 进入 ComfyUI 自定义节点目录。 2. 克隆相关仓库。 3. 重启 ComfyUI。 模型网盘:https://pan.quark.cn/s/00b3b6fcd6ca ,下载后放入 ComfyUI 的 models 文件夹下 MiniCPM 文件夹中,没有就新建一个。 “城市狂想”中的图片提示词生成: 为大家提供了猫叔之前写的一段提示词的 prompt,生成了三条 prompt,如: 1. 远景,三分法构图,俯视视角,数字绘画,云雾缭绕的山谷,群山连绵起伏,山谷间云雾缭绕,阳光透过云层洒在山间,形成光与影的对比,模拟观众的视线逐渐接近这片土地,新印象派风格特征,使用数字画笔和渐变工具ar 16:9v 6.1 2. 远景,中心对称构图,俯视视角,摄影风格,云雾中的山谷,山峦在云雾中若隐若现,山谷中隐约可见的河流蜿蜒流淌,云雾的流动感和山的静态形成对比,现实主义风格特征,使用长焦镜头和景深控制技术ar 3:2v 6.1 3. 远景,对角线构图,俯视视角,水墨画风格,云雾缭绕的山谷,山峦线条流畅,云雾以墨色深浅表现,山谷中的云雾仿佛在流动,给人以动态的视觉感受,中国山水画风格特征,使用毛笔和水墨渲染技术ar 2:3v 6.1 同时为大家直接生成了 1 组共 12 段提示词,使用时需注意,如果在其他平台的工具中使用,请复制后删除包含“”以后的部分。 艺术字生成: 模型选择图片 2.1,输入提示词(可以直接参考案例提示词)。 案例参考: 1. 金色立体书法,”立冬“,字体上覆盖着积雪,雪山背景,冬季场景,冰雪覆盖,枯树点缀,柔和光影,梦幻意境,温暖与寒冷对比,静谧氛围,传统文化,唯美中国风 2. 巨大的春联,金色的书法字体,线条流畅,艺术美感,“万事如意” 3. 巨大的字体,书法字体,线条流畅,艺术美感,“书法”二字突出,沉稳,大气,背景是水墨画 4. 巨大的奶白色字体”柔软“,字体使用毛绒材质,立在厚厚的毛绒面料上,背景是蓝天 原文链接:https://mp.weixin.qq.com/s/jTMFYKxsN8dYNZu3VHKBnA
2025-02-19
可以自动生成PPT的工具
以下是一些可以自动生成 PPT 的工具: 1. WonderGPT:把颜值和交互体验做到极致,简单而美观。网址:https://wondergpt.co/ 2. StabilityGPT:在 GPT4 中运行 Stable Diffusion,作者做了一个 ChatGPT 插件,可以在 ChatGPT 发出提示词后返回 SD 生成的图像,能与 ChatGPT 原有的能力深度结合。 3. Graph Maker:上传数据之后通过自然语言对数据内容进行分析输出结果,包括生成可视化的图表分析。网址:https://www.graphma 4. Coda AI:Coda 发布的 AI 能力,在帮助写文档润色内容方面和 Notion 差不多,强大的功能是能够获取跟 Coda 链接的很多应用里的数据进行整合和分析甚至联动。网址:https://coda.io/prod 5. Motion Go:国产工具,原来是做 PPT 附加插件的,现在可以通过自然语言自动生成 PPT 页面和对应内容智能增加动画。网址:https://motion.yooai.com 6. Triple whale:AI 电商助手,支持广告的数据监测,创意数据的跟踪和分析、跟踪和管理与 KOL 的营销活动,AI 整合分析进行异常检测并给出建议。网址:https://www.triplewhale.com/ 7. Prompt Storm:ChatGPT 提示词浏览器扩展,一个简单易用的谷歌浏览器扩展。网址:https://promptstorm 此外,使用 Process ON 自动生成 PPT 的思路和步骤如下: 网址:https://www.processon.com/ 输入大纲和要点: 导入大纲和要点: 手动复制,相对较耗时间。 导入方式: 复制最终大纲内容到本地 txt 文件,将后缀改为.md。若看不见后缀,自行搜索开启后缀。 打开 Xmind 软件,将 md 文件导入 Xmind 文件中。 在 Process ON 导入 Xmind 文件。 输入主题自动生成大纲和要求:新增思维导图,输入主题,点击 AI 帮我创作。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版再点击下载。若喜欢用 Process ON 且没有会员,可在某宝买一天会员。
2025-02-19
找一个能够生成音乐的AI。我给一个曲名(比如《生日快乐歌》),他就能给我生成不同风格的音乐供我下载。
以下为您推荐能够根据给定曲名生成不同风格音乐并供下载的 AI 工具: 1. Suno AI: 地址:https://www.suno.ai/ 简介:被誉为音乐界的 ChatGPT,能够根据简单提示创造出从歌词到人声和配器的完整音乐作品。 账号要求:需要拥有 Discord、谷歌或微软中的至少一个账号,并确保网络环境稳定。 订阅信息: 免费用户每天 50 积分,每首歌消耗 5 积分,每天可创作 10 首歌曲,每次点击生成两首歌曲。 Pro 用户每月 2500 点数(大约 500 首歌),按月每月 10 美元,按年每月 8 美元,每年 96 美元。 Premier 用户每月 10000 点数(大约 2000 首歌),按月每月 30 美元,按年每月 24 美元,每年 288 美元。 操作模式: 默认模式:包括关闭个性化、歌曲描述、乐器开关、模型选择 v3 等设置。 个性化模式:开启个性化定制,可填写歌词、曲风、标题等。 生成歌词:可使用大模型如 Kimi、GPT、文心一言等生成。 开始生成:填写好所需内容后点击 Create,等待 2 3 分钟即可。 下载:生成后可下载。 2. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。地址:https://www.udio.com/ 3. YuE:支持从歌词生成 5 分钟高质量音乐(含人声与伴奏),多语言支持(中、英、日、韩),覆盖多种音乐风格与专业声乐技术。详细介绍:https://www.xiaohu.ai/c/xiaohuai/yue5
2025-02-18
请介绍一下如何使用AI进行PPT生成
以下是使用 AI 进行 PPT 生成的方法: 1. 利用闪击: 访问国内网站 https://ppt.isheji.com/?code=ysslhaqllp&as=invite ,无需魔法。 选择模板。 将准备的大纲转换成适配闪击的语法,可参考官方使用指南:https://zhuanlan.zhihu.com/p/607583650 。 点击文本转 PPT,并在提示框中选择确定,得到转换后的 PPT。 可在线编辑,但导出有会员限制。 2. 以爱设计为例: 导入大纲到工具生成 PPT,其他工具操作方式大同小异,基本基于 Markdown 语法的内容来完成 PPT 生成。 优化整体结构,按照公司要求自行优化字体、图片等元素,针对下载后的 PPT 可删改内容。 3. 结合 GPT4、WPS AI 和 chatPPT: 先让 GPT4 生成 PPT 大纲。 把大纲导入到 WPS 当中,启用 WPS AI 一键生成 PPT。 让 chatPPT 添加一些动画。 手动修改细节,如字体、事实性错误等。
2025-02-18
生成视频不受提示词控制怎么办
如果生成视频不受提示词控制,可以考虑以下方法: 1. 向提示添加其他描述符,以便更好地控制生成的视频内容,例如: 电影摄影术语,如浅景深、胶片拍摄和电影。 构图术语,如广角、特写、从上方拍摄和从下方拍摄。 照明术语,如背光、柔光和硬光等。 颜色分级术语,如饱和色、高对比度以及暖色调或冷色调。 情绪或语气术语,如 somber、tense、euphoric 和 mysterious。 摄像机移动术语,如向右或向左平移、向上或向下倾斜以及推拉或向外移动。 2. 对于海螺 AI: MiniMax 视频模型不仅可以准确识别用户上传的图片,并确保所生成视频在形象保持上与原输入图像高度一致,且光影、色调完美嵌入新场景的设定,为创作者提供连贯、深度创作的空间。 在指令响应方面,还能理解超出图片内容之外的文本,解构指令框架和深层语义并在视频生成中整合,实现“所写即所见”。 只依靠模型综合能力,就能实现最顶级的影视特效。 人物表情控制力强,5 秒钟内实现从开怀大笑到掩面哭泣,让视频表达更能深入人心。 近期,海螺 AI 视频同步上线了提示词优化功能,即使在大家对特定的构图、氛围、动作或运镜没有特殊指定要求时,建议开启此功能,聪明的海螺 AI 会结合原始 Prompt 扩展视频的美学呈现。同时,对于更专业的创作者,开放 2000 字的提示词空间,让创作更加精准。 3. 使用 Camera Motion 时: 点击“AddImage”上传图片。 在“Prompt”中输入提示词。 选择您想要的运镜方向,输入。 运动幅度和画面主体运动幅度有关,与运镜大小无关,可以设置成您想要的任意值。 选择好种子(seed),是否高清(HD Quality),是否去除水印(Remove Watermark)。 点击“create”,生成视频。
2025-02-18
图生图, 如何保持幻想生物形象一致性
要在图生图中保持幻想生物形象的一致性,可以参考以下方法: 1. 对于 Midjourney ,可以采用特定的名人或有特殊属性的人物形象,先确定好影片风格,比如皮克斯动画风格,然后确定好人物形象,如角色的发型、穿着等细节。 2. 利用 Midjourney 的新功能 Cref ,先跑一张主角的定妆照,在需要出现主角人物的地方扔进去 Cref ,以保持发型、人脸、衣服等的一致性。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性,尤其是亚洲老人的一致性效果相对较差,且 Cref 在画面的审美和构图上有一定的破坏性,所以原则上能不用就不用,比如只有背影时,简单描述即可。 3. 生成动物形象,动物相对更容易保持一致性。
2025-02-14
图生图, 如何保持生物形象一致性
在图生图中保持生物形象一致性,有以下几种方法: 1. 对于人物和场景一致性问题,可以采用生成动物的方式,动物相对容易保持一致性。 2. 选择特定的名人或具有特殊属性的人物。 3. 确定好影片风格,如皮克斯动画风格。 4. 先确定好人物形象,如明确角色的发型、穿着等特征。 5. 使用 Midjourney 的新功能 Cref,在需要出现主角人物的地方,保持发型、人脸、衣服等特征。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性效果相对较差,尤其对于亚洲老人,而且 Cref 在画面的审美和构图上有一定破坏性,原则上能不用则不用。例如只有背影时,简单描述特征即可。
2025-02-14
基于参考图片人物形象生成指定迪士尼风格的图片
以下是关于基于参考图片人物形象生成指定迪士尼风格图片的相关内容: 在 Midjourney 中,生成指定迪士尼风格的图片可以通过以下方式: 1. 角色参考(cref):cref 的功能是保持图像角色的一致性。使用方法是在提示后添加 cref,并紧接着指向人物参考图像的 URL。您可以使用 cw 来调整参考图像对生成的图像的影响程度,数值范围从 0 到 100。 2. 风格参考(sref):sref 的功能是生成类似风格的图片,保持画风的一致性。使用方法是在提示后添加 sref,并紧接着指向风格参考图像的 URL。您可以使用 sw 来调整参考风格对生成的图像的影响程度,数值范围从 0 到 1000。 如果想引用一张图,但只是把它作为新图的一部分,可以使用 sref 或 cref,并通过调整 sw 或 cw 的值来控制引用图像的影响程度。 生成一张 Disney 风格的头像的具体步骤如下: 1. 选一张比较满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,然后在聊天框发送(记得点击回车或发送按钮)。 2. 图片会上传到服务器并生成一张唯一的链接,点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,复制下来。 3. 使用这个链接加 prompt 提示词来发送给 Midjourney,Midjourney 会根据需求生成特定的图片,这就是 Midjourney 的以图绘图。 此外,在生成 3D 效果图时,如生成可爱的拟人小鹿角色,可以在即梦图片生成界面中导入参考图,参考选项为参考轮廓边缘,生图模型选择 图片 2.0,输入包含角色、细节描述、场景、风格材质等的提示词,生成图片。
2025-02-12
我想用自己训练的卡通形象lora生成一张元宵节放孔明灯的海报,应该怎么制作
以下是用自己训练的卡通形象 lora 生成元宵节放孔明灯海报的制作方法: 1. 关键词: 模型:dreamshaper_8 正关键词:,white,white_background,CGposterrender bsw <lora:电商新年海报 2024_v1.0:0.4>,gold,<lora:新年红包封面_v1.0:0.6>,new year,<lora:gcbottle:0.3> 中文的关键词:(杰作,高分辨率,高品质,高分辨率)中国建筑,红色主题,剪纸,中国结,纸灯笼,中国图案,金色,中国元素,红色背景 2. ControlNet 设置: 预处理器:depth_leres 模型:control_v11f1p_sd15_depth 权重:0.75 预处理器:softedge_pidinet 模型:control_v11p_sd15_softedge 权重:0.3 3. lora 资源: https://www.liblib.ai/modelinfo/bddf824e232f4124991c05a26027504d https://www.liblib.ai/modelinfo/983703dd48134e43983b84abfcb44308 第三个东方瓷器 lora 已经下架(请至 AGI 之路百度云下载) 链接:https://pan.baidu.com/s/10hYM8i2y2Li9OlT2oD1qOQ 密码:asub 您可以参考以上步骤进行制作,同时您还可以访问以下链接获取更多相关信息: 作者小红书:https://www.xiaohongshu.com/user/profile/5cfd0e600000000016029764?wechatWid=803c253b00ed4224d3a2adcd80b46ed7&wechatOrigin=menu 通往 AGI 之路小红书教程:http://xhslink.com/OOeHsy AI 春晚阶段性纪实:https://waytoagi.feishu.cn/wiki/MI0UwhfXJiRH9ak4dwxcwqPVnIh
2025-02-08
如何用自己的形象做卡通数字人?
以下是用自己的形象做卡通数字人的方法: 1. 简单提示词方法: 在聊天窗口输入/imainge找到/imagine prompt,然后把刚才的链接放进去,然后空格。 加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数。 设置参数: iw 1.5是设置参考图片的权重,数值越高与参考的图片越接近,默认是0.5,最大是2,可选择中间的某个值并调整。 s 500设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为01000间任意整数。 v 5是指用midjourney的第5代版本,这一代的最真实,目前v5需要订阅付费,不想付费可以使用v 4。 no glasses是指不戴眼镜,如果你不喜欢戴眼镜的图片,可以戴上这个设置,让它不戴眼镜。 完整的提示词如下simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5。如果对生成的效果不满意,可以调整s和iw的值来进行多次尝试。 2. 剪映生成数字人方法: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。 选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。剪映App会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。 左下角会提示渲染何时完成,然后可点击预览按钮查看生成的数字人效果。 增加背景图片: 直接删除先前导入的文本内容,因为视频中的音频已包含文字内容。 鼠标点击下方代表文字的轨道,或点击软件中间文字内容,按删除键删去文字。 点击左上角的“媒体”菜单,并点击“导入”按钮,选择本地的一张图片上传。 选择一张图片上传,点击图片右下角的加号,将图片添加到视频的轨道上(会覆盖数字人)。 书架图片所在的轨道会在视频轨道的下面添加一条新轨道。 点击轨道最右侧的竖线,向右拖拽,直到视频的最后,与视频对齐。 背景图片所在的轨道若没选中,鼠标点击一下这个轨道即可。 在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口,并将数字人拖动到合适的位置。 3. 复杂提示词方法: 如果觉得简单提示词生成效果不好,可以选择更为复杂一点的提示词,比如:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5。 不同照片生成:如果对照片风格不满意,可以换一张新的照片使用上面的提示词重新生成。 其他调整:如果觉得Disney风格的头像太过卡通,可以把提示词里面的Disney都换成Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的boy换成girl。每次会生成4张图片,如果对某一张图片满意,点击下方的U1~U4生成大图,如果对风格满意但是需要调整,点击下方的V1~V4进行修改。
2025-02-07
设计虚拟形象的
以下是关于设计虚拟形象的相关内容: 品牌虚拟代言人: 品牌自建虚拟代言人的原因:明星代言存在风险,如塌房、受《广告法》约束、代言多个产品导致消费者心智混乱等。 虚拟代言人的优势:成本低,行为和说话可控,可扩展性强,可定制性高,可追踪性好。 虚拟代言人的劣势:影响力相对明星代言人较弱,从出道到产生影响力需要漫长积累过程。 自建虚拟人的方式:有的基于传统品牌虚拟形象革新,如海尔的“海尔兄弟”、肯德基的“山德士上校”;有的基于真人偶像形象设计,如天猫的“千喵”、聚划算的“刘一刀”;有的创建全新的虚拟代言人,如屈臣氏的“屈晨曦 Willson”、欧莱雅的“M 姐”、SKII 的“Yumi”等。 品牌代言人:品牌代言人是企业为影响消费者购买行为聘请或塑造的有魅力的人,消费者会因对代言人的喜爱延伸到产品和品牌。但明星塌房事件让品牌选择明星代言有所顾虑,不少品牌开始与虚拟偶像合作或自建虚拟代言人。 用 AI 制作可动交互虚拟形象(支持面捕): MidJourney 生成形象设计:包括初步生成,一边尝试一边修改关键词,选择中意的形象精修,使用 PS 对图像进行处理(如调整颜色、抠图、锐化、优化细节),使用 PS 制作海报底图(异兽名字+原文简介)。 需要注意的是,虚拟形象的核心是内容,企业需要有持续创作优质内容的能力,否则打造虚拟形象的意义不大。
2025-01-04
我想要做一个ai工具,针对电子元器件行业,我来提供专业术语翻译的知识库和固定描述语句翻译方法,希望上传中文PDF后,可以下载一个翻译好的PDF,0编程基础应该怎么做呢
对于您这种没有编程基础但想要制作针对电子元器件行业的 AI 工具来实现中文 PDF 上传并下载翻译好的 PDF 的需求,以下是一些建议: 首先,您需要学习一些基本的 AI 概念和技术知识,了解自然语言处理(NLP)的基本原理。 其次,可以考虑使用现有的无代码或低代码 AI 开发平台。这些平台通常具有可视化的界面和易于操作的工具,能够帮助您在不编写代码的情况下构建简单的 AI 应用。 然后,针对您的专业术语翻译需求,需要对电子元器件行业的术语进行系统整理和分类,建立一个清晰的术语库。 同时,确定固定描述语句的翻译规则和方法,并将其转化为可在 AI 工具中应用的逻辑。 在实施过程中,要不断测试和优化您的工具,以确保翻译的准确性和质量。 总之,虽然没有编程基础会增加一定的难度,但通过合理利用现有资源和持续学习,您是有可能实现这个目标的。
2025-01-04
我想要做一个ai工具,针对电子元器件行业,我来提供专业术语翻译的知识库和固定描述语句翻译方法,希望上传中文PDF后,可以下载一个翻译好的PDF
目前针对您想要针对电子元器件行业制作一个能上传中文 PDF 并下载翻译好的 PDF 的 AI 工具的需求,暂时没有相关的现成内容和方法。但您可以考虑以下步骤来实现这一目标: 1. 数据准备:收集和整理电子元器件行业的专业术语、固定描述语句以及对应的翻译,构建一个丰富准确的知识库。 2. 选择合适的技术:例如自然语言处理技术和机器翻译算法,以实现对中文 PDF 的翻译。 3. 开发工具界面:设计一个用户友好的界面,方便用户上传中文 PDF 和下载翻译后的 PDF。 4. 测试和优化:对工具进行充分的测试,根据测试结果不断优化翻译的准确性和工具的性能。 这是一个较为复杂的项目,需要一定的技术和资源投入,但如果成功实现,将为电子元器件行业带来很大的便利。
2025-01-04
如何创建一个固定AI聊天机器人
要创建一个固定 AI 聊天机器人,您可以按照以下步骤进行: 一、纯 GPT 大模型能力的微信聊天机器人搭建 (一)疑问解答 1. 宝塔面板提供了图形化的管理界面,操作简单直观,许多常见任务都可以通过点击按钮完成。 2. 丰富的在线资源:宝塔面板和 Docker 都有详细的官方文档和教程,您可以随时查阅。 3. 极简未来平台的支持:极简未来平台也提供了详细的操作指南和技术支持,遇到问题可以查阅官方文档或寻求帮助。 4. 社群和论坛:加入相关的技术社群或论坛,向有经验的用户请教,也是一个很好的学习途径。 5. 定期备份和监控:设置定期备份和监控,确保在出现问题时可以及时恢复。 如果遇到问题,可以采取以下几种方式来解决: 1. 查阅官方文档和教程:极简未来平台、宝塔面板和 Docker 都有详细的官方文档和教程,可以帮助解决大部分问题。 2. 联系技术支持:极简未来平台提供技术支持服务,可以联系平台的技术团队寻求帮助。 3. 加入技术社群:加入相关的技术社群,向有经验的用户请教,获取问题的解决方案。 4. 在线论坛和社区:在在线论坛和社区发布问题,寻求其他用户的帮助和建议。 为了避免长时间不操作后忘记步骤,可以采取以下措施: 1. 制作操作手册:将每一步的操作记录下来,制作成操作手册,方便日后查阅。 2. 定期操作:定期登录服务器,进行简单的操作和维护,保持熟练度。 3. 视频教程:可以录制自己的操作视频,作为教程,日后查看时更直观。 4. 自动化脚本:对于一些常见的运维任务,可以编写自动化脚本,简化操作步骤。 (二)开始搭建 1. 配置腾讯云轻量应用服务器 (1)配置部署 COW 组件 重点来了,在刚刚复制的 dockercompose.yml 文件中,我们需要修改一下里面的具体配置来串联我们的微信号和平台上已创建好的 AI 机器人。这个配置的参考官方来源是这里:https://docs.linkai.tech/cow/quickstart/config,当然我把主要的配置解释先给大家看一下: 从配置参数解释可以看到,其实配置里面的每个参考的名称的全大写描述,比如 open_ai_api_key 对应编排模板的 OPEN_AI_API_KEY,model 对应编排模板的 MODEL,以此类推我们就可以在编排模板去配置具体的配置参数了。所以以下是我们最新的容器编排模板的配置参数(里面有'{{中文描述}}'的请大家替换为前面让大家预留好的对应值): 这里要留意下,在私聊或者群上交流时,最好都是需要加上一些前缀才触发机器人回复,比如我这里配置的是,即对应的配置参数 SINGLE_CHAT_PREFIX,你在私聊或者群里发消息,必须要包含 bot 或者@bot 才会触发机器人回复。在群组里,对应配置参数是 GROUP_CHAT_PREFIX,机器人只会回复群里包含@bot 的消息。 还有这个参数 GROUP_NAME_WHITE_LIST,它是用来配置哪些群组的消息需要自动回复的,比如我这里配置的是,即只有 ChatGPT 测试群和 ChatGPT 测试群 2 的群组消息才会自动回复。 (2)开放宝塔服务访问 从上图中可以看到,默认部署成功的服务器以及宝塔服务,它监听这 8888 端口作为自己的 Web UI 服务,我们需要将这个端口放行到公网上,这样才能让我们自己通过公网访问到宝塔服务。这句话对于小白来说可能有点难理解,我这里再给大家解释一下: 什么是端口: 计算机和服务器像是邮局,有很多不同的邮筒(端口)。 每个邮筒(端口)用于不同的信件类型(服务)。 例如,邮筒 80 号常用于网页浏览,而 8888 号在这里用来访问宝塔服务。 监听端口: 当我们说宝塔监听 8888 端口,意思是宝塔在这个邮筒里收发信息。 宝塔会通过 8888 端口接收你的指令,并返回结果。 公网访问: 服务器默认会保护自己,不让外部随便访问。 要让你的电脑通过互联网访问服务器上的宝塔服务,需要告诉服务器“开放”8888 号邮筒。 放行端口: 放行端口就像给邮筒一个“公开访问”的标志,允许互联网用户通过这个端口访问宝塔。 您需要在服务器的防火墙(保护罩)上设置规则,允许 8888 端口的连接。 现在我们要在服务器的防火墙上设置规则,允许 8888 号端口的连接。点击防火墙标签,然后点击添加规则添加以下这条规则: 防火墙规则添加成功后,我们就可以通过刚刚保存的公网地址访问到宝塔服务了,记得把刚刚获取到的宝塔管理员用户名和密码填入登录界面,就可以进入到宝塔的管理界面了。
2025-01-02
帮我找一个可以生成固定画风人物的漫画网站
以下为您提供一些与生成固定画风人物漫画相关的信息: 生成图可使用 GPT 进行辅助,在提示词里改其状态,如很生气、砸电话等,还可通过抽卡找一致性高的角色和服装,或用服装描述来找出一致性最高的。主要改其情绪,如高兴、兴奋等,也可增加一些小变化,如生气时是晚上。 常见的风格提示词有:gothic 哥特式、Ukiyoe 日本浮世绘风格、Traditional Chinese painting 中国国画、coil painting 油画、realism 现实主义、film noir 黑暗风格、water colour painting 水彩画等众多风格。 在垫图方面,如黄色划线部分为简单人物描写。红色划线部分利用 sref 和 cref 参数垫图,sref URL 垫浮世绘的背景图,主要影响画风;链接垫图主要影响构图和元素。sw 数值,100 为默认值,0 为关闭值,1000 为最大值。使用多个 URL 链接引用多个图片时需注意设置样式的相对权重。cref URL 垫动漫 IP 形象图片,可保持角色一致性,也能用来还原人物,cw 数值范围 0 100,默认数值为 100,数值为 0 时,只关注脸部(适用于更换服装/头发等)。 但目前没有直接为您找到可以生成固定画风人物的漫画网站。
2024-08-25
是否可以理解为agent生成工作流的过程,是通过与agent进行自然语言实现的,而不用预设固定的规则和流程
Coze 是一个 AI 平台,它允许用户创建自己的 AI Bot。在 Coze 中,用户可以使用工作流来设计 Bot 的行为。工作流是由一系列大模型组件组成的,每个组件都可以执行特定的任务,例如解析用户输入、进行条件判断和生成回答等。 Coze 的工作流设计支持动态用户需求传入,这意味着用户可以通过自然语言来动态调用条件流程,而不是通过传统编程的固定条件匹配和调用。这种设计使得 Coze 的 Bot 更加灵活和智能,能够更好地满足用户的需求。 下面是一个 Coze 工作流的示例: 1. 第一步是使用大模型组件解析用户输入的信息,以确定它是否满足提示词条件。 2. 如果满足条件,则执行下一步。 3. 如果不满足条件,则再次调用大模型组件,其提示词与 AI Bot 的提示词几乎相同。 4. 最后,到达结束节点,生成回答。 通过这种方式,Coze 的 Bot 可以根据用户的输入动态调整其行为,以提供更准确和有用的回答。
2024-05-08