Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何搭建利用产品原图和模特模板生成商业图的工作流 或者有没有这类ai 应用

Answer

以下是关于利用产品原图和模特模板生成商业图的工作流及相关 AI 应用的信息:

  • 美国独立站搭建工作流中,有给模特戴上珠宝饰品的应用。
  • 大淘宝设计部在主题活动页面、超级品类日传播拍摄创意、产品营销视觉、定制模特生成、产品场景生成等方面应用了 AI。例如,七夕主题活动页面通过 AI 生成不受外部拍摄条件限制的素材;在 UI 设计场景中,利用 SD 中 controlnet 生成指定范围内的 ICON、界面皮肤等;通过对 AI 大模型的训练和应用,提升合成模特的真实性和美感,提供定制化线上真人模特体验,如 AI 试衣间、AI 写真等;还能根据商品图和用户自定义输入生成多张场景效果,无需 3D 模型、显卡渲染和线下拍摄。
Content generated by AI large model, please carefully verify (powered by aily)

References

摊位信息

|你的摊位活动主题和内容|摊位区域|摊位编号|摊位类型||-|-|-|-||乐易科学院<br>通过AI的技术,结合量子、暗物质、天体运行规律等能量形式从科学、物理学、天文学、心理学等方面讲解国学和传统文化。可以通过技术方式批八字、调风水、进行性格色彩分析,让每个人找到方向,成为更好的自己|C|27|玄学+科学||AIGC策划程序美术(3AI简称3A游戏)应用独立游戏开发|C|76|游戏宣传||AI人像摄影绘画|C|77|照片||主题是:B2B AI营销与AI落地项目快速🔜落地~<br><br>具体涵盖3个方向:<br><br>1、AI训练to b,出应用,智能体agent,文生图生视频都涉及<br><br>2、美国独立站搭建,工作流给模特戴上珠宝饰品<br><br>3、Google seo与AI结合<br><br>都是可以直接变现的(•̀ᴗ•́)و̑̑cursor应用<br><br>技术尝试:<br><br>1、好消息,代码写出来了,可以运行,也有bug。<br><br>2、最近还做出来很多AI工具,帮HR筛选简历的AI工具,行业新闻AI生成与自动推送的工作流,小红书AI生成的工具,Newsletter AI生成的工具……<br><br>3、举个🌰For宋-Sales CV筛选:[https://aipower.yingdao.com/home/business-tool/share/smart-generate/c671068a-8452-4245-9635-8c12173bce0d](https://aipower.yingdao.com/home/business-tool/share/smart-generate/c671068a-8452-4245-9635-8c12173bce0d)|C|58|产品展示|

[heading1]Sheet1[content]|大摩托车||商业应用|<br>|-|-|-|<br>|Labzen|13044206036|画图|<br>|张雷|13211601382|视频|<br>|徐洋|18500972026|行业场景细分应用AI;<br>通过学习AI,赋能行业解决问题,比如:市场投放效率,数据化运营升级,电网资和现场销售的人员能力和效率提升等|<br>|皮皮虾||文生图和图生视频|<br>|薄荷||电商应用出图,辅助创意落地|<br>|龙飞||用于海报生成|<br>|wangzhao111|15571666325|不知道|<br>|Crossing||AI摄影、图生视频等|<br>|朔|13670516075|大图像以及视频工作流|<br>|Roger|18658866328|工作|<br>|秦梧御|15966569697|视频|<br>|dwing3|13702513842|。出图|<br>|May|18018539454|应用|<br>|王西西|18820134184|还不清楚|<br>|丘嘉杰|13413477173|文生图,图生图,图生视频|<br>|吴林林|13968945722|自用,给朋友做写真|<br>|刘燕兰|13066870649|电商应用|<br>|朱鹏|18781609127|广告出图|<br>|水水||视频制作|<br>|韩影|17801234978|作图,做视频|<br>|斌哥|18250885849|自媒体|

大淘宝设计部2023年度AI设计实践报告

对于需要定制化真人模特实景素材的主题活动,不再像以往那样,需要真人布景拍摄或摄影素材采买,耗时耗力还不能保证设计内容的一致性,通过AI可以在短时间内将策划、搭建、拍摄、设计融为一个闭环流程,完成页面所有素材的生产和输出。案例1七夕主题活动页面在12个时辰主题下,需要每个时段的场景画面,通过AI生成的方式可以不受到外部拍摄条件上的种种限制,产出风格一致且符合需求的素材:案例2超级品类日-传播拍摄创意[heading3]6.产品营销视觉[content]UI设计的场景中,采用AI能力可以快速定制多种用户需要的视觉效果,我们通过SD中controlnet的有效控制,可以生成指定范围内的ICON、界面皮肤等内容,加大了很多产品功能的定制可能性。案例88VIP-AI定制皮肤[heading3]7.定制模特AI生成[content]通过对AI大模型的训练和应用,算法从模特姿态、背景风格、装饰元素等多个维度进行效果升级,提升了合成真实性和美感,再结合用户脸型、身材数据,给用户提供定制化的线上真人化模特体验。案例1 AI试衣间案例2 AI写真简化数据采集流程构建用户的数字分身,在保证又“像”又“美”的用户价值下,根据不同主题的摄影风格生成AI写真,让普通用户能通过AIGC创造好玩有趣的内容。[heading3]8.产品场景生成[content]一张商品图,结合用户的自定义输入,便可生成多张场景效果。在整个过程中,不需要3D模型,不需要显卡渲染,不需要线下拍摄。案例“家作”家装场景灵感

Others are asking
有什么软件可以基于原图扩图?除了adobe
以下为您介绍两款除 Adobe 外可以基于原图扩图的软件: 1. 【SD】超清无损放大器 StableSR: 作者:白马少年。 之前讲过在 Stable Diffusion 中绘制高清大图的方式,包括“脚本”和“后期处理”。脚本以“Ultimate SD upscale”为主,会改变原图细节;“后期处理”是 Stable Diffusion 自带的扩图功能,适用于所有图片包括野图,但无法还原原图不清晰的地方。 今天介绍的 StableSR 可以算作“后期处理”的上位替代品,能在尽可能保留原图的情况下更精致地还原原图。安装方式是在扩展面板中搜索 StableSR 直接安装,或者将下载好的插件放在“……\\sdwebuiakiv4\\extensions”路径文件夹下,安装完成后重启 webUI 即可在脚本中找到。 2. 【SD】脸部修复插件 After Detailer: 图片扩充好后,PS 的这个功能又快又好。将 PS 中调整好的图再次导入到 Stable Diffusion 的“图生图”中,使用 controlnet 的 tile 模型进行细化,再使用“Ultimate SD upscale”放大脚本将原图扩充到 2 倍大小。 如果想要这个插件,可以添加公众号【白马与少年】,回复【SD】获取。
2024-12-30
如何优化原图,加入妆容,不修改五官
以下是关于优化原图并加入妆容、不修改五官的一些方法和步骤: 1. 在放大算法方面,Latent 在许多情况下效果不错,但重绘幅度小于 0.5 后不甚理想。ESRGAN_4x、SwinR 4x 对 0.5 以下的重绘幅度有较好支持。 2. Hires step 表示进行这一步时计算的步数。 3. Denoising strength 字面翻译是降噪强度,表现为最后生成图片对原始输入图像内容的变化程度。一般阈值是 0.7 左右,超过 0.7 和原图基本上无关,0.3 以下是稍微改一些。实际执行中,具体步骤为 Denoising strength Sampling Steps。 4. 面部修复可修复画面中人物的面部,但非写实风格人物开启面部修复可能导致面部崩坏。 5. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。可参考文章——。但此步骤无法将照片中头发、衣服等元素变清晰。 6. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。可参考文章——。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免对原图产生干扰。 7. 在星流一站式 AI 设计工具中,点击生成器下方的切换按钮可切换到高级模式。基础模型允许使用更多微调大模型,图片参考允许使用更多图像控制功能。星流基础大模型下,增加了 tile 分块与 softedge 线稿。切换不同系列的基础模型可使用与之配套的图像控制功能,包括基础模型 F.1、基础模型 XL、基础模型 1.5。高清分辨率修复利用算法对初步生成的图像进行简单的图生图高清放大(目前仅支持基础模型 xl 和 1.5 模型)。放大算法影响图像放大后的质量,建议默认。重绘幅度与初步生成的图像的相似度有关。采样器方面,有些在细节处理上表现更佳如 DPM++ 2M,有些生成速度更快如 Euler。采样步数一般越多,模型对图像的生成和优化越充分,但会增加生成时间。随机种子是文生图的随机数种子,通过设置相同的随机数种子,在相同参数配置下可生成相同图像。CFG Scale 控制生成图像与提示词一致性。脸部/手部修复利用算法对人像的脸部或者手部进行修复。
2024-12-02
有什么工具,可以将上传图片上的文字全部翻译成另一种语言,并且生成将原图文字变成翻译结果的新图片
以下为您推荐一些能够将上传图片上的文字翻译成另一种语言,并生成新图片的工具: 1. OpenAI 的 DALL·E :通过图像生成端点可以创建原始图像,编辑端点可以编辑和扩展图像。但主要侧重于图像的生成和编辑,对于图片文字翻译和生成新图片的针对性功能可能不太突出。 2. Reccloud :免费的在线 AI 字幕生成工具,可直接上传视频进行精准识别,能对识别的字幕进行翻译,自动生成双语字幕。 3. 绘影字幕 :一站式专业视频自动字幕编辑器,提供字幕制作和翻译服务,支持多种语言,准确率高,还能自定义字幕样式。 4. Arctime :对视频语音自动识别并转换为字幕,支持自动打轴,支持主流平台和多种字幕功能。 5. 网易见外 :国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-04
ai生成海报
以下是一些关于 AI 生成海报的相关信息: 设计海报的 AI 产品: Canva(可画):https://www.canva.cn/ ,是一个受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可协助选择颜色搭配和字体样式。 稿定设计:https://www.gaoding.com/ ,智能设计工具采用先进人工智能技术,自动分析和生成设计方案。 VistaCreate:https://create.vista.com/ ,简单易用的设计平台,提供大量设计模板和元素,可使用 AI 工具创建个性化海报,智能建议功能帮助用户快速找到合适设计元素。 Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 海报设计思路: 鉴于近期热门的城市建筑风格,可尝试将老北京糖葫芦做成北京建筑,然后即时生成海报并挑选喜欢的。确定这种风格的海报后,替换同材质的北京建筑物即可延续风格设计一系列海报。继续复用上一张的关键词生成其他建筑,调整关键词继续生成单个建筑物,再用 PS 稍作处理,替换建筑物,就可得到一系列海报。 用 AI 快速做一张满意海报的方法: 需求场景:当想在社交平台发布内容时,网上找的图可能质量不佳或易撞图,自己相册中的照片可能不合适,此时可自己制作。 大致流程: 主题与文案:确定海报主题后,借助 ChatGPT 等文本类 AI 工具协助完成文案。 风格与布局:选择想要的风格意向,背景可根据文案和风格灵活调整画面布局。 生成与筛选:使用无界 AI,输入关键词,生成并挑选一张满意的海报底图。 配文与排版:将上述素材进行合理排版,得到成品。排版同样可以参考 AIGC 海报成果。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-04
可以推荐给小学生的ai工具
以下是为小学生推荐的一些 AI 工具: 1. 聊天对话类:Kimi、智谱清言等。 2. 图像类:Midjourney 等。 对于小学生来说,使用 AI 工具时需要在家长或老师的指导下进行,并且要注意合理控制使用时间,避免过度依赖。同时,也要关注工具的使用规则和安全问题。
2025-02-04
如何引导小学生使用ai工具
以下是引导小学生使用 AI 工具的一些方法和示例: 1. 特色课程合作:可以像某小学一样,邀请专业的 AIGC 专家与学校合作。让大学生走进小学课堂,为小学生讲解 AI 工具,带他们试玩用 AI 工具设计的桌游,让小学生初步认识人工智能并尝试使用一些 AI 工具。 2. 课程内容设计: 设计 Q&A 环节,例如: 询问学生最喜欢哪一个 AI 应用及原因,引导他们思考技术对生活的影响和背后的原理,强调科技的多样性和创新。 探讨 AI 能否替代人类的艺术家或者作家,鼓励学生思考人类创造力与机器效率的关系,倡导对技术的负责任使用。 想象是否想要一个 AI 机器人朋友及希望它帮忙做什么,讨论与机器人交友和人类交友的不同,倡导理解技术的辅助角色。 思考如果 AI 可以帮忙完成家庭作业,希望它完成哪部分及原因,鼓励分享作业中的挑战,探讨 AI 的帮助和依赖的风险,强调将 AI 作为学习工具增强理解和效率。 3. 主课融入:在英语课等主课中逐步融入 AIGC 工具。对于初中以上的学生,开始时由老师带着使用,学生提出 prompt,老师做引导。例如在研究学校食堂食物浪费问题时,老师带着学生与 ChatGPT 对话获取信息,让 ChatGPT 为学生生成能懂的单词解释和例句,并用 AI 工具加工生词,生成题目、游戏或文章帮助复习单词。在英语辩论课上,尝试让学生自主使用 AIGC 工具做准备。
2025-02-04
我想把黑白老照片修复成彩色,然后给人物换衣服。请问哪个AI网站或者软件可以免费使用
以下为您介绍可免费使用的将黑白老照片修复成彩色并给人物换衣服的方法: 使用 Stable Diffusion 可以实现此需求。在新上线的 controlnet 模型中,新增的 Recolor 模型能将黑白图片重新上色。操作时选择 realisian 的写实大模型,提示词直接描述颜色和对应的内容,如黑色的头发、黄色的皮肤、深蓝色的衣服、浅蓝色的背景等。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰,可参考文章——。 之后将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的,可参考文章——。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免对原图产生干扰。 原文网址:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw
2025-02-04
ai的历史
人工智能的历史可以追溯到二十世纪中叶。 在早期阶段,符号推理较为流行,专家系统等取得了重要进展,但因从专家提取知识并以计算机可读形式表现及保持知识库准确性的任务复杂且成本高,应用场景难以大规模拓展,导致 20 世纪 70 年代出现“人工智能寒冬”。 随着时间推移,计算资源更便宜,数据更多,神经网络方法在计算机视觉、语音理解等领域展现出卓越性能,过去十年中“人工智能”常被视为“神经网络”的同义词。 AI 技术的发展历程包括: 1. 早期阶段(1950s 1960s):有专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):机器学习算法如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等。 当前 AI 前沿技术点有: 1. 大模型:如 GPT、PaLM 等。 2. 多模态 AI:视觉 语言模型如 CLIP、Stable Diffusion 及多模态融合。 3. 自监督学习:自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:元学习、一次学习、提示学习等。 5. 可解释 AI:模型可解释性、因果推理、符号推理等。 6. 机器人学:强化学习、运动规划、人机交互等。 7. 量子 AI:量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 最初,查尔斯·巴贝奇发明了计算机,现代计算机虽更先进但仍遵循相同的受控计算理念。但对于像根据照片判断一个人的年龄这类任务,因无法明确解法,正是人工智能感兴趣的。
2025-02-04
我该怎么样学习ai
以下是关于学习 AI 的全面指导: 一、了解 AI 基本概念 建议阅读「」部分,熟悉 AI 的术语和基础概念。了解人工智能是什么,其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 二、开始 AI 学习之旅 在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可以通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并争取获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,比如图像、音乐、视频等,您可以根据自身兴趣选择特定模块深入学习。掌握提示词的技巧,因其上手容易且实用。 四、实践和尝试 理论学习后,实践是巩固知识的关键。尝试使用各种产品做出您的作品,知识库中有很多实践后的作品和文章分享,欢迎您实践后也进行分享。 五、体验 AI 产品 与现有的 AI 产品互动是学习 AI 的有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,有以下建议: 1. 从编程语言入手学习 可以从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等,学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展,思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 总之,为了在医疗保健中让 AI 产生真正的改变,应投资创建一个模型生态系统,让“专家”AI 像优秀的医生和药物开发者那样学习。成为顶尖人才通常从多年的密集信息输入开始,通过正规学校教育和学徒实践,从该领域出色的实践者那里学习。对于 AI 来说,应通过使用彼此堆叠的模型来训练,而不是仅依靠大量数据和生成模型。例如先训练生物学模型,再是化学模型,然后添加特定于医疗保健或药物设计的数据点。预医学生的课程从基础开始,设计新疗法的科学家也需要经历多年学习和实践指导,这种学习方式有助于培养处理细微差别决策的直觉。
2025-02-04
如果让提示词变成模板, 每次输入需要的参数就好。
要将提示词变成模板,每次输入需要的参数即可。以下是一些相关的方法和要点: 在 Stable Diffusion 中,下次作图时先选择模板,点击倒数第二个按钮可快速输入标准提示词。描述逻辑通常包括人物及主体特征(如服饰、发型发色、五官、表情、动作)、场景特征(室内室外、大场景、小细节)、环境光照(白天黑夜、特定时段、光、天空)、画幅视角(距离、人物比例、观察视角、镜头类型)、画质(高画质、高分辨率)、画风(插画、二次元、写实)等,通过这些详细提示词能更精确控制绘图。新手可借助功能型辅助网站书写提示词,如 http://www.atoolbox.net/ (通过选项卡快速填写关键词信息)、https://ai.dawnmark.cn/ (每种参数有缩略图参考),还可去 C 站(https://civitai.com/)抄作业,复制每张图的详细参数粘贴到正向提示词栏,注意图像作者使用的大模型和 LORA,也可选取部分好的描述词使用。 简单的提示词模板最终目标是把需求说清楚,如 GPTs 提示词模板:Act like a 输入最终结果),并给出了示例。 提示词母体系列(2)中,在掌握人物设计整体框架后编写提示词,可借鉴替换方式替换模板。模板构成包括:先看约束部分,规则放顶部加强约束,底部也有相应约束,整个约束包裹具体提示词以提示模型专注性;模板结构有基本信息(姓名、性别、年龄、职业)、外貌特征、背景和经历、性格和价值观、爱好特长和语言风格、人际关系和社交活动、未来规划和目标。
2025-01-28
什么AI工具可以把直接WORD的内容直接放到PPT模板里
以下是一些可以将 WORD 内容直接放到 PPT 模板里的 AI 工具: 1. Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀团队推出,输入简单文本描述生成专业 PPT 设计,有丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等。网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 5. 爱设计 6. 闪击 7. Process ON 8. WPS AI
2025-01-08
你有没有文生图的prompt模板
以下是一些文生图的 prompt 模板和相关指导: 1. 定主题:明确生成图片的主题、风格和要表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的模型,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. ControlNet:可控制图片中特定的图像,如人物姿态、特定文字等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:无脑选择 840000 这个即可。 7. Prompt 提示词:用英文写需求,使用单词和短语组合,不用管语法,单词、短语之间用英文半角逗号隔开。 8. 负向提示词 Negative Prompt:用英文写要避免产生的内容,同样是单词和短语组合,中间用英文半角逗号隔开。 9. 采样算法:一般选 DPM++2M Karras,也可参考 checkpoint 详情页上模型作者推荐的采样器。 10. 采样次数:根据采样器特征,选 DPM++2M Karras 时,采样次数在 30 40 之间。 11. 尺寸:根据喜好和需求选择。 描述逻辑通常包括:人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。 对于新手,可通过以下方式辅助写提示词: 1. 利用功能型辅助网站,如 http://www.atoolbox.net/ ,通过选项卡快速填写关键词信息。 2. 参考 https://ai.dawnmark.cn/ ,其每种参数有缩略图可参考,更直观选择提示词。 3. 去 C 站(https://civitai.com/)抄作业,复制每一张图的详细参数。 在 Stable Diffusion 中,生成方式主要分为文生图和图生图两种。文生图仅通过正反向词汇描述发送指令,图生图除文字外还可给 AI 参考图模仿。采样迭代步数通常控制在 20 40 之间,采样方法常用的有 Euler a、DPM++2S a Karras、DPM++2M Karras、DPM++SDE Karras、DDIM 等,有的模型有指定算法搭配更好。比例设置时,高宽比尽量在 512x512 数值附近,太大数值可能导致奇怪构图,若想要高清图可同时点选高清修复放大图像倍率。
2025-01-05
我想问 有没有可以帮忙写 flux 或者其他图像模型 prompt 的 system prompt 模板
以下是为您整理的相关内容: 关于 FLUX 模型的安装部署: 模型选择:FLUX.1 有 dev、dev fp8、schnell 等版本,建议选择 dev 版本,显卡较好可用 fp16,显卡不够选 fp8。模型下载后放入 ComfyUI/models/unet/文件夹中。若爆显存,可在“UNET 加载器”节点中将 weight_dtype 设置为 fp8,降低显存使用量,但可能稍降质量。 clip:t5xxl_fp16.safetensors 和 clip_l.safetensors 放在 ComfyUI/models/clip/文件夹里,也可用 t5xxl_fp8_e4m3fn.safetensors 降低内存使用率,超过 32GB 内存建议用 fp16。 Vae:下载后放入 ComfyUI/models/vae 文件夹。 关于训练 Midjourney 的 prompt: 训练问题:强大的 DMs 通常消耗数百个 GPU 天,推理由于顺序评估而成本高昂。在有限的计算资源上应用 DMs 于强大的预训练自动编码器的潜在空间中训练,可在不影响质量和灵活性的情况下实现复杂度降低和细节保留的最佳点,显著提高视觉保真度。引入交叉注意力层到模型架构使扩散模型成为强大灵活的生成器,支持文本和边界框等一般条件输入,实现高分辨率卷积合成。 版本:Midjourney 定期发布新模型版本以提高效率、连贯性和质量。最新模型为默认,也可通过version 或v 参数或/settings 命令选择其他版本。V5 模型于 2023 年 3 月 15 日发布,具有更广泛的风格范围、更高的图像质量、更详细的图像等优点。 关于 ComfyUI 图片提示词反推提示词生成: 在 ComfyUI 里使用 MiniCPM 做图片提示词反推与文本提示词生成,可和 flux 模型配合生成图片,建议使用量化版本的模型(int4 结尾)节省显存。 安装方法:进入 ComfyUI 自定义节点目录,克隆相关仓库,重启 ComfyUI。 模型下载:网盘 https://pan.quark.cn/s/00b3b6fcd6ca ,下载后放入 ComfyUI 的 models 文件夹下 MiniCPM 文件夹中,没有就新建一个。
2025-01-02
撰写一篇汽车领域人工智能自动驾驶应用系统方案,参照以下要求:(1) 选题应为课程相关的技术或者原理的应用。 (2) 重点撰写第2部分技术与服务,必须要使用到课程中所学到或者相关技术。 (3) 第6部分财务分析可根据情况适当缩减。 (4) 整体架构可以根据选题进行调整,可适当增加章节或者删减。 (5) 字体大小、标题等必须和模板相同。篇幅20页以上,不少于10000字,小四,宋体。 以下为一篇样稿,可参考其框架撰写 城市智能停车服务系统建设方案 目 录 1 项目背景 1 1.1 项目背景
以下是为您撰写的汽车领域人工智能自动驾驶应用系统方案的部分内容,您可以根据实际需求进行进一步的完善和补充: 一、项目背景 人工智能在汽车行业的应用已经十分广泛,正在深刻改变汽车的各个方面。自动驾驶技术利用 AI 进行图像识别、传感器数据分析和决策制定,使汽车能够自主导航和驾驶,如特斯拉、Waymo 和 Cruise 等公司都在积极开发和测试自动驾驶汽车。车辆安全系统中,AI 用于增强自动紧急制动、车道保持辅助和盲点检测等功能,通过分析摄像头和传感器数据预防事故。个性化用户体验方面,AI 可根据驾驶员偏好调整车辆设置,包括座椅位置、音乐选择和导航系统。预测性维护通过分析车辆实时数据,预测潜在故障和维护需求,提高车辆可靠性和效率。在汽车制造中,AI 用于自动化生产线,优化生产流程和质量控制。汽车销售和市场分析中,AI 帮助分析市场趋势、消费者行为和销售数据,优化营销策略和产品定价。电动化和能源管理方面,AI 在电动汽车的电池管理和充电策略中发挥作用,提高能源效率和延长电池寿命。共享出行服务借助 AI 优化路线规划、车辆调度和定价策略,提升服务效率和用户满意度。语音助手和车载娱乐由 AI 驱动,允许驾驶员通过语音控制车辆功能、获取信息和娱乐内容。车辆远程监控和诊断利用 AI 系统远程监控车辆状态,提供实时诊断和支持。 二、技术与服务 1. 自动驾驶技术 传感器融合:采用多种传感器,如激光雷达、摄像头、毫米波雷达等,收集车辆周围环境信息。利用 AI 算法对这些多源数据进行融合和分析,提高环境感知的准确性和可靠性。 深度学习决策:基于深度神经网络,训练车辆的决策模型。通过大量的真实驾驶数据,让模型学习如何在各种复杂场景下做出最优的驾驶决策,如加速、减速、转向等。 模拟训练:利用虚拟仿真环境进行大规模的自动驾驶训练。在模拟环境中,可以快速生成各种复杂和罕见的交通场景,加速模型的训练和优化。 2. 车辆安全系统 实时监测与预警:利用 AI 实时分析来自车辆传感器的数据,如车速、加速度、转向角度等,以及外部环境信息,如道路状况、天气条件等。当检测到潜在的危险情况时,及时向驾驶员发出预警。 自动紧急制动:基于 AI 的图像识别和距离检测技术,当判断车辆即将与前方障碍物发生碰撞且驾驶员未采取制动措施时,自动启动紧急制动系统,降低事故风险。 3. 个性化用户体验 偏好学习:通过收集驾驶员的日常操作数据,如座椅调整习惯、音乐播放喜好、常用导航路线等,利用机器学习算法分析和学习驾驶员的偏好模式。 智能推荐:根据学习到的偏好,为驾驶员提供个性化的推荐,如座椅自动调整、音乐推荐、导航路线规划等。 4. 预测性维护 数据采集与分析:安装各类传感器收集车辆的运行数据,如发动机转速、油温、轮胎压力等。利用 AI 算法对这些数据进行分析,挖掘潜在的故障模式和趋势。 故障预测模型:建立基于机器学习的故障预测模型,提前预测可能出现的故障,并及时通知驾驶员和维修人员,安排预防性维护。 5. 生产自动化 质量检测:利用机器视觉技术和 AI 算法,对生产线上的汽车零部件进行自动检测,识别缺陷和瑕疵,提高产品质量。 生产流程优化:通过分析生产数据,如设备运行状态、生产节拍等,利用 AI 优化生产流程,提高生产效率,降低生产成本。 三、财务分析(可根据情况适当缩减) 1. 初始投资 技术研发费用:包括自动驾驶算法开发、硬件设备采购、测试场地建设等方面的费用。 车辆改装和设备安装成本:为实现自动驾驶功能,对车辆进行改装和安装相关传感器、计算设备等的成本。 2. 运营成本 数据采集和处理费用:持续收集车辆运行数据和环境数据,并进行处理和分析的费用。 维护和升级成本:对自动驾驶系统进行定期维护、软件升级和硬件更换的费用。 3. 收益来源 车辆销售增值:配备自动驾驶和智能功能的汽车可以提高售价,增加销售收入。 服务订阅费用:为用户提供个性化服务、远程监控和诊断等服务的订阅收费。 4. 盈利预测 根据市场需求、成本控制和收益增长情况,进行短期和长期的盈利预测。 以上内容仅供参考,您可以根据具体的项目需求和实际情况进一步完善和细化各个部分。
2024-12-27
AI人设设定模板
以下是关于 AI 人设设定的相关内容: Niji·journey 5 二次元角色设计 Prompt 编写指南: 示例:“Character concept art,many details,full body view,Front,back and side views,multiple views of the same character,a little Girl wear inside cyberpunk latex tiny tight Pilot suit,wear outside an ultra detailed Futuristic fashion oversized cyberpunk short coat with big wide sleeves,big cyberpunk boots,lineart,beautiful linework,high contrast,alluring,flirtatious,frisky,massive scale,gradient,manga,hd,with exaggerated features and bold colors.The character design should be distinctive and unique,with attention to detail and a strong sense of personality,3 panels dynamic poses various angles,various angles,line art,black and white,white background”。通过替换设计主体描述部分,可以生成不同的角色,如男性赏金猎人、骷髅假面杀手、生化牛头人等。 如何引导 Niji·journey 5 生成多样化二次元角色设计风格: 除了风格关键词,还可以加入时代背景等元素让设计产生更多变化。 可以使用具体游戏风格引导 Niji·journey 5 生成类似风格的角色设计,例如以《最终幻想 14》为例,在 Prompt 中按照模板添加特定游戏的名称。 通用人物模版: 想用真人照片来生成卡通头像,可以用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。 如果生成了自己比较满意的图,一定要记得存起来。下次想要同种类型的就可以直接拿来喂图,效果要比重新找的好很多。
2024-12-24
请推荐一款,可以快速生成电商服装模特的ai工具
以下为您推荐几款可快速生成电商服装模特的 AI 工具: 1. Stable Diffusion:如果您要开淘宝网店,可借助它初步制作展示商品。比如卖绿色淑女裙,先真人穿衣服拍照,处理好照片,选好 realisitic 真人照片风格的底模,再根据不同平台换头,通过图生图下的局部重绘选项卡涂抹替换部分,并设置好 prompts&parameters。 2. ComfyUI:这个工作流适用于电商服饰行业的换装、虚拟试穿等场景。首先生成适合服装的模特,可抽卡抽到满意的模特,加入 Redux 模型,强度不用太高,让提示词生效。然后进行高精度的换装,先预处理拼出 mask,再重绘 mask 区域。 3. 达摩院:支持虚拟换装、姿态编辑,您可以直接在 https://damovision.com/?spm=5176.29779342.d_appmarket.6.62e929a4w3xGCR 进行测试。
2025-02-02
怎么用ai完成淘宝模特图片的批量修改,风格都是一致的
以下是使用 AI 完成淘宝模特图片批量修改且风格一致的方法: 1. 利用 Stable Diffusion 进行局部重绘: 真人穿衣服拍照,获取真实质感的照片。若身材方面有问题,可借助美图秀秀或 PS 处理。 选好真人照片风格的底模,如 majicmixRealistic_v7。 根据不同平台需求换头,如面向海外市场换白女头。 在图生图下的局部重绘选项卡下涂抹自己替换的部分,并设置好 prompts 和 parameters。 2. 大淘宝设计部的实践: 对于定制化真人模特实景素材的主题活动,通过 AI 可将策划、搭建、拍摄、设计融为一个闭环流程,短时间内完成页面所有素材的生产和输出。 在 UI 设计场景中,采用 AI 能力可快速定制多种视觉效果,通过 SD 中 controlnet 的有效控制,生成指定范围内的 ICON、界面皮肤等内容。 通过对 AI 大模型的训练和应用,算法从模特姿态、背景风格、装饰元素等多个维度进行效果升级,结合用户数据提供定制化的线上真人化模特体验。 一张商品图,结合用户的自定义输入,可生成多张场景效果,无需 3D 模型、显卡渲染和线下拍摄。 此外,字节发布的新模型 SeedEdit 也可用于图片编辑,每次编辑尽量使用单指令,多指令最好少于 3 种变化。为保证效果,局部编辑时下指令要精准,参考图要清晰、分辨率高。若编辑效果不明显或变化过多,可调整编辑强度。
2025-01-21
控制模特的姿势
以下是关于控制模特姿势的方法: 在使用相关 AI 工具时,如 Stable Diffusion 等,有以下几种控制模特姿势的方式: 1. 使用蒙版和提示词:输入相关提示词,如“蓝色毛衣”,处理蒙版区域内容为“填充”,调整尺寸与图像一致,重绘幅度为 1。但可能会出现衔接问题,此时可降低重绘幅度或添加 openpose 来控制人物身体,获得正确姿势。 2. 利用 ControlNet 功能: 正常填写大模型和关键词生成照片。 鼠标滑到最下面,点击“ControlNet”。 点击空白处上传指定姿势的照片,并点击“启用”。 在“预处理器”和“模型”里选择“openpose”,用于让计算机识别人物姿势。 点击“预览预处理结果”,最后点击生成照片,即可得到指定姿势的照片。 在 ControlNet 参数配置方面: tile 用于对整体画面的控制,可选择分块+固定颜色+锐化,以保证颜色统一降低后续闪烁,不需要全过程引导,仅在开始时固定画面。 lineart 用于提取人物线条,保证人物整体不跑偏,权重给到 0.6 以控制整体画面输出稳定。 openpose 用于控制人物的姿态、表情和动作,推荐使用 DWpose 处理器,其对面部和手部的识别效果较好。
2025-01-17
我想要根据一个模特去生成她多个角度的图片
以下是根据您的需求生成模特多个角度图片的方法: 1. 准备工作: 准备一张人物的多角度图片,该图共有 15 个不同视图,尺寸设置为 1328×800px,放大两倍后可保证每张小图为 512×512px。 加上网格图,通过 lineart 分割不同块面。 设置 controlnet,第一张图选择 openpose_face 得到人物 15 个面部角度,第二张图选择 lineart_standard得到清晰的表格分区。 为防止小图模式下人脸崩坏,可增加 ADetailer 的脸部修复插件。 2. 开始生图: 设置文生图提示词: 大模型:majicmixRealistic_v6.safetensors 正向提示词:,auburn hair,eyes open,cinematic lighting,Hyperrealism,depth of field,photography,ultra highres,photorealistic,8k,hyperrealism,studio lighting,photography 负向提示词:EasyNegative,canvasframe,canvas frame,eyes shut,wink,blurry,hands,closed eyes,,lowres,sig,signature,watermark,username,bad,immature,cartoon,anime,3d,painting,b&w 设置参数: 迭代步数:50 采样方法:DPM++2M Karras 尺寸:1328×800px 出图,可得到 15 个不同角度的人物图片。
2025-01-08
Midjourney+sd可以生成服装模特视频么
Midjourney 和 SD 可以用于生成服装模特视频。以下是一些常见的方法: 1. 方法 1【MJ 出图 + AI 视频软件】:使用 Midjourney 垫图➕描述出图,再去视频工具中转成视频。下载项里的深度图,打开 Midjourney 官网(https://www.midjourney.com/)上传深度图。局部重绘有难度,最终方式可以是分开画,比如先画个被关着的红衣服女孩,再画个二战德国士兵的背影,再合成后交给 MJ。 2. 方法 3【SD 出图 + AI 视频软件】:在 SD 的 controlnet 中上传原图,选择深度,文生图生成图片,再把生成好的图放在 AI 视频工具中进行视频生成。 同时,您还可以参考以下视频工具建议: 。另外,使用 Dreamina 图片生成功能(https://dreamina.jianying.com/aitool/image/generate)上传深度图,选择适应画布比例并填写描述,也可以实现深度图出图和出视频。
2025-01-06
ai生成服装模特视频
以下是一些与生成服装模特视频相关的 AI 技术和应用: 1. ViViD 视频虚拟试穿技术:由阿里巴巴开发,可以替换视频中人物的衣服,生成真实自然的视频,支持多种服装类型,在视觉质量、时间一致性和细节保留方面表现优异。相关链接:https://x.com/imxiaohu/status/1796019244678906340 2. 生成式人工智能在营销中的应用:Stitch Fix 是一家服装公司,已使用 AI 向客户推荐特定服装,并正在尝试使用 DALLE 2 根据客户对颜色、面料和款式的偏好创建服装可视化。 此外,还有一些其他相关的 AI 技术,如: 1. 山寨版阿里 Animate Anyone 开源:利用图像和视频中的人物姿势来合成动画,Novita AI 开源并提供 API 支持,提供照片和视频即可自动生成动画。相关链接:GitHub:https://github.com/novitalabs/AnimateAnyone ;API:https://novita.ai/playgroundanimateanyone ;https://x.com/imxiaohu/status/1796191458052944072 2. 音频生成方面,有 Udio130 音乐生成模型,能生成 2 分钟的音频,提升曲目连贯性和结构,新增高级控制功能。相关链接:详细:https://xiaohu.ai/p/8738 ;https://x.com/imxiaohu/status/1795999902830629249 3. 代码生成方面,有 Mistral AI 推出的 Codestral 代码生成模型,支持 80 多种编程语言,包括 Python、Java、C 等,能自动完成代码、编写测试,并能填补未完成的代码部分,拥有 32k 上下文窗口,在多项基准测试中表现出色。相关链接:详细:https://mistral.ai/news/codestral/ ;https://x.com/imxiaohu/status/1795987350713192937 4. 音乐演示方面,有 Suno 音乐演示,新视频展示从任何声音创作歌曲。相关链接:https://x.com/imxiaohu/status/1795976717905043467
2025-01-06