Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有没有什么能够把手绘扩展成插画的 AI?

Answer

以下是一些能够把手绘扩展成插画的 AI 工具或方法:

  1. Stable Diffusion:在有参考图的情况下,可以对原图进行风格化转变。若要创作原创卡通插画,可不使用 ControlNet。通过调整提示词,如“一个女孩坐在沙发上,吃西瓜,看电视,夏天”,能生成插画。完成后可能存在小瑕疵,可在 PS 里后期修复。
  2. 公众号【白马与少年】:如果想要相关模型和 Lora,可以添加该公众号,回复【SD】获取。

需要注意的是,在使用这些工具时,可能需要一定的操作技巧和相关知识。

Content generated by AI large model, please carefully verify (powered by aily)

References

他山之石|如何防止AI取代人类思考一切?

A hand drawn sketch note helps create the synaptic connections needed to move the information from short term to long term memory.You become a better conceptual thinker when you don’t use AI for note-taking.If we look at this diagram of information processing,we need students to get information into their long-term memory:information processing diagramResearch has demonstrated that students retain more information when they take notes by hand rather than typing them.Similarly,students become better observers in science when they sketch out what they see.This seems odd at first.Is a photo more efficient?Absolutely.Is a photo more accurate?Most definitely.Do scientists use photographs out in the field?You bet.Then why bother sketching?The act of drawing teaches students how to observe.We don’t want to short-circuit that process.I want to see students ideating with sticky notes and sketches and webs rather than asking the AI to develop a fully formed project plan.In terms of learning,we also need to engage in hands-on,minds-on,technically minimal learning in order to master a skill.In other words,we shouldn’t use AI when we are first learning a new skill.When Learning a Skill,Start with the Human Element FirstI reached out to my friend Trevor Muir and asked him,“What would you recommend to tackle the problem of cognitive atrophy?”His response was,“I love this topic.I’ve been thinking about it in writing.I don’t think teachers should use AI with students in writing until students have mastered it first.”

【SD】简笔水彩风格插画

当然,这是在有参考图的情况下,我们对原图进行的风格化转变。如果你想要画出原创的卡通插画,就可以不使用controlnet。我们还是使用这个大模型和lora搭配,只不过调整一下提示词,这里我将提示词调整为“一个女孩坐在沙发上,吃西瓜,看电视,夏天”。完成后有些小瑕疵,比如手里西瓜的部分,还有脚的部分。送到ps里后期修复一下,西瓜的部分可以使用“创成式填充”,让AI帮你画好。脚的部分有点难,AI搞不清楚结构,那就用画笔修一下好了,毕竟是简笔画,对细节要求不是很高。这样,一幅还蛮有意思的小插画就做好啦。以上,就是关于简笔水彩风格绘画的介绍,你学会了吗。如果想要这些模型和lora的话,可以添加我的公众号【白马与少年】,回复【SD】即可。-END-白马与少年Stable Diffusion、Blender等学习心得分享139篇原创内容(持续更新中)公众号微信扫一扫关注该公众号

问:有没有用来画CAD图的AI工具

是的,存在一些AI工具和插件可以辅助或自动生成CAD图,特别是在设计和工程领域。以下是一些可以辅助创建CAD图的AI工具:1.CADtools 12:这是一个Adobe Illustrator(AI)插件,它为AI添加了92个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。2.Autodesk Fusion 360:Fusion 360是Autodesk开发的一款集成了AI功能的云端3D CAD/CAM软件,能够帮助用户创建复杂的几何形状和优化设计。3.nTopology:nTopology是一款基于AI的设计软件,它可以帮助用户创建复杂的CAD模型,包括拓扑优化、几何复杂度和轻量化设计等。4.ParaMatters CogniCAD:CogniCAD是一款基于AI的CAD软件,可以根据用户输入的设计目标和约束条件自动生成3D模型,适用于拓扑优化、结构设计和材料分布等领域。5.生成设计工具:一些主流CAD软件,如Autodesk系列、SolidWorks等,提供了基于AI的生成设计工具,这些工具可以根据用户输入的设计目标和约束条件自动产生多种设计方案。这些工具通常需要一定的CAD知识和技能才能有效使用。对于CAD初学者,建议先学习基本的3D建模技巧,然后尝试使用这些AI工具来提高设计效率。内容由AI大模型生成,请仔细甄别

Others are asking
请问想根据旅游日记绘制黑白线条的插画如何通过AI实现
要根据旅游日记绘制黑白线条的插画,可以通过以下步骤利用 AI 实现: 1. 利用 Midjourney 生成线稿:使用关键词如“Black and white line drawing illustration of your travel diary scene, black line sketch, , Chinese element style, popular toys, blind box toys, Disney style, white background niji 5 style expressive”。 2. 对生成的线稿在 PS 中手动重绘错误的地方。比如有些图出来没有阴影容易飘,可以自己画一个出来。 3. 利用 Stable Diffusion 上色:使用 Controlnet 控制上色效果。 4. 对于着色画,了解其特点和艺术效果,包括色彩的丰富性、情感表达、细节和纹理的突出以及创意发挥等方面。 5. 在编写 AI 绘画的关键词时,遵循基础描述、风格指定、色彩要求和细节强调的结构思路。例如:基础描述为“a beautiful and memorable scene from your travel diary”,风格指定为“line art”,色彩要求为“black and white color matching”,细节强调为“changes in line thickness”。 6. 尝试进阶玩法,如用 MJ 的 Retexture 功能或即梦参考功能,通过写提示词或垫图功能给着色画上色。
2025-02-10
AI现在可以完成插画设计了吗
AI 现在可以完成插画设计。生成式 AI 能够为游戏创建 2D 艺术、纹理、3D 模型,并协助关卡设计,在营销中也有望取代库存艺术、产品摄影和插图,且已在网页设计、室内设计和景观设计中有所应用。 Midjourney 等 AI 绘画技术在设计工作中有多种应用,比如快速草图、自动化创意设计、自动化颜色匹配、自动化插图绘制等,能帮助设计师更快速、更高效地完成设计工作。 Recraft 正在构建包含图像生成及各种用 AI 进行的图像编辑和设计编辑的技术部分,以及能让用户在其中完全解决任务而无需在其他工具间切换的工作流程部分。不过当前行业和模型、技术尚未达到理想水平,设计师要获得所需结果仍有难度。 同时,AI 行业在与插画师社区的关系处理上存在问题,未来希望能有所改变,让艺术界从 AI 中获得足够价值。
2025-01-16
插画生成
以下是关于插画生成的相关内容: Midjourney 商业实战案例 1. 像素风格插画 关键词:3D,16bit pixel art,Super mario,Minecraft,LEGO,pixel style,Blocksplicing,girl with long hair,Alice in Wonderland,garden background,8K–uplight–ar 9:16–v 5 Midjourney 生成的图片:像素女孩插画 2. 手机壁纸插画 关键词:mobile wallpaper illustrations,four seasons,natural landscapes,minimalist illustrations,line illustrations–ar 9:16–niji Midjourney 生成的图片:手机壁纸 3. 新海诚风格插画 关键词:Makoto Shinkai animation style,a girl,4K–ar 9:16–niji Midjourney 生成的图片:新海诚动漫海报 4. 国潮插画 关键词:Make posters of James Jean,white deer,auspicious clouds,birds,distant mountains,Chinese ChinaChic style,colorful,light color,gradient color–ar 9:16 Midjourney 生成的图片:国潮白鹿插画 【SD】简笔水彩风格插画 作者:白马少年 介绍:SD 实践派,出品精细教程 发布时间:20230620 20:04 原文网址:https://mp.weixin.qq.com/s/TPSturdv9fdGRLAxEG2rKg 生成方法:首先使用大模型“Flat2D Animerge”,适合生成一些卡通动漫的图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复的话,可拉到 11)。还有两个 lora,“Chinese painting style”可增加中国画水彩风格的效果,权重设置为 0.4;“Crayon drawing”可给画面添加简单线条和小孩子的笔触,权重设置为 0.8。将图片丢到标签器中反推出关键词,发送到“文生图”。在正向提示词末尾添加这两个 lora,尺寸按参考图设置,重绘幅度开 0.5 让 AI 更自由发挥,想和原图更接近可降低数值。将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 商业教程:统一 2 个角色的插画海报 1. 生成女性 获取男生那张的 seed,加在关键词后面,生成女生。挑选相似的。也可以先 U3 后继续通过变化的变化 2 个按钮挑选合适的。 2. 局部重绘 局部重绘不满意的表情,如希望女生开心点,添加 happy。 3. ps 处理 把需要的角色扣在一起。ps 把颜色调整一致(如果有 ps ai 版可以修修手) 4. 小素材生成 其他过程稿
2025-01-06
生成agi插画的网站
以下是一些可以生成 AGI 插画的网站: :可以使用 AI 创建网站和 app 使用的插画。 :PictoGraphic,免费的 AI 生成插图库,提供超过 40000 张图像和 SVG 文件,支持文本提示创建自定义插图。
2024-10-31
作为一个初级插画师有哪些ai工具可以帮助我
对于初级插画师,以下是一些可以提供帮助的 AI 工具: 1. CADtools 12:这是 Adobe Illustrator 的插件,为其添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:是 Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能帮助创建复杂几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供基于 AI 的生成设计工具,可根据输入的设计目标和约束条件自动产生多种设计方案。 在绘制逻辑视图、功能视图、部署视图方面,以下工具可供选择: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,可通过拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,包括逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图创建,可与 Archi 工具一起使用,该工具提供图形化界面创建模型。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现称为 diagrams.net):免费的在线图表软件,允许创建各种类型图表,包括软件架构图,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 如果您想快速体验 AI 绘画工具: 1. 最低成本的开始:扣子 + ByteArtist 网址:https://www.coze.cn/home 优点:不需要翻墙,无收费,可以直接生成 注册:手机号或抖音号或飞书号 操作步骤:需要在 coze 的 bot 里面添加绘图插件 时间:5min 2. 先锋的:Midjourney 网址:https://www.midjourney.com/explore?tab=random 优点:图片和描述相关性更大,风格更加显著 限制:需要翻墙,需要 Gmail 注册,不免费,在 discord 上代理使用 时间:30 60min 价格:8 美元一个月/ 200 张图
2024-10-11
现在我想生成一张插画,需要提示词。插画内容为一位刚高考完的大学生,正在思考买什么笔记本电脑,现在在网站上查阅信息
以下是为您生成的插画提示词:一位刚结束高考、神情专注的大学生,坐在电脑桌前,面前的屏幕上显示着各种笔记本电脑的信息,他眉头微皱,手中拿着笔在本子上记录着,身旁放着几本电脑杂志。A college student who has just finished the college entrance examination, with a focused expression, is sitting at a computer desk. The screen in front of him shows information about various laptops. He frowns slightly and holds a pen in his hand, recording in a notebook. There are several computer magazines beside him.
2024-08-21
目前的AI设计软件,能直接生成课程海报吗
目前的 AI 设计软件能够直接生成课程海报。例如 Claude 这款工具,其 Artifact 功能强大,无需专业设计技能和代码编写,也无需使用 PS 等软件,仅通过输入提示词和对话交流,就能生成课程海报,还能根据需求进行修改,如合并课程、添加日历、调整色彩等。 此外,还有一些其他的 AI 海报生成工具: 1. Canva(可画):https://www.canva.cn/ ,提供大量模板和设计元素,AI 功能可协助选择颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ ,智能设计工具采用先进人工智能技术,自动分析和生成设计方案。 3. VistaCreate:https://create.vista.com/ ,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 另外,还有一个海报设计的案例分享——东阿阿胶。其步骤包括得到需求、提取元素、绘制线稿、用 controlnet 转绘上色、ps 优化、定稿。具体为:确定需求并提取元素,如风格要潮流插画、有唐代元素和国潮等;绘制线稿,根据需求调整元素,如将驴子换成琵琶等;拆分元素线稿,绘制单个元素使其更精致,方便后期替换;利用拼接好的线稿跑图抽卡,选出合适的进行 ps 优化;最后根据客户需求进行元素替换得到定稿。上色运用的大模型为 GhostMix 鬼混_V2.0,lora 模型为“盒子系列——平面国潮插画_v1.0:182ba9e2f576”,controlnet 模型为“Module:lineart_coarse,Model:contr”。
2025-03-26
不懂得提问ai,得出的答案总是不满意,又得费很多时间自己改
以下是一些关于如何向 AI 提问以获得满意答案的建议: 1. 避免追问 AI,因为这可能导致回答越来越离谱。可以使用 ChatGPT 的 temporary chat 功能,保证 AI 在没有任何记忆的情况下生成最新鲜的回答。 2. 当 AI 回答不理想时,可以告诉它退一步,重新审视整个结构,设想从零开始如何设计,以获得更简洁、直观的解决方案。 3. 如果 AI 自己猜测并修改问题,可让它依据日志判断问题所在。 4. 对于刚开始接触 AI 的用户,很多时候答案不符合预期并非 AI 能力问题,而是用户没有把问题和要求描述清楚。在提问时要把背景描述完整,把要求解释清楚,包括细节。 5. 推荐使用 5W1H 方法充分说明信息,即说清楚为什么(Why)、做什么(What)、啥时候(When)、涉及谁(Who)、在哪里(Where)、怎么做(How)。 6. 可以使用引号、分隔符号以及“首先、其次、最后”等连接词来组织 Prompt,赋予 AI 明确的角色,如专注于民商事法律领域的律师等。 7. 按照【设定角色+任务目标+上下文和背景信息+(正面要求)详细需求和细节性信息+(负面要求)限制和不需要的内容+回答的语言风格和形式】的格式进行提问。 8. 讲清楚背景和目的,例如律师在处理交通事故案件时,清晰描述案件事实、法规等。 9. 学会提出好问题,使用清晰、具体的语言,避免模糊表述,了解 AI 的工作原理和限制,以提高回答准确性。 10. 在应用 AI 之前,对工作流程进行细致拆解,将复杂任务分解成更小、更具体的环节,以便 AI 更精确执行。
2025-03-26
最近的AI新闻
以下是近期的 AI 新闻汇总: 3 月 12 日: 【AI 3D】 BlenderMCP:与 Claude AI 沟通,在 Blender 实现快速 3D 建模。 MIDI:单幅图像到 3D 场景生成。 Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】 MMStoryAgent:AI 多模态故事生成系统。 【AI 视频】 VACE:阿里推出一体化视频创作和编辑技术。 VideoPainter:腾讯开源视频编辑技术。 Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】 OpenAI:为开发者推出一套 AI Agent 开发套件。 R1Omni:阿里情感识别模型,通过视频识别情感。 Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。 Manus:宣布与阿里通义千问团队达成战略合作。 3 月 14 日: 【AI 模型及其他】 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。 OpenAI:4 项更新。 Bolt:一键将 Figma 设计转换为可运行的 Web 应用。 阿里:推出 AI 旗舰应用“新夸克”。 360 智脑团队:开源推理模型 LightR114BDS,复现 Deepseek 的强化学习效果。 【AI 视频】 Pika:更新 Pikaffects,新增多款变身特效。 Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。 Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。 【AI 绘图】 LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。 【AI 语音】 Sesame:开源 TTS 语音模型 CSM1B。 3 月 26 日: 【AI 模型及应用】 OpenAI:推出 GPT4o 图像生成能力。 谷歌:发布 Gemini 2.5 Pro Experimental 模型。 Trea:已内置 DeepSeekV30324。 【AI 音乐】 昆仑万维:发布全球首款音乐推理大模型 Mureka O1。 【AI 视频】 混元 Portrait:音频视频驱动图片肖像形成动画。 PPVCtrl:新可控制视频生成模型。 【AI 3D】 Vibe Draw: 草图进行 3D 建模。 PhysTwin:通过视频创建交互式物理数字孪生。 GroomLight:用于重打光的人体头发外观建模的混合逆向渲染。
2025-03-26
ai能写科技论文吗?
AI 能够写科技论文。在论文写作领域,AI 技术的应用正在迅速发展,能提供从文献搜索、内容生成、语言润色到数据分析等多方面的辅助。 一些常用的论文写作相关 AI 工具和平台包括: 1. 文献管理和搜索:Zotero 能结合 AI 技术自动提取文献信息,Semantic Scholar 是由 AI 驱动的学术搜索引擎,可提供文献推荐和引用分析。 2. 内容生成和辅助写作:Grammarly 可通过 AI 技术提供文本校对、语法修正和写作风格建议,Quillbot 是基于 AI 的重写和摘要工具,能帮助精简和优化论文内容。 3. 研究和数据分析:Google Colab 提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化,Knitro 用于数学建模和优化,可帮助进行复杂的数据分析和模型构建。 4. 论文结构和格式:LaTeX 结合了自动化和模板,可高效处理论文格式和数学公式,Overleaf 是在线 LaTeX 编辑器,提供丰富模板库和协作功能,简化论文编写过程。 5. 研究伦理和抄袭检测:Turnitin 是广泛使用的抄袭检测工具,Crossref Similarity Check 通过与已发表作品比较,检测潜在抄袭问题。 但需要注意的是,虽然 AI 工具是好东西,但目前大多数人还停留在零碎使用的阶段,未系统应用到工作场景中。比如有人像小明那样,在挑选和切换工具时浪费不少时间,导致效率降低。问题不在于 AI,而在于没有形成适合自己的 AI 工作方法论和流程。未来,科技精英可能更多扮演“与 AI 协作”的角色,引导 AI 工作并保持审慎监督。使用这些 AI 工具时,要结合自己的写作风格和需求,选择最合适的辅助工具。
2025-03-26
ai编程
以下是关于 AI 编程的相关信息: Trae 国内版 是国内首个 AI IDE,自带豆包 1.5pro 和满血版 DeepSeek R1、V3 模型。 具有国内用户友好、使用完全免费、内置预览插件等特性。 网址:Trae.com.cn 或点击文末【阅读原文】直接访问。 借助 AI 学习编程的关键 打通学习与反馈循环,包括验证环境、建立信心、理解基本概念,实现“理解→实践→问题解决→加深理解”的循环。 使用流行语言和框架,先运行再优化,小步迭代,借助 AI 生成代码后请求注释或解释,遇到问题三步走:复现、精确描述、回滚。 用好 AI 编程工具(如 Cursor)的关键技能 准确描述需求,清晰表达目标和问题。 具备架构能力,将复杂系统拆解为松耦合的模块。 拥有专业编程能力,能够判断 AI 生成代码的优劣。 具备调试能力,快速定位问题并解决,可独立或借助 AI 完成调试。
2025-03-26
ai编程
以下是关于 AI 编程的相关信息: Trae 国内版 是国内首个 AI IDE,自带豆包 1.5pro 和满血版 DeepSeek R1、V3 模型。 具有以下特性: 对国内用户友好,有中国官网、中文界面、国内模型,稳定且快速。 使用完全免费,无需折腾会员,下载后可直接使用。 内置预览插件,写完代码一键运行,所见即所得。 网址:Trae.com.cn 或点击文末【阅读原文】直接访问。 借助 AI 学习编程的关键 打通学习与反馈循环,包括验证环境、建立信心、理解基本概念,实现“理解→实践→问题解决→加深理解”的循环。 建议使用流行语言和框架(如 React、Next.js、TailwindCSS),先运行再优化,小步迭代,一次解决一个小功能,借助 AI 生成代码后请求注释或解释以帮助理解代码,遇到问题时采取复现、精确描述、回滚的步骤。 用好 AI 编程工具(如 Cursor)的关键技能 准确描述需求,清晰表达目标和问题。 具备架构能力,将复杂系统拆解为松耦合的模块,便于 AI 高效处理。 拥有专业编程能力,能够判断 AI 生成代码的优劣。 具备调试能力,快速定位问题并解决,可独立或借助 AI 完成调试。
2025-03-26
手绘风格图片生成模型
以下是关于手绘风格图片生成模型的相关内容: 艺术字生成: 模型选择:图片 2.1,输入提示词(可参考案例提示词)。 案例参考提示词: 金色立体书法,“立冬”,字体上覆盖着积雪,雪山背景,冬季场景,冰雪覆盖,枯树点缀,柔和光影,梦幻意境,温暖与寒冷对比,静谧氛围,传统文化,唯美中国风。 巨大的春联,金色的书法字体,线条流畅,艺术美感,“万事如意”。 巨大的字体,书法字体,线条流畅,艺术美感,“书法”二字突出,沉稳,大气,背景是水墨画。 巨大的奶白色字体“柔软”,字体使用毛绒材质,立在厚厚的毛绒面料上,背景是蓝天。 原文链接:https://mp.weixin.qq.com/s/jTMFYKxsN8dYNZu3VHKBnA 【06】在线生图定制主题海报: 操作步骤: 选择模型:推荐使用的模型,如(例图 1)风格模型>中国风>水墨工笔;(例图 2)风格模型>儿童>童话绘本;(例图 3)风格模型>MJ>剪纸艺术;(例图 4)风格模型>儿童>皮克斯(模型选择过程如图所示)。 输入画面描述:更好地描述画面的方法包括使用本课件提供的自选关键词、按主体+氛围+视角+画质的顺序输入关键词、使用括号()强调关键词。 选择画面大小:无界 AI 已将尺寸与用途标注在选项中,制作主题海报可选择 9:16 的宣传海报比例,选择 17283072 的分辨率可以更快生成图片。 其他设置:增加作图数量可以在同样参数的控制下一次性生成多幅图片,方便挑选。 优化海报:使用可画(https://www.canva.cn/?displaycomoption=true)在线编辑海报。 0 基础手搓 AI 拍立得: 背景:每次使用大模型工具时流程繁琐冗长,出于简化操作、提升效率的需求,萌生了“AI 拍立得”的概念,即拍即得,简化流程,让操作更直观、更高效。之前的直播分享内容中也有提到关于 AI 拍立得的能力,往期回顾: 在线体验:快速体验 AI 拍立得,微信小程序搜索:Pailido,丰富场景自由切换,可快速生成闲鱼文案、生成外卖/大众点评。 交互逻辑:用户选择拍摄场景类型并立即拍照,AI 自动识别和分析照片中的内容信息,依据预设场景规则迅速生成符合情境的反馈,避免繁琐操作。 实现场景: 图片转成文本:逻辑为用户上传图片后,大模型根据选择的场景生成与内容相关的文字描述或解说文本,核心是图片理解和文本整理润色,场景包括生成美食点评、朋友圈发布文案、闲鱼上架示例模版等。 图片转绘图片:逻辑为用户上传图片后,大模型按照指定的风格快速生成图像的转绘版本,适应不同风格和场景需求,核心是图片风格化滤镜,场景包括图片粘土风、图片积木风、图片像素风等。
2025-03-18
手绘风格的提示词
以下是关于手绘风格提示词的相关内容: 给自己做一个卡通头像: 1. 简单提示词:在聊天窗口输入/imainge 找到/imagine prompt,然后把刚才的链接放进去,然后空格。加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数。 2. 设置参数: iw 1.5:设置参考图片的权重,数值越高与参考的图片越接近,默认是 0.5,最大是 2,可选择中间的某个值并调整。 s 500:设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力。可设置为 0 1000 间任意整数。 v 5:指用 midjourney 的第 5 代版本,这一代的最真实,目前 v5 需要订阅付费,不想付费可以使用v 4。 no glasses:指不戴眼镜,若不喜欢戴眼镜的图片,可以加上这个设置。 3. 效果示例:完整的提示词如下simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5。如果对生成的图片不满意,可以选择调整s 和iw 的值来进行多次尝试。 AI 绘画常用提示词: 1. 风格提示词: pointillism 点彩派 Claude Monet 克劳德莫奈 quilted art 桁缝艺术 partial anatomy 局部解剖 color ink on paper 彩墨纸本 doodle 涂鸦 Voynich manuscript 伏尼契手稿 book page 书页 realistic 真实的 3D 3D 风格 sophisticated 复杂的 photoreal 真实感 national geographic 国家地理 hyperrealism 超写实主义 cinematic 电影股的 architectural sketching 建筑素描 symmetrical portrait 对称肖像 clear facial features 清晰的面部特征 interior design 室内设计 weapon design 武器设计 subsurface scattering 次表面散射 Game scene graph 游戏场景图 character concept art 角色概念艺术 风格提示词|STYLE PROMPTS: Gusty:强劲和充满活力的音乐风格,通常具有风起云涌和激烈的特质。典型使用于表现强劲和充满活力情感的音乐作品,示例为 Led Zeppelin 的《Immigrant Song》,关联流派为 Rock,Hard Rock,Metal。 Halcyon:宁静和美好的音乐风格,通常具有平静和祥和的特质。典型使用于表现宁静和美好情感的音乐作品,示例为 Enya 的《Only Time》,关联流派为 New Age,Ambient,Folk。 Hammering:敲击和强烈节奏的音乐风格,通常具有强烈和激烈的特质。典型使用于表现强烈节奏和激烈情感的音乐作品,示例为 Metallica 的《Master of Puppets》,关联流派为 Metal,Rock,Industrial。 Handcrafted:精心制作和手工艺的音乐风格,通常具有细腻和独特的特质。典型使用于表现精心制作和独特情感的音乐作品,示例为 Fleet Foxes 的《White Winter Hymnal》,关联流派为 Folk,Indie,Acoustic。
2025-03-07
有没有工作流可以将宠物的照片变成手绘的电子画像
以下是一些可以将宠物照片变成手绘电子画像的工作流: 1. SDXL Prompt Styler 工作流:可以把图片转化成近百种风格。例如,将手绘风格的宠物照片转绘成折纸风时,最好不要加入线稿边缘(canny)的 controlnet 控制,或者需把 canny 的控制强度(strength)调到较小。原始图像是手绘风格时,手绘线条和折纸风格本身互斥。若转成漫画风格并想较好保留人物外轮廓,加入 canny 控制能更好还原人物原本造型。有时直接用插件内置预设的提示词组合不一定能达到想要的效果,需在 prompt 中再加一些特定风格的关键词。此外,该工作流结合 Vid2Vid Style Transfer with IPA&Hotshot XL 工作流,可较好实现视频不同风格的稳定转绘。 2. 小王子 Roy 的工作流:用 Coze 搭建神奇宠物诞生器。包括随机生成属性和宠物描述,对于不会写代码的小伙伴,可使用内置的“尝试 AI”功能,但要注意尽量选择 python 代码编写,书写前确定好输出变量等。生成宠物形象使用 coze 自带的文生图工具 text2image 插件,宠物形象描述文字生成使用图片理解插件 imgUnderstand,生成宠物的名字借鉴特定逻辑,生成宠物小传/技能/使命调用前面节点的数据,最后整理输出引用前面节点的多个数据。 3. 《艾小喵绘本》工作流:基于扣子的全自动绘本创作 Agent,源于兴趣和好奇,尝试从半自动实现全自动。
2025-03-03
我想根据一些旧照片,使用AI绘画重新画一下,希望可以更像手绘,可以打印出来出来作为纪念,有什么工具可以用
目前有以下几种工具可供您选择来实现根据旧照片进行类似手绘风格的 AI 绘画并打印出来作为纪念: 1. DALL·E2:能够生成逼真且富有创意的图像,包括手绘风格。 2. StableDiffusion:具有强大的图像生成能力,可通过设置相关参数获得手绘效果。 3. Midjourney:能创作出风格多样的图像,包括您期望的手绘风格。 您可以根据自己的需求和使用习惯选择适合的工具。
2024-12-20
推荐coze手绘头像工作流
以下是关于 coze 手绘头像工作流的相关内容: 炉石抽卡机 coze bot 工作流: 1. 复制之前完成的图像流,将新制作的两个卡套替换上去,并微调叠图和添加文字的位置,得到 3 个图像流,分别对应 3 种不同类型卡牌的生成。若期望更多类型,可用相同的标准操作流程操作。 2. 用简单代码做非平均的随机数生成,如随从卡牌 80%,普通传说 19%,金色传说 1%。有个小彩蛋“慧凌”,输入可获得金色传说·大聪明。 3. 用选择器链接所有 3 个类型的卡牌生成图像流。 4. 将工作流添加到 bot 里,补充触发提示词、开场白、背景和图标。 工作流的功能实现: 1. 生成 3 行卡牌的描述和提示词内容填充,利用大语言模型,让用户输入的要求作为上下文,输出 3 行卡牌描述及提示词中的基础元素。 2. 从两份画图提示词中选取一份,采用随机策略选取。 3. 增加两种不同的卡片,并提供随机抽卡效果,重复图像流第一部分的抠图,得到 3 张不同的卡套。 0 基础手搓 AI 拍立得工作流: 1. 上传输入图片。 2. 理解图片信息,提取图片中的文本内容信息。 3. 场景提示词优化/图像风格化处理。 4. 返回文本/图像结果。 零代码版本选择 Coze 平台,搭建流程时主要关注以下步骤: 上传图片:将本地图片转换为在线 OSS 存储的 URL,以便在平台中调用,主要通过图像流过一道。 插件封装:将图片理解大模型和图片 OCR 封装为工作流插件,实现便捷调用,如果市场中有可直接使用。
2024-12-04
推荐可以生成手绘视频的人工智能
以下是为您推荐的可以生成手绘视频的人工智能: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果您熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 另外,还有一些相关产品: 1. Argil:AI 生成自己的克隆视频,上传一段视频,等待训练完成输入文字后就会生成与视频人物一致的说话视频,而且支持编辑背景以及多种语言的创建。 2. Magnific AI:正在从一个图像放大工具变成一个图像生成和编辑工具,将会在周一发布图像风格转换器。您可以利用提示词将自己上传的图片变成任何风格。 Runway 的 Gen2 具有以下主要能力: 1. 文生视频(Text 2 Video)、Prompt+图像生成视频(Text + Image to Video),也支持无 Prompt 直接图片转视频(Image to Video)。 2. 9 月的更新中,支持了 1 10 级的 motion slider 调节,默认幅度为 5。 3. 同时支持水平、垂直、空间和旋转的运镜,并且支持调节运动速度。 4. 除了最基础的图像、视频生成能力,还提供 30 多项图片、视频处理能力,包含 Inpainting 视频修复、Motion Tracking 视频主体跟随运动、Remove Any Background 删除视频元素/背景、3D Texture 生成 3D 纹理等。 近期 Runway 控制台上线了 Watch 模块,可以查看官方精选的创意案例。更多的文生视频的网站可以查看这里: 内容由 AI 大模型生成,请仔细甄别。
2024-10-24
生图之后怎么保持原图改尺寸扩展
以下是关于生图后保持原图改尺寸扩展的方法: 对于 SD : 1. 将原图导入到图生图界面。 2. 根据情况选择大模型,卡通类一般选“revAnimated”,真实类选“Realistic Vision”,效果不好可尝试其他模型。 3. 图生图中重要参数设置:“缩放模式”选择“缩放后填充空白”;根据扩展方向增加宽度或高度;单批数量按需填写;“重绘幅度”加大到“0.8”以上。 4. 升级到最新的 controlnet 版本,将图片导入。 5. 启用插件,“控制类型”选择“局部重绘”,预处理器选择“inpaint_only+lama”,控制模式选择“更倾向 Controlnet”,缩放模式选择“缩放后填充空白”。 6. 为了出图更统一,可增加一个 reference_only 的通道巩固扩图风格。 7. 设置好后点击生成,选择满意的结果。 对于 Midjourney : 1. 放大(Upscale):包括精细放大(Subtle)尽量保持原样,创意放大(Creative)会调整或改变某些细节。 2. 重混(Remix):微妙(Subtle)为较小微调,较强(Strong)有较大差异。若没看到 Remix 按钮,点击右上方 More options 文字把常用的打上对勾。 3. 扩展(Pan):根据选定方向自动扩展图像边界。若没看到此按钮,可能是图像已在 Discord 中生成最满意的一张不可再扩展,或 More options 文字里没打上 Pan 对勾。 4. 缩放(Zoom):实际为“缩小视图”,会在图像周围添加额外空间展示更多内容。 5. 更多(More):包括重新运行提示词,或打开图像的编辑模式。重新生成(Rerun)再次运行相同提示,编辑器(Editor)编辑图像特定部分。 对于星流一站式 AI 设计工具: 1. 应用图生图:在 prompt 输入框下点击“图生图”上传本地文件,或在无限画布中图片功能区进行选择。 2. 调整“图生图”功能区参数:参考程度分为更像原图(小幅度修改基底图像,有限增加元素)、更创意(大幅度修改基底图像,可搭配增强模型加入更多元素)、自定义(可自定义修改重绘幅度)。 3. 增加参考纬度:点击添加按钮,会自动应用并打开“生成器”的图片参考功能。 4. 替换图像:鼠标滑动到图像,点击“选择参考图”即可重新选择图片。 5. 转换提示词:反推参考图信息填入进提示词框中。 6. 同步生图尺寸:同步参考图尺寸到“生成器”的生图尺寸中。 需要注意的是,新生成的部分和原图可能会存在色差,需要通过调整各项参数来修正,且不是每一次效果都能非常好。只要记住这个工作流,扩图还是很快的,只要替换图片改尺寸就可以了。
2025-02-11
图片扩展
以下是关于图片扩展的相关内容: 使用 SD 进行图片扩展: 1. 将图片导入到图生图界面。 2. 根据情况选择大模型,卡通类一般选“revAnimated”,真实类一般选“Realistic Vision”,效果不好可尝试其他模型。 3. 图生图中重要的参数:“缩放模式”选择“缩放后填充空白”;根据扩展方向调整尺寸;单批数量按需填写;加大“重绘幅度”到“0.8”以上。 4. 升级到最新的 ControlNet 版本,将图片导入,启用插件,“控制类型”选择“局部重绘”,预处理器选择“inpaint_only+lama”,控制模式选择“更倾向 ControlNet”,缩放模式选择“缩放后填充空白”。 5. 为使风格统一,可增加“reference_only”通道。 6. 设置好后点击生成,选择满意的结果。 7. 试验时可通过反推提示词增加文本控制,但效果不一定每次都好,可能存在色差,需调整参数修正。 8. 以建筑图为例,调整尺寸,分别放入“图生图”和“ControlNet”中点击生成即可。记住工作流,替换图片改尺寸就能快速扩图。 悠船中的图片调整: 1. 常用内容包括变化(细微或强烈改变)、高清(“直接”或“创意”放大)、风格变化(基于垫图再创作)、拓展(上下左右扩展图片)、缩放(镜头调整)、局部重绘(选择区域建议大些)。 2. 使用图片即垫图,使用风格即参考风格,使用提示词即复制提示词。 3. 在悠船中可利用垫图和提示词配合生成符合要求的建筑、风景、文物等,将图片复制到提示词框并填写提示词描述。 悠船的其他操作: 1. 基础页面操作包括想象历史(创作记录、创建文件夹、筛选器、预览形式)和套餐选择(年费模式、月费模式,价格越高对应做图数量、同时出图数量越多、生成速度越快,初次使用者可先从免费版开始,同时出图 3 指三列图,每列 4 张)。
2025-01-20
图片扩展
以下是关于图片扩展的详细介绍: 使用 SD 进行图片扩展: 1. 将图片导入到图生图界面。 2. 根据情况选择大模型,卡通类一般选“revAnimated”,真实类一般选“Realistic Vision”,效果不好可尝试其他模型。 3. 图生图中重要的参数设置: 缩放模式选择“缩放后填充空白”。 按需求增加宽度或高度来调整尺寸。 单批数量可按需填写以增加抽卡概率。 将“重绘幅度”加大到“0.8”以上。 4. ControlNet 的设置: 升级到最新版本,导入图片。 启用插件,“控制类型”选择“局部重绘”,预处理器选择“inpaint_only+lama”,控制模式选择“更倾向 ControlNet”,缩放模式选择“缩放后填充空白”。 还可增加一个 reference_only 的通道巩固扩图风格。 5. 点击生成,等待结果并选择满意的图片。 使用悠船进行图片扩展: 1. 点击进入对应的图片,常用的操作有变化、高清、重塑、扩图等。 变化:细微改变幅度小,强烈改变幅度大。 高清:“直接”表示直接出高清,“创意”表示在原图基础上进行微小优化调整。 风格变化:基于上传图片(垫图)再创作。 拓展:可上下左右扩展图片。 缩放:指镜头,如 2x 表示镜头拉远 2 倍。 局部重绘:选择区域建议大一些,太小无法修改。 2. 操作时,使用图片即垫图,使用风格即参考图片风格,使用提示词即复制图片的提示词。 在进行图片扩展时,可能不是每次效果都非常好,新生成部分和原图可能存在色差,需要通过调整各项参数来修正。记住工作流,替换图片改尺寸即可快速扩图。
2025-01-20
如何把已经写好的内容放入ai做ppt,并且ai不会自动扩展。
要将已写好的内容放入 AI 做 PPT 且不让 AI 自动扩展,可以参考以下方法: 1. 使用 Kimi.ai 等工具将思维导图图片转成 PPT。 2. 对于 AI 辅助生成 PPT,其原理和作用包括: 减轻排版工作的压力。 生成打底的内容,减轻人写内容的工作。 文章生成 PPT 时,让 AI 帮忙摘要内容,生成大纲列表;主题生成 PPT 时,让 AI 根据主题扩充成大纲列表,乃至具体内容。 在特定场景下可直接使用,如学生快速为小组展示配 PPT。 3. 具体流程为:用户输入内容,AI 输出,然后通过排版网站处理。网站把 AI 输出的文本丢给 LLM,让其根据内容在已有的 UI 组件中选择更适合的组件,按时间线为每页 PPT 的文字选出整个 PPT 中每一页的 UI 组件。有的网站如 tome、gamma,配图也是由 GenAI 根据页面内容生成的。 4. 另外,还可以参考以下案例中的方法,如在办公场景中,用 ChatGPT 生成 Markdown 语法的内容,再借用 MindShow 工具把 Markdown 内容转换为精美的 PPT。
2025-01-14
通过ollama和通义千问大模型,如果要实现一个智能机器人,支持模型微调,扩展知识库,问答记忆功能的实现步骤
要通过 Ollama 和通义千问大模型实现一个支持模型微调、扩展知识库和问答记忆功能的智能机器人,可参考以下步骤: 1. 安装和启动 Ollama 服务: 在 Mac 上启动 Ollama 应用程序,在 Linux 上通过 ollama serve 启动。 通过 ollama list 确认服务是否已启动。 2. 下载模型: 可下载如 Gemma(7B 模型)、Mistral(7B 模型)、Mixtral(87B 的 MoE 模型)、Qwen(通义千问,7B 模型)等。 3. 了解 Ollama 的特点和优势: 支持多种大型语言模型,包括通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 易于在 macOS、Windows 和 Linux 系统使用,支持 CPU 和 GPU。 提供模型库,可通过 https://ollama.com/library 查找和下载不同模型,满足不同需求和硬件条件。 支持自定义模型,如修改温度参数调整创造性和连贯性,或设置特定系统消息。 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 社区贡献丰富,有多种集成插件和界面。 4. 安装相关模型:访问 https://ollama.com/download/ 进行下载安装。 5. 选择文本向量模型:使用文本向量模型 bgem3,可从 https://huggingface.co/BAAI/bgem3 下载。 6. 利用 FAISS 创建向量存储:从 hf 下载好模型放置在指定路径,通过相关函数创建高效的向量存储。 7. 实现 RAG:基于用户问题从向量数据库中检索相关段落,根据设定阈值过滤,让模型参考上下文信息回答问题。 8. 创建网页 UI:通过 gradio 创建网页 UI 并进行评测。获取完整代码可关注公众号发送 fin 获取 github 仓库代码链接。 9. 进行问答测试:对同样的问题和上下文,基于 Qwen7b、Gemma、Mistral、Mixtral 和 GPT4 分别进行多次测试。
2024-08-16
扩展以下内容到500字:数智中医是中医药融入“一带一路”的抓手当前,充分融合互联网、大数据、物联网、云计算、人工智能AI、区块链等数智技术对传统中医药服务进行全方位、全链条优化,提高全要素生产率,构建一批示范中医医疗机构、中医馆、中医健管中心,创新数智中医“检测、诊断、治疗、评价、管理”的新中医服务闭环,促进数智中医“产学研用”的国际合作及产业发展,助推重庆成为数智中医发展新高地。
数智中医作为中医药融入“一带一路”的重要抓手,在当今时代具有极其重要的意义。 如今,互联网、大数据、物联网、云计算、人工智能 AI、区块链等数智技术蓬勃发展,为传统中医药服务带来了全新的机遇。通过充分融合这些先进技术,能够对传统中医药服务进行全方位、全链条的优化。这种优化涵盖了从检测到管理的各个环节,全面提升了服务的质量和效率。 在检测方面,借助先进的技术手段,可以更精准地获取患者的身体状况信息,为后续的诊断提供更可靠的数据支持。诊断环节则因数智技术的融入而更加准确和高效,能够快速识别病症的根源。治疗过程中,数智技术能够辅助医生制定更个性化、更科学的治疗方案,提高治疗效果。 评价环节也得以创新,能够更全面、客观地评估治疗效果和患者的康复情况。而在管理方面,数智技术有助于实现对医疗资源的合理调配和高效管理,提高整个医疗服务体系的运行效率。 构建一批示范中医医疗机构、中医馆、中医健管中心,是推动数智中医发展的重要举措。这些示范机构将成为展示数智中医成果的窗口,吸引更多的关注和投入。同时,创新数智中医“检测、诊断、治疗、评价、管理”的新中医服务闭环,能够形成一个良性循环,不断提升服务水平和质量。 促进数智中医“产学研用”的国际合作及产业发展,对于推动中医药走向世界具有关键作用。通过国际合作,可以吸收借鉴其他国家的先进经验和技术,进一步完善数智中医体系。这将有助于提升我国中医药在国际上的影响力,为全球健康事业贡献中国智慧和力量。 重庆作为一个具有发展潜力的地区,有望借助数智中医的发展,成为这一领域的新高地,引领行业的发展潮流,为当地乃至全国的中医药事业注入新的活力。
2024-08-12