Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有哪些本地生图工具

Answer

以下是一些本地生图工具:

  • Liblib 在线生图:Flux.1|Labubu LoRA_泡泡玛特-LoRA-stax-LiblibAI
  • 本地 ComfyUI Flux + Lora 工作流:flux+Labubu Lora.json ,关于 ComfyUI Flux + Lora 工作流相关介绍可以参考之前的作业:第十五期生图新王 FLUX.1 。工作流中涉及的主要模型网盘:https://pan.quark.cn/s/2797ea47f691 ,FLUX.1-schnell:[https://huggingface.co/black-forest-labs/FLUX.1-schnell/blob/main/flux1-schnell.safetensors] ,ae.safetensorsclip_l.safetensors
  • SDXL:可以将图片发送到图生图当中,大模型切换为“refiner”,重绘幅度开小一点,再次点击生成。还可以安装 refine 插件,在扩展列表中搜索 refine 并安装,启用后可在文生图界面直接使用 refine 模型。
Content generated by AI large model, please carefully verify (powered by aily)

References

第二十三期:Labubu

方式一:Liblib在线生图[Flux.1|Labubu LoRA_泡泡玛特-LoRA-stax-LiblibAI](https://www.liblib.art/modelinfo/da87c0d1ead0414a9c7f2df70c488d91?from=personal_page)方式二:本地ComfyUI Flux+Lora工作流[flux+Labubu Lora.json](https://bytedance.feishu.cn/space/api/box/stream/download/all/En6Jbdp3yoUX06x28OQc2aR2nHh?allow_redirect=1)关于ComfyUI Flux+Lora工作流相关介绍可以参考之前的作业:[第十五期生图新王FLUX.1](https://waytoagi.feishu.cn/wiki/QulMweTajijBakkvtgnc7sHXnPe)工作流中涉及的主要模型网盘:https://pan.quark.cn/s/2797ea47f691 FLUX.1-schnell:https://huggingface.co/black-forest-labs/FLUX.1-schnell/blob/main/flux1-schnell.safetensors[ae.safetensors](https://bytedance.feishu.cn/space/api/box/stream/download/all/NDxOb7IPmopwzExd2PVcIK4cn4f?allow_redirect=1)[clip_l.safetensors](https://bytedance.feishu.cn/space/api/box/stream/download/all/KBUVb8lOSodyHHxQo5AcWmLYnUb?allow_redirect=1)t5xxl_fp8_e4m3fn:

从游戏截图升级到KV品质,AI居然可以这样用!

目前市面上有线上和线下本地部署的两种AI:线上的优势为出图速度快,不吃本地显卡的配置,且无需自己下载动辄几个G的模型,还能看其他创作者的制作的涩图,但为了节约算力成本他们只支持出最高1024X1024左右的图,制作横板、高清等图片就会受限线下部署的优势为可以自己添加插件,不卡算力,出图质量高于线上平台,但是使用期间电脑基本处于宕机状态,如果配置不高的话还会出现生成半天之后爆显存的情况,导致出图失败[heading3]所以我们这里充分发挥线上和线下平台的优势[content]线上:找参考,测试模型线下:主要的出图工具在线上绘图网站的绘图广场上发现自己想要的画风点击创作,会自动匹配创作的使用的模型lora和tag截取一小张游戏人物作为底图,目的是将线上平台有限的算力全部堆在人物身上多批次,多数量的尝试不同的画风,得出最符合游戏的一款模型+lora组合最后在C站([https://civitai.com/](https://civitai.com/))上下载对应模型到本地,加载部署后就可以开始正式生图了!

【SD】向未来而生,关于SDXL你要知道事儿

还没完,我们到现在还只使用了一个base模型,接下来,将图片发送到图生图当中,大模型切换为“refiner”,重绘幅度开小一点,再次点击生成。可以看到细节又提升了不少,可惜的是,现在还不能配合tile来使用。在生成时间上,我的显卡是4080ti,速度在十秒左右。所以sdxl对于高配电脑还是可以接受的,但配置较低的朋友需要自己去测试一下了。当然,有人可能会说,这个操作好麻烦,生成一张图要去两个界面来回倒腾。在这里,我给大家再介绍一款插件。我们来到扩展列表中,搜索refine,点击安装插件,然后重启。启用这个插件,就可以让我们在文生图的界面直接使用refine模型,进一步到位的绘画。我填写一段正向提示词:a girl looks up at the sky in the city of cyberpunk,close-up,wearing a helmet,fantasy elements,game original,starry_sky,点击生成,生产过程中的显存使用情况,显存基本跑满。最终的生成图像用时36秒,效果我觉得非常好,很难想象这是曾经的sd能够直出的效果。然后,我用同样的提示词在midjourney里面进行了生成。从心里的实话来说,我觉得midjourney的美感把握和图像的细节绘制还是要更胜一筹的。但对于SD而言,它的优势并不在于美图直出,而是它强大的可操控性,只要继续在SDXL上去发展,它的未来是不可限量的。

Others are asking
有类似cherrystudio这种专门用于生图的Agent?
目前尚未有像 CherryStudio 这样专门用于生图的知名 Agent 。但在 AI 领域,不断有新的工具和技术出现,您可以持续关注相关的科技动态以获取最新信息。
2025-03-06
有什么AI生图网站支持生成汉字?
以下是一些支持生成汉字的 AI 生图网站: 1. ComfyUI Kwai Kolors 快手可图:支持中英文提示词工作流,有相关的下载安装设置教程,可生成汉字。您可以通过了解更多。 2. 豆包 App 支持文生图中文文字生成。
2025-03-06
怎么在AI文生图中精准的输出想要的文字
要在 AI 文生图中精准输出想要的文字,可以参考以下方法: Recraft 模型: 提供提示词加上文本位置,因为模型获得的输入数据越多,越容易产生精确输出。遵循指令比仅理解提示词更容易。 Tusiart 模型: 定主题:明确生成图片的主题、风格和表达的信息。 选择基础模型 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找内容重叠的 lora 以控制图片效果及质量。 ControlNet:可控制图片中特定的图像,如人物姿态、生成特定文字等,属于高阶技能。 局部重绘:下篇再学。 设置 VAE:选择 840000 即可。 Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 负向提示词 Negative Prompt:用英文写避免产生的内容,同样用单词和短语组合,用英文半角逗号隔开,不用管语法。 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 采样次数:选 DPM++2M Karras 时,采样次数在 30 40 之间。 尺寸:根据个人喜好和需求选择。 Liblibai 模型: 定主题:明确生成图片的主题、风格和表达的信息。 选择 Checkpoint:根据主题选择内容贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找内容重叠的 lora 以控制图片效果及质量。 设置 VAE:选择 840000 即可。 CLIP 跳过层:设成 2 。 Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,不用管语法和长句。 负向提示词 Negative Prompt:用英文写避免产生的内容,同样用单词和短语组合,用英文半角逗号隔开,不用管语法。 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 迭代步数:选 DPM++2M Karras 时,迭代步数在 30 40 之间。 尺寸:根据个人喜好和需求选择。 生成批次:默认 1 批。
2025-03-06
我想大规模进行文生图,然后图生视频,用什么方案比较好
以下是一些大规模进行文生图然后图生视频的方案: 1. 可以选择大语言模型 chatgpt、kimi 进行剧本分镜设定,文生图使用 midjourney 生成视觉画面,图生视频选择即梦 dreamina 制作动态画面,suno 音乐编曲,ondoku 主角台词配音,视频剪辑使用剪映。同时,视频中的小部分音效可在网上无版权下载,剪映中也有大量音效可用。 2. 对于视频的大部分片段,可以用 runway(https://app.runwayml.com/)制作,少数片段用即梦(https://jimeng.jianying.com/aitool/home)的动效画板和首尾帧。登录 runway 账户后,在首页左侧点击“Text/Imagine to Video”,上传图片,更改模型版本、输入提示词、修改生成的视频时长等。 3. 以下是一些图生视频模型的特点(从高到低排序): pd 2.0 pro:即梦生成的画面有点颗粒感,p2.0 模型理解能力更强,更适合连续运镜,适合做一些二次元动漫特效。 luma 1.6:画面质量挺好,但价格昂贵。 可灵 1.6 高品质:表现出色。 海螺01live:文生视频比图生视频更有创意,图生也还可以,但大幅度动作下手部会出现模糊,整体素质不错,价格较贵。 runway:画面质量不算差,适合做一些超现实主义的特效、特殊镜头。 智谱 2.0:画面特效出众,价格便宜,量大,但整体镜头素质稍差。 vidu1.5:适合二维平面动画特效,大范围运镜首尾帧出色,但价格贵。 seaweed 2.0 pro:适合动态相对小、环绕旋转运镜动作小的情况。 pixverse v3 高品质:首尾帧表现好,画面美学风格有待提升。 sora:不好用,文生视频较强,但图生视频抽象镜头多,不建议使用。
2025-03-06
飞书多维表格生图
飞书多维表格的相关生图功能如下: 生图入口 1:网页顶部的右方有生图按钮,点击进入生图界面。 生图入口 2:点进首页任意一个模型(checkpoint 或 lora),有运行按钮。 生图入口 3:点进任意一个模型下面的返图区(相关帖子),点开一张您喜欢的图片,右侧有做同款的按钮。点开之后可以选择自动复制他所有的设置,尝试复现他的图,体验他的设置效果。但需注意,这个生图是直接复现大佬操作,不一定能复现大佬的图,不过大概率能出与大佬同水平同要素的图。 此外,基于飞书多维表格还有以下相关内容: 输入观点一键生成文案短视频:基于其它博主开源的视频生成工作流做了功能优化,实现视频全自动创建。通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。涉及工具包括 Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。大体路径为通过 coze 创建智能体及工作流,使用 DeepSeek R1 根据用户观点创建文案再创建视频,发布 coze 智能体到飞书多维表格,在多维表格中使用字段捷径引用该智能体,在多维表格中创建自动化流程推送消息给指定飞书用户。 AI 编程与炼金术:Build on Trae 中,核心逻辑是用 Trae 开发一个浏览器插件,通过上一节里已经创建的飞书应用,把网页链接直接插入到多维表格内。
2025-03-05
多维表格生图
以下是关于多维表格生图的相关信息: Tusiart 生图入口: 1. 网页顶部的右方有生图按钮,点击进入生图界面。 2. 点进首页任意一个模型(checkpoint 或 lora),有运行按钮。 3. 点进任意一个模型下面的返图区(相关帖子),点开一张喜欢的图片,右侧有做同款的按钮。点开之后可以选择自动复制所有设置,尝试复现图片,体验设置效果。 Liblibai 生图入口: 1. 网页顶部的右方有生图按钮,点击进入生图界面。 2. 点进模型广场上任意一个模型(checkpoint 或 lora),有立即生图按钮。 3. 点进任意一个模型下面的返图区,点开一张喜欢的图片,右侧有在线生成的按钮。点开之后可以选择自动复制所有设置,尝试复现图片,体验设置效果。 此外,还有输入观点一键生成文案短视频的相关内容: 基于其它博主开源的视频生成工作流进行了功能优化,实现视频全自动创建。通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。涉及工具包括 Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。大体路径为:通过 Coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频;发布 Coze 智能体到飞书多维表格;在多维表格中使用字段捷径,引用该智能体;在多维表格中创建自动化流程,推送消息给指定飞书用户。
2025-03-05
我是经济学研究者,经常写作学术论文,投稿SSCI期刊,大模型幻觉太严重,在辅助文献综述写作方面,基本没有用处。你有好的用于文献综述写作的AI辅助工具吗?
以下是一些可能有助于您在文献综述写作中应对大模型幻觉问题的方法和工具: 1. 对于 ChatGPT ,您可以使用 temporary chat 功能,保证其在没有任何记忆的情况下生成最新鲜的回答。 2. 当发现模型回答不理想时,可以采取以下技巧: 告诉模型忘掉之前的所有内容,重新提问或新建会话窗口。 让模型退一步,重新审视整个结构,从零开始设计。 对于像 Claude 这种会自己猜测的模型,如果不确定,可以给它看日志,让其依据日志判断问题所在。 3. 您可以参考 Hallucination Leaderboard (大语言模型幻觉排行榜),了解不同模型的幻觉情况,该排行榜使用 Vectara 的 Hughes 幻觉评估模型计算各大模型在总结文档时引入幻觉的频率,用于评估 LLM 的事实一致性,并为 RAG 系统提供参考。完整榜单可通过查看。 4. Claude APP 即将添加网页搜索和推理功能,这或许意味着新模型即将发布,预计发布时间在一两周内。
2025-03-06
卡片笔记生产AI工具有哪些
以下是一些卡片笔记生产的 AI 工具及相关介绍: 1. 利用 ChatGPT 辅助完成单词卡片制作: 可以生成对应的单词内容,并整理好放入 Excel 文件中。 利用搞定设计批量产图,步骤包括点击右上角三个点、选择批量套版、按照步骤依次点击、保留要替换的部分等。 2. 以 Trae 为代表的自然语言交互式 AI 编程工具:能让程序小白迈出创造的第一步,只要有清晰需求和创意,就能将想法转化为实际产品。 3. 利用 AI 快速总结群聊消息制作笔记卡片: 方法是文字原文+提示词+AI 大模型+小卡片软件。 先将微信聊天内容批量复制,如多选想要复制的内容转发到群里或文件传输助手,收藏并转存为笔记后全选复制。还可使用能让电脑和手机设备剪切板共享的工具。
2025-03-06
查找论文的工具
以下是一些查找论文的工具: 1. Claude + Gamma.app:可以快速寻找符合条件的论文,提取精炼论文中某部分信息,还能找到适合的 PPT 制作工具并教会使用。例如,通过与 Claude 对话,可以解决学术网站条件搜索的问题,如搜索营销领域最权威的期刊、相关期刊中关于 chatgpt 的最新论文等,并进行摘要提取等操作。 2. Elicit:能让用户直接向文章本身提出问题,有助于在不必阅读整篇文章的情况下,了解文章是否涉及提出的问题。 3. 文献管理和搜索: Zotero:结合 AI 技术,自动提取文献信息,帮助管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 4. 内容生成和辅助写作: Grammarly:提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,帮助精简和优化论文内容。 5. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化。 Knitro:用于数学建模和优化的软件,帮助进行复杂的数据分析和模型构建。 6. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,提供丰富模板库和协作功能,简化论文编写过程。 7. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 在使用这些工具时,要结合自己的写作风格和需求,选择最合适的辅助工具。同时,注意对 AI 生成内容的仔细甄别。
2025-03-06
有什么语言学习类的工具
以下是一些语言学习类的工具: 1. 语言学习平台: FluentU:使用真实世界的视频,通过 AI 生成个性化的词汇和听力练习。选择学习语言,观看视频并完成相关练习,积累词汇和提升听力理解能力。 Memrise:结合 AI 技术,根据学习者的记忆曲线提供复习和练习,增强记忆效果。选择学习语言,使用应用提供的词汇卡和练习进行学习。 2. 发音和语法检查: Speechling:提供口语练习和发音反馈,帮助学习者改进口音和发音准确性。录制语音,提交给 AI 系统或人类教练,获取反馈和改进建议。 Grammarly:可以帮助提高写作的语法和词汇准确性,支持多种语言。将写作内容粘贴到 Grammarly 编辑器中,获取语法和词汇改进建议。 3. 实时翻译和词典工具: Google Translate:提供实时翻译、语音输入和图像翻译功能,适合快速查找和学习新词汇。输入或语音输入需要翻译的内容,查看翻译结果和示例句子。 Reverso Context:提供单词和短语的翻译及上下文例句,帮助理解和学习用法。输入单词或短语,查看翻译和例句,学习实际使用场景。 4. 语言学习应用: Duolingo:使用 AI 来个性化学习体验,根据进度和错误调整练习内容。通过游戏化的方式提供词汇、语法、听力和口语练习。下载应用,选择要学习的语言,并按照课程指引进行学习。 Babbel:结合 AI 技术,提供个性化的课程和练习,重点在于实际交流所需的语言技能。注册账户,选择语言课程,按照学习计划进行学习。 Rosetta Stone:使用动态沉浸法,通过 AI 分析学习进度,提供适合的练习和反馈。注册并选择学习语言,使用多种练习模式(听力、口语、阅读和写作)进行学习。 5. AI 对话助手: ChatGPT:可以用来模拟对话练习,帮助提高语言交流能力。在聊天界面选择目标语言,与 AI 进行对话练习。可以询问语法、词汇等问题,甚至模拟实际交流场景。 Google Assistant:支持多种语言,可以用来进行日常对话练习和词汇学习。设置目标语言,通过语音命令或文本输入与助手进行互动,练习日常用语。 对于 4 岁儿童练习英语口语的 AI 工具,有以下选择: LingoDeer:使用游戏和互动活动来教孩子英语,提供各种课程,涵盖从字母和数字到更高级的语法和词汇。具有家长仪表板,可跟踪孩子进度并设置学习目标。 Busuu:提供英语和其他多种语言的课程,使用各种教学方法,包括音频课程、视频课程和互动练习。具有社区功能,可让孩子与来自世界各地的其他孩子练习英语口语。 Memrise:使用抽认卡和游戏来教孩子英语,提供各种课程,涵盖从基本词汇到更高级的会话技巧。具有社交功能,可让孩子与朋友和家人一起学习。 Rosetta Stone:使用沉浸式方法来教孩子英语,让孩子在自然环境中使用英语,具有语音识别功能,帮助孩子练习发音。 Duolingo:免费的语言学习应用程序,提供英语和其他多种语言的课程,使用游戏化方法让学习变得有趣,提供各种课程帮助孩子保持参与度。 在为孩子选择 AI 工具时,要考虑他们的年龄、兴趣和学习风格,还需考虑应用程序的功能和成本。
2025-03-06
AI工具在人力资源岗位提效的应用场景
AI 工具在人力资源岗位提效的应用场景主要包括以下方面: 1. 招聘环节: 职位描述生成。 简历分析。 面试题设计。 自动化筛选候选人简历,提升筛选工作的效率和准确性,减少人力资源部门的工作负担,降低因人为错误导致的招聘成本浪费。 2. 员工绩效评估: 分析员工工作表现。 识别绩效趋势和提升点。 为管理层提供数据支持的绩效反馈。 3. 员工培训与发展。 在全行业中,基础办公提效方面如 PPT、Excel、会议报告、策划会、文案包装、图文海报、客服机器人 bot 等,都可以从【单个任务 task>角色 role>角色间协同 collaboration】显著提高工作效率。 此外,阿里云百炼大模型与猎聘携手共同推动招聘领域 AI 技术的全面升级,AI 赋能的全链路招聘流程,通过大模型的深度参与,显著提升了招聘效率和候选人体验,优化了整体业务效能。 但同时,人工智能在招聘中也存在潜在风险,如算法偏见、数据隐私和歧视等方面: 1. AI 偏见:训练数据集存在对特定社会群体或性别的偏见,可能会复制甚至加剧这些偏见。 2. 数据隐私:公司使用 AI 招聘系统收集大量个人数据,若被滥用,可能侵犯候选人隐私。 3. 算法偏见:数据集存在偏差会导致 AI 系统存在偏差。 4. 对残疾申请人:雇主使用 AI 招聘工具时,需为残疾申请人提供合理便利,确保不会无意或故意排除这些群体。 5. 种族和性别影响:AI 在招聘和晋升过程中存在无意中歧视某些种族和性别群体的风险。
2025-03-06
怎么可以通过好好利用“waytoagi”生成视频?从文字到图片最后到视频?具体可以用到哪些工具?
以下是关于如何通过“waytoagi”从文字生成视频以及相关工具的介绍: 在视频制作中,对于规避多人脸崩的镜头,AI生成多人脸易崩,可借助工具修复,如放大工具。终极解决办法是抽出有问题的帧进行修复,但时间成本高,也可换脸,但存在光影和边缘模糊等问题。 解决文字糊掉的问题,推荐使用将 2D 图片转成 3D 效果的工具,用可灵也能在很大程度上保持文字不变。 视频补帧一般使用 top video 黄玉,美图工具 still 可氪金提升视频帧率和画质,但对显卡要求高。 处理团队意见分歧,在传统片子和 AI 片子中,若对镜头或节点分歧较大,一般听写本子和拆分镜的人的意见。 扩图工具可用吉梦扩图,一次只需一个积分,操作方便,如上传图片后调整尺寸和扩图范围。 去水印工具如 HID 工具,还有很多其他去水印工具可选择。 利用现有工具生成艺术字和图片的流程:先点导入参考图,选择免费无版权且字体不太细的字,通过设置边缘轮廓或景深、参考程度、添加关键词等生成,还可进行细节修复和超清放大。利用参考图改变生成效果,参考程度可影响生成结果,不同风格的参考图能带来不同效果。生成视频和首尾帧,多生成几张图制作视频,通过首尾帧让图片有变化效果,但要注意写好提示词。同时,收集参考图时注意版权,可先在其他地方生成保存再当参考图。 以下是一些文字生成视频的 AI 产品: Pika:擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看: 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-06