Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

根据草图生成图片

Answer

以下是关于根据草图生成图片的相关内容:

  • ComfyUI Flux 与 runway 制作绘画视频:
    • 生成图片:提示词告诉 flux 生成一张技术草图,如 CAD。
    • 绘制的视频:在 runway 里面,使用提示词从空白页面开始逐行创建,并把生成的图片作为尾帧。
    • 草图上色:使用 flux 的 controlNet,depth 固定,Union 版本不建议权重调太高,结束时间也需注意。
    • 生成上色后的视频。
    • how2draw Flux lora:分享一个好玩的 flux lora 展示绘画过程,触发词为 how2draw。
  • GPT-4 在草图生成中的潜在应用:文本到图像合成模型常缺乏空间理解和遵循复杂指令能力,而 GPT-4 可生成代码并按指示呈现为低质量图像。探索将 GPT-4 和现有图像合成模型结合,以 GPT-4 输出作为草图,能生成更贴近指令、质量更好的图像。
  • MJ 应用篇快速给 PPT 配图:
    • 复制图像链接:首先复制图片网址,然后在 discord 聊天栏输入/imagine prompt[图像网址]。
    • 复制提示词:回到官网复制图像提示词,再回 discord 粘贴到网址后面并空格。
    • 生成图像:输入命令等待生成,不理想可多次生成。之后可进行改变比例和镜头拉远、检查构图等操作,若构图不好可在当前图基础上再用 Zoom Out 1.5x。选好图可放入 PPT 调整构图。
Content generated by AI large model, please carefully verify (powered by aily)

References

ComfyUI Flux与runway制作绘画视频

这个是外国大佬@Ror_Fly的创意思路,很好的利用了runway的尾帧来制作动画,我也进行了实测,记录下来,关键的点,大家也可以发掘更多的玩法。[heading3]生成图片[content]提示词告诉flux,去生成一张技术草图,CAD提示词:eg:Flux短提示词,可以在上面提示词的里面提取[heading3]绘制的视频[content]在runway里面,使用提示词,告诉是从空白页面开始,逐行创建在runway里面,把生成的图片作为尾帧。[Gen-3 Alpha 1963070634,sketch drawing of a,ComfyUI_temp_lnmie_0,M 5.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/IsBRbeFi3oPoUGxYao9cwBcQn2d?allow_redirect=1)[heading3]草图上色[content]使用flux的controlNet,depth固定controlNet使用的是Union的版本,目前这个版本,不建议权重调的太高,结束时间也是。[heading3]生成上色后的视频[content][Gen-3 Alpha Turbo 766422618,A robot cat running,ComfyUI_temp_lnmie_0,M 5.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/RQBfbBGipoz4yNxpuZOcjc0Kn6c?allow_redirect=1)[heading3]how2draw Flux lora[content]再分享一个好玩的flux lora,用来展示绘画的过程。触发词:how2draw

报告:GPT-4 通用人工智能的火花

2.2.3在草图生成中的潜在应用近年来,文本到图像合成模型已经得到广泛探索,但它们常常缺乏空间理解能力和遵循复杂指令的能力[GPN+22]。例如,给定一个提示,如「在左侧画一个蓝色的圆,在右侧画一个红色的三角形」,这些模型可能会生成外观上很吸引人但不符合所需布局或颜色的图像。另一方面,GPT-4可以根据提示生成代码,并以更高的准确度按照指示呈现为图像。然而,渲染图像的质量通常非常低。在这里,我们探索了将GPT-4和现有图像合成模型结合使用的可能性,通过使用GPT-4输出作为草图。如下图所示,这种方法可以生成比任一模型单独生成更贴近指令的、质量更好的图像。我们认为这是一个利用GPT-4和现有图像合成模型优势的有前途的方向。它也可以被视为在第5.1节中更深入地探索的授予GPT-4工具访问权限的第一个示例。

MJ应用篇 快速给PPT配图

[heading2]稍微高级一点的薅[heading3]复制图像链接[content]这时候我们需要首先复制一下图片的网址:然后打开discord,在聊天栏输入/imagine prompt[图像网址][heading3]复制提示词[content]之后再回到官网,把图像的提示词也复制下来再回discord黏贴到刚才拷贝的网址后面,注意空个格[heading3]生成图像[content]都搞好以后输入命令,稍等一会儿就会得到一个内容和画风都和原图比较接近的图,注意:非自己做的图无法获得random seed所以不能弄得完全一样,如果效果不理想多反复生成几次吧。之后放大觉得还不错的一张,在放大的图里做如下步骤:[heading3]改变比例和镜头拉远[content]首先,点这个Custom Zoom此时可以改变拉伸镜头后的画面比例,如果是屏显PPT一般用16:9,如下图,把--ar这个参数后面的数值改成16:9(默认的方形构图这里是1:1)--zoom参数设置为1.5--zoom参数是镜头拉伸的倍数,1.5~1.7比较靠谱,太大(比如2)会有更大几率生成一些莫名其妙的东西[heading3]检查构图[content]选一张比较好的放大一下,就可以放进PPT调整构图了。构图如果没问题可以直接跳到:[6.提升分辨率](https://waytoagi.feishu.cn/docx/PF9Kdj7gXo0XeVxziCicWYytnVh#doxcn0yGP81zcgAUhSoeXsAsDrc)如果构图还是不太好的话可以在当前这张图的基础上再用一次Zoom Out 1.5x,这样做和直接2x不同,不会有太多奇怪的东西进来。这时候的构图可能就差不多了,选一张比较好的放大出来试试

Others are asking
推荐一下将草图生成效果图的agent
以下是为您推荐的将草图生成效果图的工具: https://www.stablevideo.com/tools ,该网站更新了草图变效果图的工具。 您还可以参考《》,了解相关实践。
2025-03-20
什么应用可以将草图进行绘制
以下是一些可以将草图进行绘制的应用: 1. Stable Diffusion:例如其中的 ControlNet 插件,如 tile 模型,可以对草图进行细化和加强细节。在放大图片时,能在较高的重绘幅度下保持画面质量。 2. 摩搭平台:可用于参加相关比赛,如“AI 梦一单一世界比赛”,作为底膜训练 Lora,并生成作品。 此外,在 AI 绘图中,还需要考虑构图、色彩、光影等因素,选择合适的景别和构图方式,以创作出高质量的作品。
2025-02-24
根据画好的房屋结构草图,生成平面图
以下是一些能够帮助建筑设计师审核规划平面图的 AI 工具: 1. HDAidMaster:这是一款云端工具,建筑师能在平台上使用主流的 AIGC 功能进行有趣的集卡式方案创作。它在建筑设计、室内设计和景观设计领域表现出色,平台搭载的自主训练建筑大模型 ArchiMaster 由建筑设计院开发,软件的 UI 和建筑设计成果颜值在线。 2. Maket.ai:主要面向住宅行业,在户型设计和室内软装设计方面运用了 AI 技术。设计师预先输入房间面积需求和周边土地约束,软件能自动生成户型图,并可查看详细设计结果。 3. ARCHITEChTURES:这是一个 AI 驱动的三维建筑设计软件,为设计师提供全新设计模式。在住宅设计早期阶段,可引入相关标准和规范约束 AI 生成的设计结果,保证设计合规性。 4. Fast AI 人工智能审图平台:从住宅设计图构件开始,形成全自动智能审图流程,包括自动导入设计图、自动区域划分、构件识别、强条审查和自动导出结果,同时为建筑信息自动建模打下基础,最终将建筑全寿命周期内的所有信息集成,实现数据汇总与管理。 每个工具都有特定的应用场景和功能,建议您根据具体需求选择合适的工具。但需注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-27
有帮助草图大师建模的ai吗
以下是一些能够帮助草图大师建模的 AI 工具: 1. CADtools 12:这是一个 Adobe Illustrator(AI)插件,为 AI 添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能帮助创建复杂几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,可根据用户输入的设计目标和约束条件自动产生多种设计方案。 此外,还有一些图片生成 3D 建模的工具,也可能对草图大师建模有帮助: 1. Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型。 2. Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象,再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域的模型生成。 5. VoxCraft:免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供了图像到 3D、文本到 3D 和文本到纹理等多种功能。 如果您需要绘制逻辑视图、功能视图、部署视图,以下工具可供选择: 1. PlantUML:文本到 UML 的转换工具,可通过编写描述性文本来自动生成序列图、用例图、类图等,从而帮助创建逻辑视图。 2. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 3. Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 4. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 请注意,虽然这些工具可以辅助创建相关视图,但它们不都是基于 AI 的。AI 在绘图工具中的应用通常涉及到智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,您应该考虑您的具体需求,比如是否需要支持特定的建模语言、是否需要与特定的开发工具集成、是否偏好在线工具或桌面应用程序等。
2024-08-23
根据产品平面图片可以生成产品360度3D视频
以下是一些根据产品平面图片生成产品 360 度 3D 视频的相关信息: ViggleAI:由 15 人团队打造,创始人是在多家知名公司工作过的华人 AI 研究员。其核心能力是将视频中的角色替换成其他形象,依赖自家训练的 3D 视频模型「JST1」,能够根据一张角色图片生成 360 度角色动画。目前支持 Discord 访问和网页版访问,Discord 平台已积累超 400 万用户。网页版访问:https://www.viggle.ai/ 官方推特:https://x.com/ViggleAI 。Move 模式能使图像角色移动,原始图像背景保持不变,擅长将特定角色融入动作场景,视频生成稳定性和角色前后一致性强。 Sora:可以将 2D 照片生成三维的 360 度景致,视频效果逼真,例如赛车在旧金山街道的视频、厨房照片生成的 360 度环视效果等。 工具汇总: MakeACharacter:一键生成 3D 数字人,可自定义面部特征,基于真实人类扫描数据,使用 Unreal Engine 渲染,支持中英文提示,兼容多个行业应用。链接:https://x.com/xiaohuggg/status/1743986486780076279?s=20 Rodin Gen1:3D 原生生成模型,拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术。链接:https://x.com/xiaohuggg/status/1743638052097184102?s=20 Skybox AI 0.9 版本更新:可以从文本提示或草图生成 360 度 3D 世界,使用 NeRF 技术,增强图像的空间深度和真实感,提供不同分辨率的 3D 网格下载。链接:https://x.com/xiaohuggg/status/1739926702158225859?s=20 扫描物体生成 3D 模型:使用 APP 扫描物体,完成 3D 全貌捕获,创建 AR QR 码,展示物体于任何地点,苹果新品官网展示中应用此技术。链接:https://x.com/xiaohuggg/status/1739259052448944139?s=20
2025-03-25
可以生成产品3D视频的AI
以下是一些可以生成产品 3D 视频的 AI 相关信息: Luma AI:原本是一家 3D 生成公司,6 月推出了 AI 视频生成产品 Dream Machine。其首席科学家表示团队主要考虑两种方案来实现 4D 生成,认为直接生成视频内容并转为 4D 更具潜力,能一定程度避开 3D 数据集不足的问题。Luma 视频生成时会关注一致性、深度信息、光学和动态的物理现象。Dream Machine 1.0 时期的 img2vid 能力很强,能保证大幅度运动时只有较少瑕疵,原图还原度也非常好。支持通过文本指令和图像创建高质量、逼真的镜头,为每个账号每月提供 30 次免费使用机会,但排队时间久。体验地址:https://lumalabs.ai 即梦 AI 视频生成:在输入 Prompt/文字指令时,应避免没有主语和抽象叠 buff 的描述,以及音效、声音的描述,因为产品目前仅支持生成视频画面,无法生成声音效果。 Move AI:在互联网产品设计领域,让人们看到了大幅降低 3D 动画制作成本的可能。未来设计师可能只需要拍摄特定动作并映射到制作好的 3D 模型中,快速制作动画方案。目前 Figma、Protopie 等产品支持的智能动画功能已经能够基于补间算法,在用户仅定义动画的开始和结束状态的情况下自动生成中间帧,未来不排除实现通过文字更加精确控制动画的可能。
2025-03-25
生成高清视频
以下是关于生成高清视频的相关信息: Meta 发布的 Meta Movie Gen 文生视频模型: 由视频生成和音频生成两个模型组成。 Movie Gen Video 是 30B 参数的 Transformer 模型,能从单个文本提示生成 16 秒、16 帧每秒的高清视频,相当于 73K 个视频 tokens,可进行精确视频编辑和个性化视频生成,在保持角色身份一致性和运动自然性方面表现出色,通过预训练微调范式完成,沿用了 Transformer 特别是 Llama3 的许多设计,预训练阶段在海量视频文本和图像文本数据集上联合训练,微调阶段进行有监督微调,还引入流匹配作为训练目标,效果优于扩散模型。 Movie Gen Audio 是 13B 参数的 Transformer 模型,能接受视频输入及可选文本提示生成高保真音频。 Sora 相对于其他文本生成视频 AI 的优势: 能够生成高达一分钟的高清视频。 支持生成不同分辨率、纵横比的视频。 能生成显示人物复杂、动态运动的视频,运动自然流畅。 能够捕捉和再现丰富的场景细节。 在生成长视频时能保持场景和角色的一致性。 能够处理多角色交互,角色互动自然有信服力。 采用类似 GPT 的技术,自然语言理解强大。 能模拟动作对环境的影响。 可以模拟视频游戏等数字环境。 一些海外的 AI 视频生成工具: Haiper(有免费额度):https://haiper.ai/ ,能文生视频、图生视频、素描生视频、扩展视频,生成 HD 超高清视频,文生视频支持选择风格、秒数、种子值,图生视频只能写提示词、秒数、种子值,还能进行视频重绘和局部重绘。 DynamiCrafter(免费):https://huggingface.co/spaces/Doubiiu/DynamiCrafter ,https://github.com/Doubiiu/DynamiCrafter?tab=readmeovfile ,能生成 2 秒图生视频,还可以做短视频拼长视频。 Morph studio(内测):https://app.morphstudio.com/ ,暂未对外开放,可在官网提交内测申请,discord 上可以免费体验,支持文生视频、图生视频,英文提示词,支持运镜、运动强度、尺寸、秒数设置,默认生成 3 秒视频。
2025-03-25
对口型的视频生成网站
以下是一些对口型的视频生成网站: 即梦 AI: 对口型功能介绍:是即梦 AI「视频生成」中的二次编辑功能,现支持中文、英文配音。目前主要针对写实/偏真实风格化人物的口型及配音生成,为用户的创作提供更多视听信息传达的能力。可上传包含完整人物面容的图片,进行视频生成,待视频生成完成后,点击预览视频下的「对口型」按钮,输入台词并选择音色,或上传配音文件进行对口型效果生成。目前支持语言:中文(全部音色),英文(推荐「超拟真」内的音色)。 技巧:上传写实/近写实的人物单人图片,目前不支持多人物图片对口型;输入 prompt,选择参数,点击生成视频,尽量确保人物无形变等扭曲效果;确保人物生成的情绪与希望匹配的口型内容匹配;在生成的视频下方,点击【对口型】;输入或上传需要配音的内容,注意视频生成时长和配音试听时长尽量对齐,点击生成;先对口型,再超分补帧。 基础功能介绍:新增默认参数配置功能,快来设置您惯用的生成参数吧~配置后,后续进入平台,所有功能参数将按照您默认配置的参数展示;若您配置时,已设置过一些内容,配置该参数面板不会修改您的当前的功能配置;参数配置后,您生成前仍然可以改变您每次生成的参数,最终生成按照您提交生成前的选择的配置生成。生成视频卡片的左下方:【重新编辑】:可于左侧面板重新编辑原始输入参数及信息,再次生产;【再次生成】:直接使用现有输入参数及信息再次生成;【发布】:提交满意的视频片段发布至后台,待审核通过后,您的视频会发布并展示至首页视频 tab 下。生成视频右下方(鼠标移动到卡片上显示):【视频延长】:可进行 2 次延长,支持续写 prompt,延长时长可在生成的视频模式内多选(标准模式/流畅模式),最高可支持 36s 的视频延长;【对口型】:针对清晰单人视频,输入音频源,或输入台词选择音色,进行对口型生成;【补帧】:可选 24fps,30fps,60fps,如视频内像素颗粒较为明显,建议选择 24fps/30fps 补帧;【HD】:二倍超分。生成视频卡片右上角(鼠标移动到卡片上显示):【下载】:导出您的视频;【收藏】:您可以收藏您满意的视频,方便后续定位。 其他声音克隆产品: PlayHT:https://play.ht/studio/ 包含预设音色,可免费克隆一个音色,如果想生成多个,把上一个音色删除就可以做新的。 Elevenlabs:https://elevenlabs.io/app 包含预设音色,新用户 1 美元开通一个月会员,可使用克隆音色。 魔搭社区:https://www.modelscope.cn/home 一个模型开源社区及创新平台,由阿里巴巴通义实验室(Institute for Intelligent Computing),联合 CCF 开源发展委员会,共同作为项目发起方。包含各种声音模型,有开发经验的朋友可使用。 Dubbingx:https://dubbingx.com/ 免费克隆音色,有桌面版,Mac、Window 均可用。 魔音工坊:https://www.moyin.com/ 对口型相关: Runway:静态图片+音频文件,可生成对口型视频;动态视频+音频文件,可生成对口型视频,但需要消耗 20 点。 Pika:静态图片+音频文件,可生成对口型视频。
2025-03-25
coze小红书爆款文章生成助手
以下是关于 Coze 小红书爆款文章生成助手的相关内容: 1. 画小二的 Coze 工作流配置:包括抖音热门视频转小红书图文的详细参数配置,如整体结构图、开始模块、Get_Video 模块、LinkReaderPlugin 模块、标题大模型、内容大模型、图片 Prompt 大模型、文生图 ImageToolPro 以及输出结果的参数配置。在标题和正文生成方面,有具体的要求和技能,如采用二极管标题法、使用爆款关键词、遵循小红书平台标题特性、保证正文口语化且长短在 200 字左右等。 2. 一泽 Eze 提出的样例驱动的渐进式引导法:强调精彩的 Prompt 对驱动 AI Agent 稳定运作的重要性,指出高质量 Prompt 依赖用户的逻辑思考和知识经验抽象表达,介绍了通过 12 个初始样例引导 AI 定制完美提示词的方法。 3. 雪梅 May 的 AI 学习日记:记录了对 Coze 的学习过程,包括了解到 Coze 是字节跳动的 AI agent 产品,可用工作流方式制作 AI 智能体,如爸妈防骗助手、热点文章生成器等,并分享了自己对 Coze 的初步理解,认为它能让无技术背景的人实现想法。
2025-03-24
将2D图生成3D模型的AI是什么
以下是一些能够将 2D 图生成 3D 模型的 AI 相关信息: 有几个团队正在追求根据文本或图像提示轻松生成纹理的机会,包括 BariumAI(https://barium.ai/)、Ponzu(https://www.ponzu.gg/)和 ArmorLab(https://armorlab.org/)。 微软与 blackshark.ai(https://blackshark.ai/)合作,并训练了一个 AI 从 2D 卫星图像生成逼真的 3D 世界(https://blackshark.ai/solutions/)。 生成性 AI 可以为游戏创建 2D 艺术、纹理、3D 模型,并协助关卡设计。
2025-03-24
可以为我找到在线更换图片颜色服务的AI网站吗
以下是一些可以在线更换图片颜色服务的 AI 网站相关信息: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,能在显存不够的情况下将图片放大到足够的倍数。 在最近新上线的 controlnet 模型中,Recolor 新模型可将黑白图片重新上色。 对于人物照片还原,可选择 realisian 的写实大模型,通过提示词描述颜色和对应内容,如黑色的头发、黄色的皮肤、深蓝色的衣服、浅蓝色的背景等。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 您可以通过以下网址获取更详细内容:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw
2025-03-25
图片信息提取
图片信息提取主要包括以下几个方面: 1. 实现工作流: 上传输入图片。 理解图片信息,提取图片中的文本内容信息。 场景提示词优化/图像风格化处理。 返回文本/图像结果。 零代码版本:选择 Coze 平台,将本地图片转换为在线 OSS 存储的 URL 以便调用,封装图片理解大模型和图片 OCR 为工作流插件。 2. 银海的工程视角 TrickleOnWeChat 方案: 设计信息整合和提炼的 Prompt 提示词,将 OCR 文本信息与图片识别信息关联整合,按信息分类分析方法整理并按指定格式输出,增加标签分类。 3. 星流一站式 AI 设计工具: 左侧图片案例板块包含大量图像例图与生图信息,滑动鼠标到“info”区域可直接将图像发送到画布与生图信息调取。 图像筛选功能包括推荐(根据生图参数推荐)、热门(推荐浏览量最高的图片)、搜索(输入描述进行图像搜索)。 图像调取包括点击“发送到画布”直接将图像发送到“无限画布”,生图参数调取包括整体调取(点击“发送到生成器”调取全部参数)和单个调取(点击右侧单独的发动键调取单个参数)。
2025-03-24
关于agent,图片生成
以下是关于 agent 和图片生成的相关信息: 关于 Agent Scheduler 插件用于图片生成: 点击排队设置任务,可在控制面板查看处理生成中的任务。 不想立即运行可点击暂停,也可在设置中勾选“禁用队列自动处理”。 可设置多个任务,完成后在任务历史中查看参数和结果,不满意可重新生成。 如需该插件,可添加公众号【白马与少年】回复【SD】获取。 Agent 相关比赛: 赛道包括图文创作赛道、实用工具赛道、互动创意赛道。 参考方向有内容生成、图像标注、图文匹配、数据可视化、设计辅助、自动化排版、图文识别、新闻和社交媒体、艺术创作、智能产品设计等。 AIGC 相关: Meta 开源了名为 Image Bind 的 AI 模型,是首个能同时绑定六种模式数据的模型,能推进人工智能在跨模式检索、嵌入空间算法、生成等方面的发展。 HuggingFace Transformers Agent 使编码 LLM 能动态组合其他 HF 模型解决多模态任务,提供自然语言 API,具有可扩展性,有单次运行和聊天执行两种方法,预定义工具包括文档问答、文本问答、图像生成等。
2025-03-24
去除图片水印工具
以下是一些去除图片水印的工具推荐: 1. AVAide Watermark Remover:这是一个在线工具,运用AI技术去除图片水印。它支持多种图片格式,如JPG、JPEG、PNG、GIF等。操作简便,上传图片、选择水印区域,然后保存并下载处理后的图片即可。还提供去除文本、对象、人物、日期和贴纸等功能。 2. Vmake:提供AI去除图片水印功能,用户可上传最多10张图片,AI自动检测并移除水印,处理完成后可选择保存生成的文件,适合需快速去水印并在社交媒体分享图片的用户。 3. AI改图神器:具备AI智能图片修复去水印功能,可一键去除图片中的多余物体、人物或水印,不留痕迹。支持直接粘贴图像或上传手机图像,操作简单。 此外,还有以下工具可供选择: 对于去除图片中特定物体(如右手手串),除了PS,SD局部重绘、Firefly、canva、Google photo、微软Designer等都有局部重绘功能。 ProPainter:可一键移除视频内物体或水印,基于E2FGVI实现。 收费但效果较好的工具如:https://anieraser.media.io/app。 效果一般的免费工具:https://onlinevideocutter.com/removelogo。 这些工具各有特点,您可以根据具体需求选择最适合的去水印工具。请注意内容由AI大模型生成,请仔细甄别。
2025-03-23
图片底下生成字幕的工具
以下为一些可以生成图片底下字幕的工具及相关方法: 1. Trae 多模态复刻产品: 创意来自@南瓜博士,具体原文可看其复现的文章:https://mp.weixin.qq.com/s/CEJ6ite843M4hPuyT5jB6Q 。 核心策略是使用截图让 Trae 理解后生成功能描述,修改后再让 Trae 完成开发和优化。 开始时需在本地新建一个文件夹,再用 Trae 打开该文件夹。 将图片发给 Trae,并带上相应提示词。 开发完成后在本地文件夹打开 index.html ,可能需要继续优化,如添加每行字幕之间的分割线、切割图片底部等。 公众号回复“字幕图片”,获取源代码。保存成.html 文件,在浏览器打开就能用。 2. 某软件(未提及具体名称): 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,如覆盖视频窗口,并将数字人拖动到合适位置。 点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 数字人视频完成后,点击右上角的“导出”按钮,导出视频以作备用。若要换脸,需使用另一个工具。
2025-03-23