直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

修复老照片的AI工具

回答

以下是一些修复老照片的 AI 工具及相关操作步骤:

工具

  1. Stable Diffusion:启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。还可使用 t2ia_color 模型和 controlnet 控制颜色。
  2. GFPGAN 算法:用于将人脸变清晰。
  3. 本地工具放大:https://www.upscayl.org/#download
  4. SD 放大:扩散模型可增加更多细节。
  5. 开源工作流:
  6. stability.ai 的 https://clipdrop.co/tools
  7. 画质增强 magnific:https://magnific.ai/
  8. Krea:https://www.krea.ai/apps/image/enhancer
  9. Image Upscaler:https://imageupscaler.com/
  10. 佐糖:https://picwish.cn/photo-enhancer-api?apptype=aps-bd-api&bd_vid=8091972682159211710
  11. 腾讯 ARC:https://arc.tencent.com/zh/ai-demos/humansegmentation?ref=88sheji.cn
  12. 腾讯开源的模型(能恢复老照片):https://github.com/TencentARC/GFPGAN,在线测试地址:https://replicate.com/tencentarc/gfpgan
  13. 美图老照片修复:https://www.x-design.com/quality/?channel=sllbd90&bd_vid=11711254260543749686
  14. Imglarger:https://imglarger.com/
  15. Let's Enhance:https://letsenhance.io/
  16. Waifu2x:http://waifu2x.udp.jp/

操作步骤

  1. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。
  2. 对照片在 ps 里进行角度调整和裁切。
  3. 把图片发送到图生图中,打开 stableSR 脚本,放大两倍。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【SD】用AI给老照片上色,岁月不改它模样

[title]【SD】用AI给老照片上色,岁月不改它模样启用MutiDiffusion插件,不开放大倍数,仅使用分块渲染的功能,能帮助我们在显存不够的情况下,将图片放大到足够的倍数。好了,经过一顿操作,我们就将这张图片处理完成了。对比一下看看,之前的黑白照片和经过上色高清化完成之后效果。同样的步骤,又还原了一张我妈妈的照片。在问到她当时穿的什么颜色衣服的时候,她记得可清楚了,想都没想就告诉我说是绿色的。这两张还算容易的,接下来就遇到比较棘手的照片了。比如这一张,是我外公外婆带着我妈和我舅舅。外公走得更早,我甚至都没见过一面,只有这些照片还记录着他存在的痕迹。而这张照片也有些年头了,一直被外婆好好保存着。人物多、场景复杂,像素非常的低,使得这张照片处理起来难度很大。我首先在ps里面进行了一下角度的调整和照片的裁切,然后使用刚才的步骤进行上色,但是直接上色的结果有点像是加了一层黄色滤镜,有颜色但是年代感还是太强了。而太具体的颜色指定,又容易让画面污染严重,因为内容实在太多了,光是指定衣服就得十来个颜色提示词,AI能分辨得清才怪。所以我决定放弃人物服装的颜色指定,只给一个场景方向,剩下的交给AI去自行决定。于是,我从网上找到了一张仙人洞的照片,让AI去帮我匹配色调。加入第二个controlnet来控制颜色,使用的是t2ia_color的模型。关键词只给了:蓝天、绿树、灰石砖这么简单的几个词。颜色终于正常了,最后经过脸部的修复和放大,得到了最终的效果。对比一下前后的效果,那个流逝的时光仿佛又回来了,外婆看到后也非常高兴,在微信上连连夸赞。

【SD】用AI给老照片上色,岁月不改它模样

[title]【SD】用AI给老照片上色,岁月不改它模样将照片放入到后期处理中,使用GFPGAN算法将人脸变清晰,不知道这个功能的可以参考我这篇文章——[【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487422&idx=1&sn=9cdf7ef37c2acb3c0fc3328d0ba8af74&chksm=c251597af526d06c921ea6728cb2a32bdf1d5f699e19d6ba13b849994e4d01af8a5144132aad&scene=21#wechat_redirect)。这个步骤,可以将我们的五官进行重绘,但是却没有办法将照片中的头发、衣服等其他元素变清晰。所以,接下来我将图片再发送到图生图当中,打开stableSR脚本,放大两倍。这个放大插件是所有插件中对原图还原最精准的,也是重绘效果最好的,不知道的朋友可以参考我的这篇文章——[【Stable Diffusion】超清无损放大器StableSR](http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487403&idx=1&sn=cbb96534fa6f58c37cf9fc64bc7ade0c&chksm=c251596ff526d0792b4bba0e21b69427b23e780824bdc75b22f1073e8bad6f61f30199fc8344&scene=21#wechat_redirect)。切换到sd2.1的模型进行修复,vae选择vqgan,提示词可以什么都不写,以免对原图产生干扰。

辅助工具:放大/扩图

[title]辅助工具:放大/扩图[heading2]图片放大本地工具放大:https://www.upscayl.org/#downloadSD放大:扩散模型可以增加更多细节开源工作流:[开源的Magnific AI的图片放大工作流](https://waytoagi.feishu.cn/wiki/A5LtwIV6KixSCckCOuYcAYpFnjb)开源工作流:[图像高清修复,无损放大N倍](https://waytoagi.feishu.cn/wiki/BDNJwt5uji6hkakgahGcp0LlnVb)stability.ai的https://clipdrop.co/tools画质增强magnific遥遥领先:https://magnific.ai/Krea https://www.krea.ai/apps/image/enhancerImage Upscaler:https://imageupscaler.com/佐糖:https://picwish.cn/photo-enhancer-api?apptype=aps-bd-api&bd_vid=8091972682159211710腾讯ARChttps://arc.tencent.com/zh/ai-demos/humansegmentation?ref=88sheji.cn腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN在线测试地址:https://replicate.com/tencentarc/gfpgan美图老照片修复:https://www.x-design.com/quality/?channel=sllbd90&bd_vid=11711254260543749686Imglarger:https://imglarger.com/Let's Enhance:https://letsenhance.io/Waifu2x:http://waifu2x.udp.jp/

其他人在问
入门学习AI
以下是为新手提供的 AI 入门学习建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 推荐新手使用 Kimi 智能助手入门学习和体验 AI,其不用科学上网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,也是目前对长文理解做的最好的 Ai 产品,能一次搜索几十个数据来源,无广告,能定向指定搜索源。 PC 端: 移动端 Android/ios:
2024-11-21
Langchain
LangChain 是一个用于构建高级语言模型应用程序的框架,具有以下特点和功能: 旨在简化开发人员使用语言模型构建端到端应用程序的过程,提供一系列工具、组件和接口,使创建由大型语言模型(LLM)和聊天模型支持的应用程序更易实现。 核心概念包括组件和链,组件是模块化构建块,可组合创建强大应用,链是一系列组件或其他链按顺序执行以完成特定任务。 具有模型抽象、提示模板和值、链、代理等功能。 支持多种用例,如针对特定文档的问答、聊天机器人、代理等,可与外部数据源交互并提供内存功能。 LangChain 与 RAG(检索增强生成)的关系: 框架与技术:LangChain 作为框架,提供实现 RAG 必需的工具和组件,RAG 技术可在其框架内实施利用。 模块化实现:允许开发者通过模块化组件构建 RAG 应用程序,如使用检索器和生成模型创建完整的 RAG 流程。 简化开发:通过提供现成的链和提示模板简化 RAG 应用开发过程。 提高性能:利用 LangChain 实现 RAG 可创建更高效、准确的应用,尤其在需大量外部信息辅助决策的场景。 应用构建:通过丰富的 API 和组件库支持构建复杂的 RAG 应用,如智能问答系统、内容推荐引擎等。 开发 LangChain 应用构建 RAG 应用时,LangChain 提供以下组件: 数据加载器:从数据源加载数据并转换为文档对象,包含页面内容和元数据。 文本分割器:将文档对象分割成多个较小文档对象,方便后续检索和生成。 文本嵌入器:将文本转换为高维向量,用于衡量文本相似度以实现检索。 向量存储器:存储和查询嵌入,通常使用索引技术加速检索。 检索器:根据文本查询返回相关文档对象,常见实现是向量存储器检索器。 聊天模型:基于大模型实现文本生成功能。 使用 LangChain 构建 RAG 应用的一般流程如下:(具体流程未给出)
2024-11-21
Aigc
AIGC 即 AI generated content,又称为生成式 AI,意为人工智能生成内容。例如 AI 文本续写,文字转图像的 AI 图、AI 主持人等都属于 AIGC 的应用。 AIGC 常见的产品项目和媒介众多。语言文字类有 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等;语音声音类有 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等;图片美术类有早期的 GEN 等图片识别/生成技术,去年大热的扩散模型带火了我们熟悉的 Midjourney、先驱者谷歌的 Disco Diffusion、一直在排队测试的 OpenAI 的 Dalle·2 以及 stability ai 和 runaway 共同推出的 Stable Diffusion 等。 SD 是 Stable Diffusion 的简称,是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型,主要用于根据文本的描述产生详细图像,是一种扩散模型的变体,叫做“潜在扩散模型”。其代码模型权重已公开发布,可以在大多数配备有适度 GPU 的电脑硬件上运行,当前版本为 2.1 稳定版。源代码库为 github.com/StabilityAI/stablediffusion 。 AIGC 是一种利用人工智能技术生成各种类型内容的应用方式,在内容创作、广告、媒体等领域有着广泛的应用,包括文字生成、图像生成、视频生成等。 AIGC、UGC 和 PGC 都是内容生成的不同方式。AIGC 由人工智能生成内容,优势在于快速、大规模生成内容,适用于自动化新闻、广告创作等;UGC 由用户生成内容,优势在于内容丰富多样,适用于社交媒体、社区论坛等;PGC 由专业人士或机构生成内容,优势在于内容质量高、专业性强,适用于新闻媒体、专业网站等。 AIGC 在 CRM 领域有着广阔的应用前景,主要包括个性化营销内容创作、客户服务对话系统、产品推荐引擎、CRM 数据分析报告生成、智能翻译和本地化、虚拟数字人和营销视频内容生成、客户反馈分析等方面。不过在应用过程中,仍需解决算法偏差、版权和知识产权等伦理法律问题。
2024-11-21
Ai是什么
AI 是一门令人兴奋的科学,它是某种模仿人类思维可以理解自然语言并输出自然语言的东西,其生态位是一种似人而非人的存在。 从技术角度看,AI 研究如何使计算机表现出智能行为,例如做一些人类所擅长的事情。最初计算机用于按照明确的程序进行数字运算,而对于像根据照片判断一个人的年龄这类无法明确编程的任务,正是 AI 所感兴趣的。 AI 已经渗透到各行各业,有着广泛的应用场景: 医疗保健方面,包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务领域,涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务中,有产品推荐、搜索和个性化、动态定价、聊天机器人等应用。 制造业里,涉及预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输行业也有相关应用。
2024-11-21
目前最方便的用来编程的免费AI有哪些?不能只会生成代码,还要像cursor一样有多种便利的编程功能
目前较为方便且具有多种便利编程功能的免费 AI 编程工具包括: 1. Cursor:是一个现代化的集成开发环境(IDE),具有 AI 辅助编码、代码自动补全、实时代码分析、多语言支持、集成终端、Git 集成、自定义主题、跨平台、性能优化和实时协作等特点。可通过 https://www.cursor.com/ 链接进入主页下载。 2. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议。 3. 通义灵码:阿里巴巴团队推出,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力。 4. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,可为开发人员实时提供代码建议。 5. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,可快速生成代码。 6. Cody:代码搜索平台 Sourcegraph 推出的 AI 代码编写助手,借助 Sourcegraph 强大的代码语义索引和分析能力,了解开发者的整个代码库。个人使用免费。 7. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供智能研发服务的免费 AI 代码助手。 8. Codeium:一个由 AI 驱动的编程助手工具,提供代码建议、重构提示和代码解释,提高编程效率和准确性。 此外,还有一些其他工具,如 Wing Python IDE Pro,专为 Python 编程设计,集成多种功能,但年度许可证起价 179 美元/月;Smol Developer 是开源的 AI 开发助手,能根据产品需求生成完整的代码库,遵循 MIT 许可证。 每个工具的功能和适用场景可能不同,您可以根据自身需求选择最适合的工具。更多辅助编程 AI 产品,还可以查看 https://www.waytoagi.com/category/65 。
2024-11-21
我想学习ai做副业赚钱,应该怎么做?
学习 AI 做副业赚钱可以参考以下步骤: 1. 基础学习: 了解 AI 基本概念,阅读「」部分,熟悉术语和基础概念,包括人工智能的主要分支及它们之间的联系,浏览入门文章了解其历史、应用和发展趋势。 开始 AI 学习之旅,在「」中找到为初学者设计的课程,推荐李宏毅老师的课程,通过在线教育平台按自己节奏学习并争取获得证书。 2. 深入学习: 根据兴趣选择特定模块深入学习,比如图像、音乐、视频等领域。 掌握提示词技巧,因其上手容易且实用。 3. 实践尝试: 理论学习后进行实践,巩固知识,尝试使用各种产品做出作品。 在知识库分享实践后的作品和文章。 4. 体验产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解工作原理和交互方式,获得实际应用中的第一手体验,激发对 AI 潜力的认识。 需要注意的是,学了 AI 有可能赚钱,但不保证每个人都能赚到钱。人工智能领域有很多高薪工作,如数据科学家、机器学习工程师等,学会 AI 技术可增加在这些岗位就业及职业发展的可能性。然而,能否赚钱还取决于个人的学习能力、实际应用能力、对市场和商业的理解等因素。仅仅学会基础知识可能不足以在竞争激烈的市场中脱颖而出,需要持续学习和实践。
2024-11-21
老照片修复
以下是关于用 AI 给老照片上色的详细步骤和方法: 1. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时放大图片。 2. 在 PS 里进行角度调整和照片裁切。 3. 对于人物照片还原,选择 realisian 的写实大模型,提示词直接描述颜色和对应内容。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 4. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。 5. 把图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 6. 对于复杂的照片,如人物多、场景复杂、像素低的,可先放弃人物服装颜色指定,只给场景方向,让 AI 自行决定颜色。还可加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,给出简单关键词如“蓝天、绿树、灰石砖”。 参考文章: 1. 2. 作者:白马少年,发布时间:20230910 19:00,原文网址:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw
2024-11-06
能修复老照片吗
AI 可以修复老照片。以下是一些相关的方法和工具: 可以使用 Stable Diffusion(SD)中的 controlnet 模型中的 Recolor 新模型为黑白老照片重新上色。提示词可直接描述颜色和对应的内容,ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰。 把图片发送到图生图中,打开 stableSR 脚本,放大两倍,切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 辅助工具方面: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可增加更多细节 开源工作流: 其他工具和网站: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN ,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/
2024-11-05
老照片修复用哪个AI软件比较好
以下是一些可用于老照片修复的 AI 软件和工具: Stable Diffusion:启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,可在显存不够时放大图片。还可使用 GFPGAN 算法将人脸变清晰,将图片发送到图生图中,打开 stableSR 脚本进行放大修复。 本地工具放大:https://www.upscayl.org/download 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强: magnific:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型(能恢复老照片):https://github.com/TencentARC/GFPGAN ,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/
2024-10-29
老照片修复
以下是关于用 AI 给老照片修复上色的详细步骤和方法: 1. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时放大图片。 2. 在 PS 里进行角度调整和照片裁切。 3. 将照片放入后期处理,使用 GFPGAN 算法让人脸变清晰。 4. 把图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 5. 对于人物照片还原,选择 realisian 的写实大模型,提示词直接描述颜色和对应内容。 6. ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 7. 对于复杂的照片,如人物多、场景复杂、像素低的,可先给场景方向,让 AI 自行决定颜色。还可加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,给出简单关键词如“蓝天、绿树、灰石砖”。 作者为白马少年,发布时间为 20230910 19:00,原文网址为 https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw 。
2024-10-29
AI怎么做老照片修复
以下是使用 AI 进行老照片修复的步骤: 1. 首先将图片发送到图生图中,打开 stableSR 脚本,放大两倍。stableSR 放大插件是所有插件中对原图还原最精准、重绘效果最好的。您可以参考文章——。 2. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写,以免对原图产生干扰。 3. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,能在显存不够的情况下,将图片放大到足够的倍数。 对于复杂的老照片,比如人物多、场景复杂、像素非常低的情况: 1. 首先在 ps 里面进行角度的调整和照片的裁切。 2. 然后按照上述步骤进行上色,如果直接上色效果不佳,比如像加了一层黄色滤镜、年代感太强,可以放弃人物服装的颜色指定,只给一个场景方向。 3. 从网上找到相关的参考照片,让 AI 去匹配色调。 4. 加入第二个 controlnet 来控制颜色,使用 t2ia_color 的模型,关键词只给简单的几个词,如“蓝天、绿树、灰石砖”。 5. 最后经过脸部的修复和放大,得到最终效果。 另外,在最近新上线的 controlnet 模型中,新增的 Recolor 模型可以将黑白图片重新上色,可用于老照片修复。
2024-09-28
老照片优化
以下是使用 AI 给老照片上色和优化的步骤: 1. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。stableSR 放大插件是所有插件中对原图还原最精准、重绘效果最好的。不了解的朋友可参考文章——。 2. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写,以免对原图产生干扰。 3. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,能在显存不够的情况下,将图片放大到足够的倍数。 4. 为做到颜色与内容的统一,启用之前讲到过的 cutoff 插件来进行控制,依次按顺序设置好颜色提示词。不了解这款插件的朋友可以参照文章——。 5. 在新上线的 controlnet 模型中,新增的 Recolor 模型可将黑白图片重新上色。 经过上述操作,就能完成老照片的上色和优化。
2024-09-27
大模型可以修复老旧的分辨率低的视频吗
大模型在修复老旧低分辨率视频方面是可行的,但具体效果因模型和方法而异。 例如,使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型、StableSR 模块和 VQVAE 等,通过不同的放大方法进行测试。如“Ultimate SD upscale”脚本放大,重绘幅度不同效果有别,重绘幅度大可能导致人物失真。“后期处理”的放大方法能使眼神更锐利,但对模糊的头发改善有限。而 StableSR 的放大则需要进行相应的模型和参数调整。 另外,像 Sora 这样的大型视觉模型,能够在原始尺寸上训练、理解和生成视频及图像。它可以处理不同格式和分辨率的视觉数据,保持原始宽高比,改善生成视频的构图和框架。其基础模型用于低分辨率视频生成,通过级联扩散模型细化提高分辨率,采用 3D UNet 架构,结合多种技术和方法,能生成高保真度且具有可控性的视频。
2024-11-17
照片修复
以下是关于照片修复的相关知识: 图像高清修复与无损放大的流程通常分为三部分: 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,因其处理时间长。 图像高清修复:使用 Iceclear/StableSR 等模型进行高清修复并 2 倍放大,搭配 Stable SR Upscaler 模型和合适的提示词,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。 图像高清放大:用 realisticVision 底膜进行二次修复,使用提示词反推 node 提取画面提示词,搭配 tile ControlNet 提升细节感,再用合适的高清放大模型二次放大。 用 AI 给老照片上色: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时将图片放大。 可在 PS 里调整角度和裁切照片,然后上色。对于复杂照片,可放弃人物服装颜色指定,只给场景方向,加入第二个 controlnet 控制颜色,如使用 t2ia_color 模型,关键词如蓝天、绿树、灰石砖。 将照片放入后期处理,使用 GFPGAN 算法清晰人脸,五官重绘后,再将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型修复,vae 选择 vqgan,可不写提示词以免干扰原图。
2024-11-06
请问修复旧照片怎么处理?
修复旧照片可以按照以下步骤进行处理: 1. 将照片放入后期处理中,使用 GFPGAN 算法使人脸变清晰。您可以参考文章。 2. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。stableSR 是所有插件中对原图还原最精准、重绘效果最好的。您可以参考文章。 3. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写,以免对原图产生干扰。 4. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,可在显存不够的情况下将图片放大到足够倍数。 5. 对于复杂的照片,可先在 ps 里进行角度调整和照片裁切,然后按照上述步骤上色。若直接上色效果不佳,比如像加了黄色滤镜或年代感太强,可放弃人物服装颜色指定,只给场景方向,让 AI 自行决定。比如从网上找相关照片让 AI 匹配色调,加入第二个 controlnet 控制颜色,使用 t2ia_color 的模型,给简单的关键词,如“蓝天、绿树、灰石砖”。 6. 修复时必须使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹中。StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹中。VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。
2024-10-31
请问修复旧的照片怎么处理?
修复旧照片可以按照以下步骤进行处理: 1. 将照片放入后期处理中,使用 GFPGAN 算法使人脸变清晰。您可以参考文章——。 2. 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。stableSR 是所有插件中对原图还原最精准、重绘效果最好的。您可以参考文章——。 3. 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写,以免对原图产生干扰。 4. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染的功能,能在显存不够的情况下,将图片放大到足够的倍数。 5. 对于复杂的照片,如人物多、场景复杂、像素低的照片,可以先在 ps 里面进行角度调整和照片裁切,然后按照上述步骤进行上色。如果直接上色效果不佳,比如像加了一层黄色滤镜或颜色指定导致画面污染严重,可以放弃人物服装的颜色指定,只给一个场景方向,让 AI 自行决定。比如从网上找一张匹配色调的照片,加入第二个 controlnet 来控制颜色,使用 t2ia_color 的模型,关键词可以只给“蓝天、绿树、灰石砖”等简单的词。 6. 修复时必须要使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹中。 7. StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹中。 8. 一个 VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。这三个文件可以在百度云盘的链接中获取。安装好之后,可以用一张从网上找的神仙姐姐的照片做测试。 需要注意的是,在修复过程中,不同的照片可能需要根据具体情况进行调整和尝试,以达到最佳的修复效果。
2024-10-31
有没有把外国PPT翻译为中文的工具
以下为您介绍将外国 PPT 翻译为中文的工具及相关方法: 有一种自动 PPT 翻译脚本,其开发过程如下: 1. 前期准备: 翻译需要外接 API,推荐讯飞大模型,新账户免费送 200 万 tokens,有效期 3 个月。 进入 https://xinghuo.xfyun.cn/ ,首页选择 API 接入,然后点服务管理进入控制台。 创建一个新项目,比如“PPT 翻译”,以避免 API 泄露。 点进去,找到左边机器翻译的模型,按提示领取 200 万 tokens 的礼包,然后在主控台看到对应的 id、apikey、api secret 和接入路径。 2. 导入依赖: 大部分依赖是常用的,只有一个 ppt 可能需要装,运行 CMD 输入 pip install pythonpptx,如果还缺的可以按提示安装。 3. 初始化 API 相关信息和文件路径: 先设置对应的 api 信息,其他模型可以对应做替换。 4. 读取并提取 PPT 文本: 根据讯飞的 API 文档配置做请求指令,确保 API 可以正确调用。打印响应数据设置方便监测脚本执行动态,如果碰到报错可以随时做优化。 5. 翻译脚本: 目前只设置了文本翻译,未对表格元素处理,排除了所有 shape,如果要加入表格翻译,可以定义 shape = table 来定义表格,然后翻译表格里的 cell 实现。 接收路径已调好,如果用其他的 API,要在 translated_text = get_result 后面替换成自己的地址。 语言选择,原文件是中文用'cn'表示,英文文档改成‘en’,其他语种对应。 此外,还有 Claude 官方文档提示词工程最佳实践@未来力场编译版(中英对照),源地址 https://docs.anthropic.com/claude/docs ,扫码关注未来力场:AIGC 最佳实践中文互联网搬运工。
2024-11-21
企业做自己的小模型,需要用到的工具及工具背后的公司都有哪些?
企业做自己的小模型,可能会用到以下工具及背后的公司: 1. 在编排(Orchestration)方面,涉及的公司如 DUST、FIAVIE、LangChain 等,其提供的工具可帮助管理和协调各部分及任务,确保系统流畅运行。 2. 部署、可扩展性和预训练(Deployment, Scalability, & PreTraining)类别中,像 UWA mosaicm、NMAREL、anyscale 等公司提供的工具,有助于部署模型、保证可扩展性及进行预训练。 3. 处理上下文和嵌入(Context & Embeddings)的工具,相关公司有 TRUDO、Llamalndex、BerriAI 等,能帮助模型处理和理解语言上下文,并将词语和句子转化为计算机可理解的形式。 4. 质量保证和可观察性(QA & Observability)方面,例如 Pinecone、drant、Vald 等公司提供的工具,可确保模型表现并监控其性能和状态。 此外,还有以下工具和相关公司: 1. 图片生成 3D 建模工具,如 Tripo AI(由 VAST 发布)、Meshy、CSM AI(Common Sense Machines)、Sudo AI、VoxCraft(由生数科技推出)等。 企业还可能涉及具身智能、3D 眼镜、AI 绘本、AI 图书、学习机、飞书的多维表格、蚂蚁的智能体、Coze 的智能体、Zeabur 等云平台、0 编码平台、大模型(通义、智谱、kimi、deepseek 等)、编程辅助、文生图(可灵、即梦等)等方面,可能需要相应资质。
2024-11-20
利用ai编写h5比较优秀的工具有那些?
目前在利用 AI 编写 H5 方面,以下是一些较为优秀的工具: 1. Adobe Spark:提供了易于使用的模板和设计工具,结合 AI 辅助功能,可帮助您快速创建吸引人的 H5 页面。 2. Canva:拥有丰富的模板和元素库,其 AI 功能可以为您的设计提供创意和布局建议。 3. Wix:具有强大的自定义功能,部分 AI 特性能够协助您优化页面内容和布局。 但需要注意的是,AI 在编写 H5 中的应用仍在不断发展和完善,不同工具的性能和适用场景可能会有所差异,您可以根据具体需求进行选择和尝试。
2024-11-20
如果只能推荐3个AI辅助ppt制作的工具,你会推荐哪些?为什么?
以下为您推荐 3 个 AI 辅助 PPT 制作的工具及原因: 1. GPT4:具有强大的语言理解和生成能力,能为 PPT 提供清晰、准确且富有创意的内容大纲和文字描述。 2. WPS AI:与常用的办公软件 WPS 结合紧密,方便在熟悉的操作环境中利用 AI 功能进行 PPT 制作,提高效率。 3. chatPPT:可能提供了便捷的交互方式和智能的设计辅助,帮助用户更轻松地创建和优化 PPT。
2024-11-20
有什么ai的漫画工具
以下是一些常见的 AI 漫画工具: Pika:可用于生成视频中的画面。 Pixverse:能参与视频画面的创作。 Runway:不仅能从文本创建视频,还可用于在视频中为人脸制作动画,创建短剪辑展示未来发展。 SVD:在视频生成方面有一定作用。 此外,DiD 是用于在视频中为人脸制作动画的工具。即梦也可用于制作动态视频。
2024-11-20
目前比较好用的AI辅助制作ppt的工具,推荐
以下是一些比较好用的 AI 辅助制作 PPT 的工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果,以增强演示文稿的吸引力。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 5. 爱设计 PPT:在国内 AI 辅助制作 PPT 的产品中表现出色,背后拥有强大的团队,能敏锐把握 AI 与 PPT 结合的市场机遇,已确立市场领先地位。 目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-11-20