Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

可以根据照片生成人物的AI软件

Answer

以下是一些可以根据照片生成人物的 AI 软件:

  • PhotoMaker:可以根据文字描述生成人物照片,能混合不同人物特征创造新形象,还能改变照片中人物的性别、年龄。访问链接:https://photo-maker.github.io ,https://x.com/xiaohuggg/status/1746861045027869072?s=20
  • HeyGen:通过上传照片或文字提示,即可生成个性化 AI 数字形象视频。支持自定义肢体动作、服装、背景、年龄、性别等特征。仅需 1 分钟即可生成包含脚本、声音和情感表达的数字人视频。访问链接:https://x.com/imxiaohu/status/1852317866038809035
Content generated by AI large model, please carefully verify (powered by aily)

References

XiaoHu.AI日报

1⃣️ 📸 PhotoMaker -创造个性化人物图像:-可以根据文字描述生成人物照片。-能混合不同人物特征创造新形象。-改变照片中人物的性别、年龄。🔗 https://photo-maker.github.io 🔗 https://x.com/xiaohuggg/status/1746861045027869072?s=20 2⃣️ 💬 Sam Altman与Bill Gates关于GPT的未来讨论:-强调多模态能力,特别是对视频的理解。-讨论GPT的可靠性和错误减少。-讨论GPT连接外部数据源的潜力,如电子邮件、日历。🔗 https://x.com/xiaohuggg/status/1746822924433272968?s=20 3⃣️ 🌐 Portkey AI网关-连接多种AI模型的工具:-提供简单API接口,连接超过100种大语言模型。-包括OpenAI、Anthropic等知名AI服务。-体积仅45kb,处理速度提升9.9倍。-灵活配置,方便切换不同AI服务。🔗 https://github.com/Portkey-AI/gateway 🔗 https://x.com/xiaohuggg/status/1746782693361361042?s=20 4⃣️ 🎨 DDColor -高级图像着色工具:-使用双解码器技术,关注色彩分布和像素级细节。-适用于历史黑白照片及动漫、游戏风景。-自动学习图片内容,准确上色。-减少颜色错误,提高色彩丰富度和自然度。🔗 https://x.com/xiaohuggg/status/1746739965030240657?s=20 5⃣️ 🧠 AGI-Samantha -新型AI架构:-多个LLM联动,模仿人脑思考、记忆、感知和自主交流。-根据环境和情境自主决定交流时机。-特殊记忆系统,根据情境相关性存储和回忆信息。-自我迭代进化,灵感来源于电影《Her》的Samantha。-包含思考、意识、潜意识等多个模块。🔗 https

XiaoHu.AI日报

1⃣️ 📸 PhotoMaker -创造个性化人物图像:-可以根据文字描述生成人物照片。-能混合不同人物特征创造新形象。-改变照片中人物的性别、年龄。🔗 https://photo-maker.github.io 🔗 https://x.com/xiaohuggg/status/1746861045027869072?s=20 2⃣️ 💬 Sam Altman与Bill Gates关于GPT的未来讨论:-强调多模态能力,特别是对视频的理解。-讨论GPT的可靠性和错误减少。-讨论GPT连接外部数据源的潜力,如电子邮件、日历。🔗 https://x.com/xiaohuggg/status/1746822924433272968?s=20 3⃣️ 🌐 Portkey AI网关-连接多种AI模型的工具:-提供简单API接口,连接超过100种大语言模型。-包括OpenAI、Anthropic等知名AI服务。-体积仅45kb,处理速度提升9.9倍。-灵活配置,方便切换不同AI服务。🔗 https://github.com/Portkey-AI/gateway 🔗 https://x.com/xiaohuggg/status/1746782693361361042?s=20 4⃣️ 🎨 DDColor -高级图像着色工具:-使用双解码器技术,关注色彩分布和像素级细节。-适用于历史黑白照片及动漫、游戏风景。-自动学习图片内容,准确上色。-减少颜色错误,提高色彩丰富度和自然度。🔗 https://x.com/xiaohuggg/status/1746739965030240657?s=20 5⃣️ 🧠 AGI-Samantha -新型AI架构:-多个LLM联动,模仿人脑思考、记忆、感知和自主交流。-根据环境和情境自主决定交流时机。-特殊记忆系统,根据情境相关性存储和回忆信息。-自我迭代进化,灵感来源于电影《Her》的Samantha。-包含思考、意识、潜意识等多个模块。🔗 https

XiaoHu.AI日报

仅需5-15秒录音即可克隆声音并同步口型,生成换脸视频。支持多语言、情感表达及零样本生成的TTS系统F5-TTS。搭配FaceFusion,支持面部表情迁移和编辑,全面提升换脸效果。🔗详细:[https://xiaohu.ai/p/15205](https://xiaohu.ai/p/15205)🔗面部操控平台:[https://xiaohu.ai/p/14152](https://xiaohu.ai/p/14152)4⃣️ 🧑‍💻 HeyGen推出照片生成数字人新功能通过上传照片或文字提示,即可生成个性化AI数字形象视频。支持自定义肢体动作、服装、背景、年龄、性别等特征。仅需1分钟即可生成包含脚本、声音和情感表达的数字人视频。🔗[https://x.com/imxiaohu/status/1852317866038809035](https://x.com/imxiaohu/status/1852317866038809035)5⃣️ 📘 Google的实验性产品Learn About专注于知识学习,帮助用户全面深入学习任意领域的信息。设计保证信息真实性,可自动扩展相关知识,呈现方式直观。目前处于测试阶段,仅限美国访问,可通过VPN体验。🔗访问链接:[https://learning.google.com](https://learning.google.com)🔗[https://x.com/imxiaohu/status/1854736916232782236](https://x.com/imxiaohu/status/1854736916232782236)6⃣️ 🎥 ChatGPT支持导出语音对话视频

Others are asking
动漫制作中如何使用ai辅助工作
在动漫制作中使用 AI 辅助工作,大致流程如下: 1. 面临时间和金钱的双重压力,需找到适合的制作捷径。AI 目前主要是辅助工具,负责搞定图和片,其他部分仍依赖人工。 2. 效率至关重要。和视频相关的所有内容、资料都记录在飞书文档里。 3. 分工方面,有人负责前期的内容构思和脚本编写,有人主要负责图片、视频生成和视频剪辑。 4. Midjourney 提示词围绕皮克斯、迪士尼、3D 风格来写,例如:"a small white Chiense dragon,anthropomorphic,Smile with surprise,wearing a school uniform,looking at a blurry gift box in the foreground,super closeup shot,camera focus on his face,3D render,Unreal Engine,Pixar 3D style,blurry classroom scene,bright sunshinear 16:9niji 6",重点是"a small white Chiense dragon,anthropomorphic,3D render,Unreal Engine,Pixar 3D style",尺寸比例 16:9,模型选择 niji 6,其他根据需求调整。 5. 动画制作主要使用 Runway,因其控制笔刷有优势。
2025-02-18
传统AI、大模型、AGI的区别
传统 AI、大模型、AGI 存在以下区别: 传统 AI: 语音技能 NLU 通常通过一系列规则、分词策略等训练而成。 运作逻辑规律可观测,具有 ifelse 式的逻辑性。 大模型: 凭借海量数据在向量空间中学习知识的关联性。 运作逻辑难以观测,脱离了 ifelse 的层面。 Transformer 是其底层结构,是一个大参数(千亿级别)的回归方程,底层是 function loss 损失函数,能在一定 prompt condition 情况下,repeat 曾经出现过的数据内容,实现“生成”能力。 大语言模型是一个 perfect memory,repeat 曾经出现的内容。与 Alpha Go 相比,Alpha Go 是增强学习模型,有推理能力,而大语言模型这块很弱。 AGI(通用人工智能): 部分人觉得 LLM(大语言模型)具有 AGI 潜力,但 LeCun 反对。 目前对于能否到达 AGI 阶段尚不明确。 在公众传播层面: AIGC 指用 Stable Diffusion 或 Midjourney 生成图像内容,后来泛指用 AI 生成音乐、图像、视频等内容。 LLM 指 NLP 领域的大语言模型,如 ChatGPT。 GenAI 是生成式人工智能模型,国内官方政策文件使用这个词相对科学,涵盖了 LLM 和 AIGC。 公众传播一般会混用上述名词,但底层是 transformer 结构。
2025-02-18
AI带来的新工作岗位
以下是关于 AI 带来的新工作岗位的相关信息: 2023 年,AI 将会替代 4 亿 8 亿工作岗位,同时也会增加 5.55 8.90 亿新岗位。计算被替代的岗位主要是查看岗位的任务构成,其中重复性高的任务容易被替代,而灵活、非常规、创造性的岗位更难被取代。 随着生成式人工智能技术的发展,在编程、自动化任务处理和内容创作等方面展现出惊人的能力,这威胁到了一些技术岗位的存在,如系统管理员、数字营销文案撰写等。但同时也为能够适应新环境的技术工作者带来了新机遇,例如云架构师、网络架构师和企业架构师等职位,因为这些工作不仅需要技术知识,更需要人际交往、团队领导和复杂决策制定的能力。 此外,OpenAI COO 提到 AI 可能创造新工作机会。
2025-02-18
有哪些在企业内部落地应用AI大模型工具的实践案例?不要营销文案生成、代码开发助手、智能客服问答机器人这种太常见的
以下是一些在企业内部落地应用 AI 大模型工具的实践案例: 1. 阿里云百炼: 智能体应用:能够弥补大模型的不足,如回答私有领域问题、获取实时信息、回答专业问题等。适用于有企业官网、钉钉、微信等渠道,期望为客户提供产品咨询服务,以及缺少技术人员开发大模型问答应用的场景。典型场景包括私有领域知识问答、个性化聊天机器人、智能助手等。 内部业务助手:通过企业内部规章制度、部门结构、产品介绍等文档构建知识库,并借助 RAG 智能体实现内部知识问答功能。系统支持多源异构数据,并通过复杂文档解析和视觉增强技术,提升文档理解的准确性与深度。目前该功能已灰度上线,需提供 UID 并通过白名单进行开启。 2. 达摩院: AI 模特(虚拟换装):支持虚拟换装、姿态编辑。 3. 电商零售: 推广文案写作:通过内置的多样化营销场景的文体模板,基于用户输入的创作主题以及参考素材,大模型即可为您生成对应的营销文案,为营销活动和宣传文案提供灵感和文案写作支持。 4. 泛企业: VOC 挖掘:是一个面向各类企业的 VOC 标签挖掘的工具。不论是用户的长短评论、帖子、还是用户和客服/销售的聊天记录、通话记录,都可以使用。通过选中或自定义标签,即可让大模型针对海量非结构化的 VOC 数据快速打标。相比于人工打标或规则打标准确率更高;对于业务标签变动频繁的情况,也能更敏捷、快速地影响。 5. 通义晓蜜:基于深度调优的对话大模型,为营销服类产品提供智能化升级所需的生成式摘要总结、质检、分析等能力应用。
2025-02-18
openAI关于道德规范的调整是什么
OpenAI 在道德规范方面的调整包括以下内容: 1. OpenAI 认为通过分析 ChatGPT 和 GPT4 用户对数百万条提示的反应,能获得知识以使未来的产品符合道德规范。 2. 随着公司承担更多任务并投入更多商业活动,有人质疑其在多大程度上能集中精力完成降低灭绝风险等任务。 3. OpenAI 与数以百计的内容审核员签订合同,对模型进行教育,使其了解对用户提示做出的不恰当或有害回答。 4. 山姆·奥特曼曾强调 AI 可能带来的潜在灾难,如大规模虚假信息传播、网络攻击以及威权政府滥用等,并对 OpenAI 最初的开放性承诺进行重新考虑。 5. 公司领导层认为董事会作为非营利性控制实体的一部分,将确保营收和利润的驱动力不会压倒最初的想法。但目前 OpenAI 还不清楚 AGI 到底是什么,其定义将由董事会决定。
2025-02-18
多模态的AI工具有哪些
以下是一些多模态的 AI 工具: GPT4VAct:这是一个多模态 AI 助手,能够模拟人类通过鼠标和键盘进行网页浏览。它可以识别网页上的元素并理解其功能,目的是自动完成一些人工操作任务以提高效率。主要特点包括有限的视觉处理能力、自动标记、鼠标和键盘操作等,但目前存在一些功能暂不支持。 Sora:是第一个能够根据人类指令生成长达一分钟视频的模型,标志着在生成式 AI 研究和开发中的重大突破。 DiT:能将视频分解为一帧帧图像并逐帧去噪生成流畅连贯的视频,不仅能生成高质量逐帧图像,还能在时间维度上保持一致性。 Topview.ai:是一款面向海外市场的多模态转换工具,作为 AI 驱动的营销视频生成工具,可自动实现模态转换,帮助社交媒体达人将素材一键转换为爆款商业短视频。
2025-02-18
哪个软件可以生成思维脑图
以下是一些可以生成思维脑图的软件: 1. GitMind:免费的跨平台思维导图软件,支持多种模式,可通过 AI 自动生成思维导图。 2. ProcessOn:国内的思维导图+AIGC 工具,能利用 AI 生成思维导图。 3. AmyMind:轻量级在线思维导图工具,无需注册登录,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的思维导图助手,可一键拓展思路,生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,输入需求后由 AI 自动完成生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,有助于提升生产力。 总的来说,这些 AI 思维导图工具都能通过 AI 技术自动生成思维导图,提高制作效率,为知识工作者带来便利。 此外,过去 ChatGPT 无法生成思维导图,当处理复杂代码或长篇文章时,需利用 AI 提炼后再用思维导图软件转换,较为繁琐。现在有了 GPTs,可利用 Actions 调取第三方平台提供的 API 直接获取内容对应的思维导图。比如结合 Gapier 这个提供免费 Action 的第三方平台进行定制化,包含如何在 Action 中引入 Gapier 生成代码的思维导图,以及如何在 Action 中引入 Gapier 和 Webpilot 生成在线文档的思维导图。 在多智能体 AI 搜索引擎方案中,生成思维导图是其中的一个步骤。智能体能调用各种插件,除思维导图外,还有流程图、PPT 工具等,可根据工作需要选择。
2025-02-18
怎么让AI识别对话,并生成结构化数据存储到我的软件系统里
要让 AI 识别对话并生成结构化数据存储到软件系统里,可以参考以下方法: 1. 基于结构化数据来 RAG:如果原始数据本身就是结构化、标签化的,不必将这部分数据做向量化。结构化数据的特点是特征和属性明确,可用有限标签集描述,能用标准查询语言检索。以餐饮生活助手为例,流程包括用户提问、LLM 提取核心信息并形成标准查询、查询结构化数据、LLM 整合回复。 2. 利用 Coze 平台设计 AI 机器人:创建好 Bot 后,从“个人空间”入口找到机器人,进行“编排”设计。Coze 平台常用的概念和功能包括提示词(设定 Bot 身份和目标)、插件(通过 API 连接集成服务)、工作流(设计多步骤任务)、触发器(创建定时任务)、记忆库(保留对话细节,支持外部知识库)、变量(保存用户个人信息)、数据库(存储和管理结构化数据)、长期记忆(总结聊天对话内容)。设计 Bot 时要先确定目的,比如“AI 前线”Bot 的目的是作为 AI 学习助手,帮助职场专业人士提升在人工智能领域的知识和技能,并提供高效站内信息检索服务。 注:Coze 官方使用指南见链接:https://www.coze.cn/docs/guides/welcome ,遇到疑问也可查阅该指南。
2025-02-18
图片转视频说话 效果好 软件 有哪些
以下是一些能实现图片转视频说话且效果较好的软件: 1. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 1. 点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。 2. 上传后效果如图所示,My Avatar处显示上传的照片。 3. 点开大图后,点击Create with AI Studio,进入数字人制作。 4. 写上视频文案并选择配音音色,也可以自行上传音频。 5. 最后点击Submit,就可以得到一段数字人视频。 2. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 1. 点击上面的网址,点击右上角的Create vedio。 2. 选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击Generate vedio就可以生成一段视频。 5. 打开自己生成的视频,可以下载或者直接分享给朋友。 3. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法: 1. 点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。 2. 点击开始创作,选择自定义照片。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 打开绿幕按钮,点击背景,可以添加背景图。 5. 最后,点击生成视频。 4. Sadtalker: 由于涉及到视频的推理和转换,输出时间要远远大于AI绘图和sovits的声音推理,需要做好等待的准备。 最终生成的视频长度与音频一致,如果想制作一个长视频,最好是剪成小段,分别推理,然后合并。 使用方法: 1. 可以独立使用或者作为插件放入stablediffusion。 2. 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 。 3. 对于编程、python、conda不熟的,建议使用整合包: 我用夸克网盘分享了「EZAIStarterv0.9.8.zip」,点击链接即可保存。链接:https://pan.quark.cn/s/1d5ca9f57f5c 。 视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.searchcard.all.click&vd_source=35e62d366d8173e12669705f7aedd122 。 4. 具体步骤: 点我启动,在启动界面中,选择音频、图像口型同步的下载图标。 下载完毕后。 启动应用,等待。 会弹出一个独立的窗口(而不是默认浏览器)。 选择sadtalker同步器,分别导入图片和声音。 图片预处理方式中,crop只截取图片的头部,full就是保留整张照片,下面的勾选项已经有文字解释,自己可以试几次。 点击generate 。
2025-02-18
我是一个有23年软件系统开发和设计经验的架构师,但是对AI还没有系统化了解过,请问我该如何开始?如何在短时间内掌握AI的使用、原理以及二次开发?
以下是为您提供的在短时间内系统化学习 AI 的建议: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。我建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 如果希望继续精进,对于 AI,可以尝试了解以下内容作为基础: 1. AI 背景知识 (1)基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 (2)历史发展:简要回顾 AI 的发展历程和重要里程碑。 2. 数学基础 (1)统计学基础:熟悉均值、中位数、方差等统计概念。 (2)线性代数:了解向量、矩阵等线性代数基本概念。 (3)概率论:基础的概率论知识,如条件概率、贝叶斯定理。 3. 算法和模型 (1)监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 (2)无监督学习:熟悉聚类、降维等算法。 (3)强化学习:简介强化学习的基本概念。 4. 评估和调优 (1)性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 (2)模型调优:学习如何使用网格搜索等技术优化模型参数。 5. 神经网络基础 (1)网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 (2)激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。 此外,以证件照为例,Code AI 应用开发教学中,智能体开发从最初的 chatbot 只有对话框,到有了更多交互方式,因用户需求扣子推出了 AI 应用,其低代码或零代码的工作流等场景做得较好。但 AI CODING 虽强,目前适用于小场景和产品的第一个版本,复杂应用可能导致需求理解错误从而使产品出错。在创建 AI 应用时,要学习操作界面、业务逻辑和用户界面,包括布局、搭建工作流、用户界面及调试发布,重点熟悉桌面网页版的用户界面。
2025-02-17
对作为知识库的数据进行预处理,用哪个软件比较哈
以下是一些可用于对作为知识库的数据进行预处理的软件和方法: 1. LangchainchatGLM:对于知识库内容的组织要求较高,无需微调训练,适合有结构、界限分明的数据。可使用langchain库比对字典的关键词keys部分,找到相似度最高的相关keys对应的内容文本,送进提示词模板(prompt_template),然后送到LLM进行后处理。 2. 在检索原理方面,可通过嵌入模型(如Word2Vec、GloVe、BERT)将问题文本转化为向量,用于后续检索。例如,在商业化问答场景中,会对接收的问题进行预处理和向量化。 3. 在创建知识库并上传表格数据时,可通过API获取在线API的JSON数据上传,或手动自定义创建数据表结构和数据。需注意指定语义匹配字段,在响应用户查询时,将用户查询内容与该字段内容进行比较,根据相似度进行匹配。
2025-02-17
有哪些免费的文生图中文软件
以下是一些免费的文生图中文软件: 1. 豆包 App 支持文生图中文文字生成。 2. Stability AI 推出的基于 Discord 的媒体生成和编辑工具可用于文生图,您可以通过以下步骤使用: 点击链接进入官方 DISCORD 服务器:https://discord.com/invite/stablediffusion 。 进入 ARTISAN 频道,任意选择一个频道。 输入/dream 会提示您没有权限,点击链接,注册登录,填写信用卡信息以及地址,点击提交,会免费试用三天,三天后开始收费。输入/dream 提示词,这部分和 MJ 类似,可选参数有五类,包括提示词(必填项)、负面提示词(选填项)、种子值(选填项)、长宽比(选填项)、模型选择(选填项)、张数(选填项)。完成后选择其中一张。 3. 您还可以参考以下教程: SD 做中文文字生成的教程: 找到一款喜欢的字体,写上主题例如“端午”。 打开 SD,选择文生图,输入关键词咒语。 打开 Controlnet,启用 lineart 和 canny 固定字体,如果希望有景深效果,也可以打开 depth(增加阴影和质感)。 打开高清修复,分辨率联系 1024 以上,步数:29 60 。 直接生成。这里可以举一反三,选择一些水果模型,珠宝模型,毛毡等等快来试一试吧,附免费参数。
2025-02-16
老照片修复用什么
以下是一些用于老照片修复的方法和工具: 1. 使用 SD 中的 ControlNet 模型,特别是其中的 Recolor 新模型,可对黑白老照片进行重新上色。在处理人物照片还原时,可选择 realisian 的写实大模型,提示词直接描述颜色和对应的内容。ControlNet 选择 Recolor 时,预处理器选择“recolor_luminance”效果较好。 2. 超清无损放大器 StableSR:需要使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入指定文件夹,同时安装 StableSR 模块和 VQVAE。通过不同的放大方法测试,如“Ultimate SD upscale”脚本、“后期处理”的放大方法和 StableSR 的放大,StableSR 对原图还原较为精准,重绘效果较好。 3. 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰,但无法使头发、衣服等元素变清晰。之后可将图片发送到图生图中,打开 stableSR 脚本进行放大修复。 相关参考文章: 1. 【SD】用 AI 给老照片上色,岁月不改它模样:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw 2. 【Stable Diffusion】图片高清化+面部修复+一键抠图,一些你不知道的事儿:http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487422&idx=1&sn=9cdf7ef37c2acb3c0fc3328d0ba8af74&chksm=c251597af526d06c921ea6728cb2a32bdf1d5f699e19d6ba13b849994e4d01af8a5144132aad&scene=21wechat_redirect 3. 【Stable Diffusion】超清无损放大器 StableSR:http://mp.weixin.qq.com/s?__biz=MzkzMzIwMDgxMQ==&mid=2247487403&idx=1&sn=cbb96534fa6f58c37cf9fc64bc7ade0c&chksm=c251596ff526d0792b4bba0e21b69427b23e780824bdc75b22f1073e8bad6f61f30199fc8344&scene=21wechat_redirect
2025-02-18
如何让老照片动起来
以下是一些让老照片动起来的方法和相关信息: 1. 参加“时光印记”AI 公益挑战赛:该挑战赛采集了杨浦 20 位老一辈建设者老照片与故事,期望用 AIGC 技术创作影视频、AIMV、动图。作品要求任选百年主题,创作视频短片、音乐 AIMV 或动态老照片,AI 制作内容不低于 70%,视频短片时长 60 秒以上,音乐 AIMV 至少 30 秒,图片组让老照片动起来 5 10s。报名及创作时间为即日起至 2024 年 11 月 20 日。参赛方式为填写报名问卷和进群获取素材。 2. 使用 Dreamina 即梦工具:不需要🪜,每天有免费额度。注册可用抖音号或手机号,上传照片即可尝试让老照片动起来。 3. 使用 Sora 工具:优点是发布的成果好,集成在 openai 一套里可用,但需要🪜,需要 gmail 注册,需要订阅后才能使用。
2025-02-14
照片变清晰
以下是将照片变清晰的方法: 1. 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰。您可以参考文章——。但此步骤无法将照片中的头发、衣服等其他元素变清晰。 2. 接着将图片发送到图生图当中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。您可以参考文章——。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免对原图产生干扰。 3. 对于修复,需要使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹中。StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹中。还有一个 VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。 4. 在使用清影工具时,输入一张图片和相应的提示词,清影大模型会根据提示将图片转变为视频画面。也可以只输入一张图片,清影大模型将自行发挥想象力把图片扩展为一段有故事的视频。选用尽可能清晰的图片,上传图片比例最好为 3:2(横版),清影支持上传 png 和 jpeg 图像。如果原图不够清晰,可采用分辨率提升工具将图片变清晰。提示词要简单清晰,可选择不写 prompt 让模型自己操控图片动起来,或者明确想动起来的主体并以「主体」+「主题运动」+「背景」+「背景运动」的方式撰写提示词。如果不明确大模型如何理解图片,推荐将照片发送到清言对话框进行识图,明确主体的描述。
2025-02-14
想在手机上通过宠物照片给宠物建模,是宠物可以有一些动态性,需要怎么做?利用 AIGC 能快速的实现吗?
在手机上通过宠物照片给宠物建模并实现一定的动态性,可以考虑以下几种方式: 1. 利用 3D 引擎:目前有一些公司提供通过手机摄像头快速创建虚拟人身体的服务,例如 NextHuman。不过,3D 引擎在拟真程度高的同时,定制化成本也较高。 2. 借助 AIGC:虽然 AIGC 省去了建模流程,能直接生成数字人的展示图片,但可能存在数字人难以保持 ID 一致性、帧与帧连贯性不佳等问题。典型的相关项目有 wav2lip等。但需要注意的是,如果对模型真实度要求较高,AIGC 方式可能不太理想,因为算法发展很快,未来可能会有更好的连贯度生成方式。 目前利用 AIGC 来快速实现可能存在一些挑战,但随着技术的发展,未来有可能更便捷高效地达成您的需求。
2025-02-13
有没有上传8张照片一键生成短视频的ai
以下是一些可以实现上传 8 张照片一键生成短视频的 AI 工具及相关操作: 1. PixVerse: 网址:https://app.pixverse.ai 操作:涂抹选区,给出相应的运动方向,最后加入配音,剪辑一下即可。 2. 出门问问 Mobvoi: 网址:https://openapi.mobvoi.com/pages/videointroduce 操作: 第一步:api 申请,打开网址,找到视频生成>开始体验>登录>创建应用>查看详情,获取自己的 APP key。 第二步:启动 ComfyUI,打开 json 文件。 第三步:在 api 节点输入第一步获取的 key 进行适配,获取 key 后查看详情找到账号和密码进行输入。 第四步:上传一张照片即可。 3. 即梦: 操作:将图片上传至视频生成模块,用简单提示词描绘画面中的动态内容,可生成时长为 3 秒钟的画面。运镜类型可根据剧本中的镜头描绘设置,主要设置以随机运镜为主,生成速度可选择慢速。
2025-02-09
想通过照片抠图,有没有好用的、免费的、无水印的工具?
以下是一些好用、免费且无水印的照片抠图工具: 1. AVAide Watermark Remover:在线工具,使用 AI 技术去除水印,支持多种图片格式,操作简单,可上传图片选择水印区域并保存下载处理后的图片,还提供去除文本、对象等功能。 2. Vmake:提供 AI 去除图片水印功能,可上传最多 10 张图片,适合快速去除水印及社交媒体分享图片的用户。 3. AI 改图神器:提供 AI 智能图片修复去水印功能,可一键去除多余物体、人物或水印,支持粘贴或上传手机图像,操作方便。 此外,还可以使用以下方式进行抠图: 1. Iphone 手机自带的抠图功能、美图秀秀或一些网站,如 https://www.remove.bg/zh ,直接上传图片即可。 希望这些工具能满足您的需求。
2025-02-09
生成一个完整的结构化提示词
以下是为您生成的关于结构化提示词的相关内容: 为 AI 视频生成设计的结构化提示词模板包含镜头语言、主体、细节、氛围等要素,适合生成具有电影感的大场景视频。完整提示词结构示例为:主题风格+镜头运动+主体描述+动态细节+背景环境+光影色调+情绪氛围(可附加技术参数:如时长、运镜速度、镜头焦距等) 样例驱动的渐进式引导法是让 AI 主动读懂您的想法。以 1 2 个正向样例作为起点,通过与 AI 的多轮对话,引导 AI 从样例中提炼隐含的生成要求,逐步完善提示词。例如教 AI 仿写爆文时,只需提供优秀样例,AI 会自动分析理解精髓并生成符合自身运作方式的指令。 其核心步骤包括: 1. 构建初始样例:创建符合期望输出的具体例子。 2. 评估样例,尝试提炼模板:让 AI 分析理解样例的结构和关键元素,并以专家视角优化样例。 3. 固定模板,强化要求说明:基于对初始样例的理解,让 AI 提出通用模板,通过测试 Prompt 验证可靠性。 4. 生成结构化提示词:将优化后的模板转化为结构化的提示词,用户适当调整并确认后投入使用。 在这个过程中,用户的角色主要是: 1. 提供尽可能与自己预期一致的初始样例。 2. 判断 AI 的输出质量。 3. 反馈改进建议,提供行动引导。 这种方法的优势在于简化了提示词设计过程,让非专业用户也能创建高质量的 Prompt。通过引导 AI 进行分析和优化,用户可以专注于判断输出质量和提供反馈,而不需要深入理解复杂的 Prompt 工程技巧。接下来,将通过一个实战案例“知识闪卡 AI”来逐步分享运用过程,帮助您直观了解如何使用该方法设计高质量的提示词。
2025-02-18
哪一款AI 可以实现参考一张柱状图,使用我提供的数据,生成同样的柱状图
以下两款 AI 可以实现参考一张柱状图,使用您提供的数据生成同样的柱状图: 1. PandasAI:这是让 Pandas DataFrame“学会说人话”的工具,在 GitHub 已收获 5.4k+星。它并非 Pandas 的替代品,而是将 Pandas 转换为“聊天机器人”,用户可以以 Pandas DataFrame 的形式提出有关数据的问题,它会以自然语言、表格或者图表等形式进行回答。目前仅支持 GPT 模型,OpenAI API key 需自备。例如,输入“pandas_ai.run”,即可生成相关柱状图。链接:https://github.com/gventuri/pandasai 2. DataSquirrel:这是一款自动进行数据清理并可视化执行过程的数据分析工具,能帮助用户在无需公式、宏或代码的情况下快速将原始数据转化为可使用的分析/报告。目前平台提供的用例涵盖了 B2B 电子商务、人力资源、财务会计和调查数据分析行业。平台符合 GDPR/PDPA 标准。链接:https://datasquirrel.ai/
2025-02-18
ai生成短视频,有没有免费的工具
以下是一些免费生成短视频的工具: 1. Project Odyssey:这是全球最大的生成式 AI 视频竞赛之一,提供超过 30 种工具的免费额度,累计超过 75 万美元。 2. ChatGPT + 剪映:ChatGPT 可以生成视频小说脚本,剪映则可以根据脚本自动分析并生成对应的素材和文本框架。 3. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频,且免费无限生成。 4. Pictory:AI 视频生成器,允许用户提供文本描述来生成相应的视频内容。 5. VEED.IO:提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划内容。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 这些工具各有特点,适用于不同的应用场景和需求,能够帮助您快速生成吸引人的视频内容。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-18