直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

可以根据照片生成人物的AI软件

回答

以下是一些可以根据照片生成人物的 AI 软件:

  • PhotoMaker:可以根据文字描述生成人物照片,能混合不同人物特征创造新形象,还能改变照片中人物的性别、年龄。访问链接:https://photo-maker.github.io ,https://x.com/xiaohuggg/status/1746861045027869072?s=20
  • HeyGen:通过上传照片或文字提示,即可生成个性化 AI 数字形象视频。支持自定义肢体动作、服装、背景、年龄、性别等特征。仅需 1 分钟即可生成包含脚本、声音和情感表达的数字人视频。访问链接:https://x.com/imxiaohu/status/1852317866038809035
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

XiaoHu.AI日报

1⃣️ 📸 PhotoMaker -创造个性化人物图像:-可以根据文字描述生成人物照片。-能混合不同人物特征创造新形象。-改变照片中人物的性别、年龄。🔗 https://photo-maker.github.io 🔗 https://x.com/xiaohuggg/status/1746861045027869072?s=20 2⃣️ 💬 Sam Altman与Bill Gates关于GPT的未来讨论:-强调多模态能力,特别是对视频的理解。-讨论GPT的可靠性和错误减少。-讨论GPT连接外部数据源的潜力,如电子邮件、日历。🔗 https://x.com/xiaohuggg/status/1746822924433272968?s=20 3⃣️ 🌐 Portkey AI网关-连接多种AI模型的工具:-提供简单API接口,连接超过100种大语言模型。-包括OpenAI、Anthropic等知名AI服务。-体积仅45kb,处理速度提升9.9倍。-灵活配置,方便切换不同AI服务。🔗 https://github.com/Portkey-AI/gateway 🔗 https://x.com/xiaohuggg/status/1746782693361361042?s=20 4⃣️ 🎨 DDColor -高级图像着色工具:-使用双解码器技术,关注色彩分布和像素级细节。-适用于历史黑白照片及动漫、游戏风景。-自动学习图片内容,准确上色。-减少颜色错误,提高色彩丰富度和自然度。🔗 https://x.com/xiaohuggg/status/1746739965030240657?s=20 5⃣️ 🧠 AGI-Samantha -新型AI架构:-多个LLM联动,模仿人脑思考、记忆、感知和自主交流。-根据环境和情境自主决定交流时机。-特殊记忆系统,根据情境相关性存储和回忆信息。-自我迭代进化,灵感来源于电影《Her》的Samantha。-包含思考、意识、潜意识等多个模块。🔗 https

XiaoHu.AI日报

1⃣️ 📸 PhotoMaker -创造个性化人物图像:-可以根据文字描述生成人物照片。-能混合不同人物特征创造新形象。-改变照片中人物的性别、年龄。🔗 https://photo-maker.github.io 🔗 https://x.com/xiaohuggg/status/1746861045027869072?s=20 2⃣️ 💬 Sam Altman与Bill Gates关于GPT的未来讨论:-强调多模态能力,特别是对视频的理解。-讨论GPT的可靠性和错误减少。-讨论GPT连接外部数据源的潜力,如电子邮件、日历。🔗 https://x.com/xiaohuggg/status/1746822924433272968?s=20 3⃣️ 🌐 Portkey AI网关-连接多种AI模型的工具:-提供简单API接口,连接超过100种大语言模型。-包括OpenAI、Anthropic等知名AI服务。-体积仅45kb,处理速度提升9.9倍。-灵活配置,方便切换不同AI服务。🔗 https://github.com/Portkey-AI/gateway 🔗 https://x.com/xiaohuggg/status/1746782693361361042?s=20 4⃣️ 🎨 DDColor -高级图像着色工具:-使用双解码器技术,关注色彩分布和像素级细节。-适用于历史黑白照片及动漫、游戏风景。-自动学习图片内容,准确上色。-减少颜色错误,提高色彩丰富度和自然度。🔗 https://x.com/xiaohuggg/status/1746739965030240657?s=20 5⃣️ 🧠 AGI-Samantha -新型AI架构:-多个LLM联动,模仿人脑思考、记忆、感知和自主交流。-根据环境和情境自主决定交流时机。-特殊记忆系统,根据情境相关性存储和回忆信息。-自我迭代进化,灵感来源于电影《Her》的Samantha。-包含思考、意识、潜意识等多个模块。🔗 https

XiaoHu.AI日报

仅需5-15秒录音即可克隆声音并同步口型,生成换脸视频。支持多语言、情感表达及零样本生成的TTS系统F5-TTS。搭配FaceFusion,支持面部表情迁移和编辑,全面提升换脸效果。🔗详细:[https://xiaohu.ai/p/15205](https://xiaohu.ai/p/15205)🔗面部操控平台:[https://xiaohu.ai/p/14152](https://xiaohu.ai/p/14152)4⃣️ 🧑‍💻 HeyGen推出照片生成数字人新功能通过上传照片或文字提示,即可生成个性化AI数字形象视频。支持自定义肢体动作、服装、背景、年龄、性别等特征。仅需1分钟即可生成包含脚本、声音和情感表达的数字人视频。🔗[https://x.com/imxiaohu/status/1852317866038809035](https://x.com/imxiaohu/status/1852317866038809035)5⃣️ 📘 Google的实验性产品Learn About专注于知识学习,帮助用户全面深入学习任意领域的信息。设计保证信息真实性,可自动扩展相关知识,呈现方式直观。目前处于测试阶段,仅限美国访问,可通过VPN体验。🔗访问链接:[https://learning.google.com](https://learning.google.com)🔗[https://x.com/imxiaohu/status/1854736916232782236](https://x.com/imxiaohu/status/1854736916232782236)6⃣️ 🎥 ChatGPT支持导出语音对话视频

其他人在问
AI知识库工具
以下是为您提供的关于 AI 知识库工具的相关信息: WayToAGI(通往 AGI 之路): 这是由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。 大家贡献并整合各种 AI 资源,让人们能轻松学习 AI 知识,应用各类 AI 工具和实战案例。 提供一系列开箱即用的工具,如文生图、文生视频、文生语音等的详尽教程。 追踪 AI 领域最新进展并时刻更新,无论您是初学者还是行业专家,都能在此发掘有价值的内容。 网址:https://waytoagi.com/ 体验链接:https://waytoagi.com/ 知识库在 AI 模型中的作用: 知识库就像 AI 的“活字典”,是一个非常贴切的比喻。 能解决 AI 知识“过期”的问题,AI 可随时从更新的知识库中检索相关信息,给出更准确的回答。 例如可建立包含最新新闻、科技发展、法律法规等内容的知识库,让 AI 回答最新事件的问题。 像热门的 AI 搜索,就是将整个互联网的实时数据作为知识库,通过搜索引擎获取最新信息。 产品经理 AI 工具集: 用户研究、反馈分析:Kraftful(kraftful.com) 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 画原型:Uizard(https://uizard.io/autodesigner/) 项目管理:Taskade(taskade.com) 写邮件:Hypertype(https://www.hypertype.co/) 会议信息:AskFred(http://fireflies.ai/apps) 团队知识库:Sense(https://www.senseapp.ai/) 需求文档:WriteMyPRD(writemyprd.com) 敏捷开发助理:Standuply(standuply.com) 数据决策:Ellie AI(https://www.ellie.ai/) 企业自动化:Moveworks(moveworks.com)
2024-11-22
我想做ui设计来模仿微信做一个app,想找各种图标素材 怎么用ai找这些素材
以下是使用 AI 找模仿微信做 App 所需图标素材的方法: 1. 对于直播礼物风格图标:可以在素材网站上找到喜欢的 icons 风格,然后喂图给 Midjourney 机器人,并加上关键词,如“喂图 + 耳机图标等。 2. 对于主题应用 icons:使用关键词“icon design,light texture,glow,Dribbble,3D,frostedglass effect,3d,ui,ux,–upbeta –q 2 –v 4”。 3. 对于 B 端图标:可以喂图加上关键词“A data icon,blue gradient frosted glass,frostedglass building,white transparent technology sensewhite city building scene,data line link,chip,OCrenderer,big data,industrial machinery,high detailight gray background with simple linear details,studio lighting,3d,c4d,pure white background,8k”。 4. 对于音乐软件 UI 设计:使用关键词“music app ui design,ux design,white,light,bright,data,modern,smooth,behance,dribbble,–upbeta –q 2 –v 4”。 需要注意的是,Midjourney 生成的图片可能在某些方面不够规范或完善,只能作为风格参考。
2024-11-22
怎么用ai写脚本
以下是关于如何用 AI 写脚本的一些指导: 首先,明确您要写的故事类型和来源。故事来源可以有两种路径: 1. 原创(直接经验):包括您或您周围人的经历、您做过的梦、您想象的故事等等。 2. 改编(间接经验):比如对经典 IP、名著、新闻进行改编或二创。 在剧本写作方面: 编剧是有一定门槛的手艺,不能单纯依赖剧作理论和模板,而应先大胆地写和实践,再结合看书学习,不断总结经验。对于短片创作,由于篇幅较小、情节和角色相对简单,可以从自己或朋友的经历改编入手,或者对触动您的短篇故事进行改编。多与他人讨论您的故事,有助于修改和进步。 如果您想用 AI 把小说做成视频,大致的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说,提取关键场景、角色和情节。 2. 生成角色与场景描述:利用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:借助 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,并添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,提升视频质量。 8. 审阅与调整:观看视频,根据需要调整某些场景或音频。 9. 输出与分享:完成编辑后,输出最终视频并在所需平台分享。 需要注意的是,具体操作步骤和所需工具可能因项目需求和个人偏好有所不同,AI 工具的可用性和功能也可能变化,建议访问相关工具网址获取最新信息和使用指南。 另外,对于担心 AI 削弱孩子思考力的问题,如果使用方法正确,AI 反而能助力拓展思维边界。比如将提问方式从封闭性改为开放性,或者让 AI 帮助提出更多拓展思考的问题。在 AI 辅助写作文时,可以让孩子提交与 AI 共同完成作文的聊天记录,重点关注孩子能否说清 AI 作文的优缺点以及如何修改。
2024-11-22
如何起步开始学习ai设计
以下是关于如何起步开始学习 AI 设计的一些建议: 1. 阅读相关文章: 如 ,了解市场动态和生成式 AI 商业模式的相关问题。 ,认识到尽早学习的重要性,避免被其他熟练掌握 AI 动力设计技巧的设计师超越。 ,了解设计的当前状态、常见问题及实用技巧。 ,学习最佳实践和利用 UX 策略使 AI/ML 系统更易于解释和透明。 2. 利用工具: 了解星流一站式 AI 设计工具,在入门模式下,熟悉右侧生成器的图片参考部分,如快速参考、风格迁移、Tile 分块、重新上色等功能。 掌握基础模型,包括星流通用大模型及基础模型 F.1、基础模型 XL、基础模型 1.5 等,了解它们在效果和生成速度上的差异。 了解增强模型,可通过收藏、查看例图和选择风格等方式进行使用。
2024-11-22
给初学者介绍AI的PPT
以下为为初学者介绍 AI 的相关 PPT 资源: 1. 《和 Cursor AI 一起学 Python 编程》 分享者:B站 PPT 链接: 在线代码:https://bohrium.dp.tech/notebooks/86124619178/update 课程大纲:和 AI 一起学 Python 编程——面向研究生初学者 总课时:10 月 16 日,4 节课,每节 45 分钟 讲课者:Xiangyu Chen(清华大学数据科学博士生)、Wenju Tang(北京大学语言学博士) 业界助教:Wenhao Guo(杭州某电商公司 NLP 工程师) 2. 《给小白的 AI 产品推荐》中的 PPT 类产品 国内:爱设计 PPT 推荐理由: 背后拥有实力强大的团队,技术过硬且对市场需求有敏锐洞察力。 成功把握住 AI 与 PPT 结合的市场机遇。 已确立市场领先地位,代表当前国内 AI 辅助 PPT 制作的最高水平。 3. 微软 AI 初学者入门课程 译者:Miranda 课程原网址:https://microsoft.github.io/AIForBeginners/ 课程内容:涵盖符号人工智能、神经网络、计算机视觉、自然语言处理等,适合初学者,覆盖 TensorFlow、PyTorch 及人工智能伦理原则。
2024-11-22
可以生成原生动漫人物的AI软件
以下是一些可以生成原生动漫人物的 AI 软件: 1. 数字人的躯壳构建方面: 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,代表软件是 Live2D Cubism。 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高,代表有 UE、Unity,虚幻引擎 MetaHuman 等。个人学习在电脑配置和学习难度上有一定门槛。 AIGC:虽然省去了建模流程,直接生成数字人的展示图片,但算法生成的数字人在 ID 一致性和帧与帧的连贯性上存在弊端。典型的项目有 wav2lip等。AIGC 还有一个方向是直接生成 2D/3D 引擎的模型,但该方向还在探索中。 2. 生成式 AI 在艺术创作方面: Lensa 可以生成肖像画等内容。 3. 其他相关软件: 百川智能 BaichuanNPC 可以定制游戏角色和动漫人物,并融合角色知识库和多轮记忆,提供 Lite 和 Turbo 两种版本。 阿里巴巴 FaceChainFACT 支持零样本肖像生成,秒级速度,支持百余种定制模板,兼容 ControlNet 和 LoRA 插件。 BakedAvatar 可以从视频创建逼真 3D 头部模型,实时渲染和多视角查看,兼容多种设备,可交互性编辑。 DragNUWA 能够基于文本、图像和轨迹生成视频,用户绘制轨迹即可动态生成。
2024-11-22
可以根据照片,生成漫画人物的AI软件
以下是一些可以根据照片生成漫画人物的 AI 软件和相关信息: HeyGen 推出了基于照片生成数字人的新功能,您可以上传照片或输入文字提示来生成个性化的 AI 数字人形象。能选择性别、年龄、种族,定制肢体动作、服装、姿势和背景,支持脚本编辑,提供多种声音和情感表达,一分钟即可生成视频。详情链接: 在使用过程中,如果生成了自己比较满意的图,一定要记得存起来。下次想要同种类型的就可以直接拿来喂图,效果要比重新找的好很多。
2024-11-22
可以生成人物的AI软件
以下是一些可以生成人物的 AI 软件: 1. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色。它运用深度学习算法生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:这是一个 AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:这是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 在剪映中生成数字人的步骤如下: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,比如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,剪映 App 会生成对应音视频并添加到轨道中。左下角会提示渲染完成时间,可点击预览查看效果。 关于数字人的相关算法开源代码仓库有: 1. ASR 语音识别: openai 的 whisper:https://github.com/openai/whisper wenet:https://github.com/wenete2e/wenet speech_recognition:https://github.com/Uberi/speech_recognition 2. AI Agent: 大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分可使用 LangChain 的模块去做自定义,基本包含了 Agent 实现的几个组件 3. TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多分支版本。 sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注于唱歌。 除了算法,人物建模模型可通过手动建模(音频驱动)或者 AIGC 的方式生成人物的动态效果(例如 wav2lip 模型)实现。但这种简单的构建方式还存在一些问题,比如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应动作、数字人如何使用知识库做出某个领域的专业性回答等。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-11-22
如果我想让快速提取网页内容,并将其中的数据提取为表格或文档,我应该使用哪一款AI软件?
以下是一些可以帮助您快速提取网页内容并将数据提取为表格或文档的 AI 软件及相关建议: 1. 利用 AI 搜索与权威网站结合获取关键数据,AI 可辅助提取结构化表格数据或编写抓取程序。但要注意,信息收集过程中,AI 仅作辅助,最终内容需人工主导校验,避免误导性结论。 2. 对于数据处理,可以借助传统工具如 Excel,结合 AI 指导高效操作数据筛选与图表生成。 3. 分析与撰写时,通过整理数据,利用 AI 辅助分析后撰写报告初稿,可指定风格并校验数据与结论准确性。 此外,Mistral 发布了全新聊天应用,基于 Pixtral Large 124B 多模态模型,支持网络搜索、写作画布与 Flux Pro 图像生成功能。其网络搜索工具可获取最新信息,写作画布功能适合文档创作与协作,高质量图像生成工具 Flux Pro 支持免费使用。您可以通过在线体验: 了解更多。
2024-11-22
推荐一款国内不错的AI视频生成软件
以下为您推荐几款国内不错的 AI 视频生成软件: 1. 可灵:在 AI 视频生成领域表现出色,具有以下优势: 卓越的视频生成质量,与国际顶级模型相当,能满足普通用户和专业创作者的需求。 生成速度快,处理效率高于国外同类产品,提升用户工作效率。 对国内用户可访问性强,提供便捷、稳定的使用体验。 2. Hidreamai:有免费额度,支持文生视频、图生视频,提示词使用中文、英文均可,文生视频支持多种控制,可生成 5s 和 15s 的视频。网址:https://hidreamai.com//AiVideo 3. ETNA:由七火山科技开发,可根据简短文本描述生成相应视频内容,生成视频长度 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps,支持中文,时空理解。网址:https://etna.7volcanoes.com/ 此外,还有 Pika、SVD、Runway、Kaiber、Sora 等国内外提供此类功能的产品,您可以根据自己的具体情况进行选择。更多的文生视频网站可查看: 需注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-22
知识库软件有什么推荐的吗
以下是为您推荐的一些知识库软件: 稿定 AI:国内设计工具稿定推出的 AI 创意工具合集,包括设计宣传图、绘图、素材、商品图、文案、AI 圈等功能,能切中国内内容营销的痛点,体验良好。 OpenCat:由开发,推出了付费订阅计划,每月 18 元可无限使用 GPT3.5 及一些软件的高级功能,如 iCloud 同步、AI 键盘等。 Tana:非常强大的知识管理软件,推出了 AI 相关功能,不仅能扩写文本,还能与您的所有数据交互并访问网上信息。 Read Speak:由开发的利用 ChatGPT 联系口语的 APP,支持与虚拟角色对话边学边练,具有实时发音评价、实时语法纠错等功能。 STUDIO AI:AI 驱动的无代码网页构建工具,能学习用户反馈并将设计转化为实际网站,内含 WebDesignAI,具有自动补全样式和内容的功能,支持语音控制编辑器完成日常设计任务。 Clarity:AI 驱动的分层阅读工具,提供分层的深度阅读功能,用户可从摘要开始掌握复杂主题,通过点击相应内容了解更多细节。 如果您想搭建个人知识库,还可以参考文章,忽略本地部署大模型环节,直接看其中推荐的软件。但使用时可能需要对接一些额外的 API,建议先了解 RAG 的原理再使用。
2024-11-22
什么工具/模型/API 可以根据宠物照片生成数字宠物 可以有简单的活动。
以下是一个可以根据宠物照片生成数字宠物并具有简单活动的工具/模型/API: 出门问问 Mobvoi 的照片数字人工作流及语音合成(TTS)API。 出门问问是一家以生成式 AI 和语音交互为核心的人工智能公司,为全球多个国家提供面向创作者的 AIGC 工具、AI 政企服务,以及 AI 智能硬件。致力于打造国际领先的通用大模型,通过 AI 技术、产品及商业化三位一体发展,致力成为全球 AI CoPilot 的引领者。 在 ComfyUI 全球领导力峰会上,特意搭建了数字人 workflow(照片数字人驱动),仅需上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”。本次活动特意提供了免费 api 额度及操作指南给大家进行体验。以下是一些不同风格的照片驱动效果展示:
2024-11-16
有可以更具提供的文本和照片生成视频的AI吗?
以下是一些可以根据提供的文本和照片生成视频的 AI 工具: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作并支持视频编辑。目前内测免费,其生成服务托管在 Discord 中。操作步骤包括加入 Pika Labs 的 Discord 频道,在“generate”子区输入指令生成或上传本地图片生成视频,对不满意的效果可再次生成优化。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。 内容由 AI 大模型生成,请仔细甄别。
2024-11-11
照片生成卡通画
以下是关于照片生成卡通画的相关内容: 1. 个性卡通头像生成: 复杂提示词:如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultra detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino iw 1.5 s 500 v 5”。 不同照片生成:可更换新照片使用上述提示词重新生成。 其他调整:若不喜欢 Disney 风格,可将提示词中的“Disney”换成“Pixar”;若为女孩,可将“boy”换成“girl”。每次生成 4 张图片,满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 2. 【SD】简笔水彩风格插画生成: 大模型:“Flat2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复可拉到 11)。 Lora:“Chinese painting style”可增加中国画水彩风格效果,权重设置为 0.4;“Crayon drawing”可添加简单线条和小孩子笔触,权重设置为 0.8。 操作步骤:将图片丢到标签器中反推关键词,发送到“文生图”;在正向提示词末尾添加上述 lora;设置好尺寸,重绘幅度开 0.5 让 AI 更自由发挥,想接近原图可降低数值;将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 3. 进阶使用技巧总结: 通用人物模版:想用真人照片生成卡通头像,可用「真人照片」+「照片描述」+「方法 1 的关键词」处理。若生成满意的图要记得保存,下次同种类型可直接喂图,效果更好。
2024-11-07
照片修复
以下是关于照片修复的相关知识: 图像高清修复与无损放大的流程通常分为三部分: 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,因其处理时间长。 图像高清修复:使用 Iceclear/StableSR 等模型进行高清修复并 2 倍放大,搭配 Stable SR Upscaler 模型和合适的提示词,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。 图像高清放大:用 realisticVision 底膜进行二次修复,使用提示词反推 node 提取画面提示词,搭配 tile ControlNet 提升细节感,再用合适的高清放大模型二次放大。 用 AI 给老照片上色: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时将图片放大。 可在 PS 里调整角度和裁切照片,然后上色。对于复杂照片,可放弃人物服装颜色指定,只给场景方向,加入第二个 controlnet 控制颜色,如使用 t2ia_color 模型,关键词如蓝天、绿树、灰石砖。 将照片放入后期处理,使用 GFPGAN 算法清晰人脸,五官重绘后,再将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型修复,vae 选择 vqgan,可不写提示词以免干扰原图。
2024-11-06
老照片修复
以下是关于用 AI 给老照片上色的详细步骤和方法: 1. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时放大图片。 2. 在 PS 里进行角度调整和照片裁切。 3. 对于人物照片还原,选择 realisian 的写实大模型,提示词直接描述颜色和对应内容。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 4. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。 5. 把图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 6. 对于复杂的照片,如人物多、场景复杂、像素低的,可先放弃人物服装颜色指定,只给场景方向,让 AI 自行决定颜色。还可加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,给出简单关键词如“蓝天、绿树、灰石砖”。 参考文章: 1. 2. 作者:白马少年,发布时间:20230910 19:00,原文网址:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw
2024-11-06
人物生成的AI
以下是关于人物生成的 AI 相关内容: 一、7 大方向快速生成合心意的 AI 人物形象 在工作中,为完成 Banner 设计常涉及人物素材,作者对 Midjourney 进行 AI 人物生成的相关测试并分享经验。 刚开始使用 Midjourney 时,生成人物图片存在人物位置、大小和视角无法保证,固定动作需垫相同动作图片等问题,后通过摄影知识和咨询 ChatGPT 确定了 7 个生成方向并进行实验: 1. 人物构图的视角选择:视角可分为正面、背面和侧面等,还可根据需求选择更多角度。测试未加关键词时生成的图片默认偏欧美风,人物视角多为正面和侧面。增加正视角关键词“Front view”后,生成的人物偏正面;增加后视角关键词“Back view angle & Back angle”可营造神秘氛围。 2. 人物角度的选择 3. 人物距离的选择 4. 人物表情的选择 5. 人物氛围感的选择 6. 人物服装的选择 7. 人物风格的选择 二、生成式 AI 在游戏领域的机会(市场假设+预测) 市场生态概述: 1. 许多创业公司尝试创造人工智能生成的音乐,如 Soundful、Musico 等,虽目前部分工具如 Open AI 的 Jukebox 不能实时运行,但初始模型建立后有望实现。 2. 众多公司致力于为游戏人物创造逼真声音,如 Sonantic、Coqui 等。生成式人工智能用于语音有多种优势,包括即时对话生成、角色扮演、控制音效、本地化等。在即时对话生成方面,角色可对玩家行为充分反应;在角色扮演中,与玩家化身匹配的生成声音可保持幻想;控制音效时能调节声音细微差别;本地化可方便翻译和国外推广。涉及到 NPC 和玩家角色等方面。
2024-11-22
AI自动生成当日新闻提要
以下是 11 月 7 日的 AI 新闻提要: 马斯克 xAI 公司宣布推出 PromptIDE 开发工具。 阿里云 A100 服务器业务暂停出租,算力价格飞涨。 微软发布 7 款针对对话优化的 AI 语音,更加逼真自然。 谷歌正测试 2 项 AI 功能,以改善 YouTube 观看体验。 微软将 AI 引入 Xbox,可生成 AI 角色、故事剧情等。 英国一学校启用人工智能担任校长,帮助教师解学生。 百度虚拟数字人「度晓晓」携文心一言入驻淘宝。 美团推出 AI 产品 Wow 定位 AI 朋友社区。 以下是一些好用的 AI 新闻写作工具推荐: 1. Copy.ai:是一款功能强大的 AI 写作助手,提供丰富的新闻写作模板和功能,可快速生成新闻标题、摘要、正文等内容,节省写作时间并提高效率。 2. Writesonic:专注于写作的 AI 工具,提供新闻稿件生成、标题生成、摘要提取等功能,智能算法能根据用户信息快速生成高质量新闻内容,适合新闻写作和编辑人员使用。 3. Jasper AI:人工智能写作助手,虽主打博客和营销文案,但也可用于生成新闻类内容,写作质量较高,支持多种语言。 需要注意的是,这些内容由 AI 大模型生成,请仔细甄别。
2024-11-22