直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

AI 出图合成技巧

回答

以下是一些 AI 出图合成的技巧:

方法 1(SD 出图 + AI 视频软件): 在 SD 的 controlnet 中上传原图,选择深度,通过文生图生成图片,然后将生成好的图放在 AI 视频工具中进行视频生成。相关网站:dreamina:https://dreamina.jianying.com/ai-tool/video/generate

方法 2(MJ 出图 + AI 视频软件): 使用 Midjourney 垫图加上描述出图,再去视频工具中转成视频。可在下载[素材]项里的深度图,打开 MJ 官网(https://www.midjourney.com/)上传深度图。局部重绘有一定难度,最终方式可以是分开画,比如先画个被关着的红衣服女孩,再画个二战德国士兵的背影,然后合成,拼在一起再交给 MJ。各种垫图局部重绘也能无中生有。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

第1期已完成:Video Battle 视频挑战第1期:巨大三角

[title]第1期:Video Battle AI 视频挑战-巨大三角[heading1]Video Battle 视频挑战第一期 主题:巨大三角[heading2]教程:89[heading3]方法3【SD出图+AI视频软件】[content]在SD的controlnet中上传原图,选择深度。文生图就可以生成图片。再把生成好的图放在AI视频工具中进行视频生成dreamina:https://dreamina.jianying.com/ai-tool/video/generate成片:

第1期:Video Battle AI 视频挑战-巨大三角

[title]第1期:Video Battle AI 视频挑战-巨大三角[heading1]Video Battle 视频挑战第一期 主题:巨大三角[heading2]教程:89[heading3]方法3【SD出图+AI视频软件】[content]在SD的controlnet中上传原图,选择深度。文生图就可以生成图片。再把生成好的图放在AI视频工具中进行视频生成dreamina:https://dreamina.jianying.com/ai-tool/video/generate成片:

第7期:Video Battle AI 视频挑战-爱

使用Midjourney垫图➕描述出图,再去视频工具中转成视频下载[素材]项里的深度图,打开MJ官网上传深度图Midjourney官网:https://www.midjourney.com/局部重绘有点难度⬇️,放弃最终方式:分开画:先画个被关着的红衣服女孩,再画个二战德国士兵的背影,再合成。p在一起再丢给MJ各种垫图局部重绘也能无中生有

其他人在问
如何系统全面地学习AI知识和了解各种AI工具
以下是系统全面学习 AI 知识和了解各种 AI 工具的方法: 对于中学生: 1. 从编程语言入手学习:可以选择 Python、JavaScript 等编程语言,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台:使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识:了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等,学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目:参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态:关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展,思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 对于新手: 1. 了解 AI 基本概念:阅读「」部分,熟悉 AI 的术语和基础概念,了解其主要分支及联系,浏览入门文章。 2. 开始 AI 学习之旅:在「」中找到为初学者设计的课程,通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,推荐李宏毅老师的课程。 3. 选择感兴趣的模块深入学习:AI 领域广泛,可根据兴趣选择特定模块深入学习,掌握提示词技巧。 4. 实践和尝试:理论学习后通过实践巩固知识,尝试使用各种产品做出作品,在知识库分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。 入门工具推荐: Kimi 智能助手是 Chatgpt 的国产平替,实际上手体验最好,推荐新手用 Kimi 入门学习和体验 AI。它不用科学上网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,也是目前对长文理解做的最好的 Ai 产品,能一次搜索几十个数据来源,无广告,能定向指定搜索源。 PC 端: 移动端 Android/ios:
2024-11-17
小说创作类型的ai
以下是关于小说创作类型的 AI 相关信息: 在写作方面,有多种 AI 产品可供选择。例如,ChatGPT 在领跑,同时像 Sudowrite 和 Verb.ai 这样的产品也出现了,用于更专业化的写作类型,比如小说。 如果您想用 AI 把小说做成视频,具体的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 以下是一些可以利用的工具及网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。 网址: 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。 网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。 网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。 网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。 网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。 网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。 网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。 网址: 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2024-11-17
有什么竞品分析的AI工具
以下是一些常见的竞品分析的 AI 工具: Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,用户可通过拖放界面轻松创建架构图。 Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,如逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图创建,可与 Archi 工具配合使用,该工具提供图形化界面创建模型。 Enterprise Architect:强大的建模、设计和生成代码工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 draw.io(现称为 diagrams.net):免费的在线图表软件,允许创建各种类型图表,包括软件架构图,支持创建逻辑视图和部署视图等。 PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 以下是一些做 PPT 的 AI 产品: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。 Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等。 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能。 以下是一些与思维导图相关的 AI 工具: GitMind:免费跨平台 AI 思维导图软件,支持多种模式,如提问、回答、自动生成等。 ProcessOn:国内思维导图+AIGC 工具,可利用 AI 生成思维导图。 AmyMind:轻量级在线 AI 思维导图工具,无需注册登录,支持自动生成节点。 Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路,生成文章大纲。 TreeMind:“AI 人工智能”思维导图工具,输入需求由 AI 自动完成思维导图生成。 EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能,帮助提升生产力。
2024-11-17
我要用数字人AI做教学讲课
数字人 AI 用于教学讲课具有诸多优势: 1. 突破时空限制:可以让历史人物如牛顿亲自授课《牛顿运动定律》,白居易讲述《长恨歌》背后的故事,学生能与任何历史人物对话交流,不受时空约束。 2. 个性化教学:能根据学生的学习情况、兴趣和偏好提供定制化学习计划和资源,因材施教,提高学习效率和成果,缓解教育资源不平等问题。 3. 提高参与感:数字教师博学多能、善解人意且不受情绪左右,基本可实现一对一辅导,让学生参与感更高。 4. 丰富教学形式:如卡尔的 AI 沃茨的数字人课程,包含 15 节视频课,持续更新并增加最新内容,还有课外社群辅导。课程回顾了 2023 年数字人领域的破圈事件,如 AI 马斯克对谈 AI 乔布斯等。 5. 优化工作流:数字人的出现能在制作个人 IP 短视频、配音、直播、智能客服、虚拟偶像等领域完成赋能。 关于数字人课程的学习: 1. 推荐卡尔的 AI 沃茨的数字人课程,建立了完整的数字人学习体系。 2. 报名方式可通过扫码查看课程详细内容和介绍。 在与 AI 交互方面: 1. 对于提示词工程和学习提示词,有人持反对观点,认为像打字和写作一样,不断尝试和大模型交互是最佳方法。 2. 和大模型交互不一定需要遵循规则,未达成目的可锲而不舍地开新窗口再尝试,或更换模型。 3. 用 Markdown 格式清晰表达问题有助于提高与大模型交流的效率和精确性,其具有结构清晰、格式化强调、适用性广等优点。
2024-11-17
给我推荐几个国内使用频率很高的前几位AI吧,可选择的工具太多导致我选择恐惧症犯了
以下为您推荐一些国内使用频率较高的 AI 工具: 1. 图像类: 可灵:由快手团队开发,可生成高质量的图像和视频,但价格相对较高,重度用户年费最高可达几千元,轻度用户有免费点数和较便宜的包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,操作界面简洁直观,用户友好度高,目前免费,每天签到获取灵感值即可,但存在一定局限性,如某些类型图像无法生成等。 2. 其他类别: 百度 Chat:AI 聊天机器人。 360AI 搜索。 AIbot ai 工具集:导航网站。 创客贴 AI:设计工具。 MasterGo:设计工具。 美图设计室:图像编辑。 魔搭社区 阿里达摩院:AI 训练模型。 即时 AI 设计:设计工具。 Boardmix 博思 AI 白板:PPT。 百度飞桨 AI Studio:AI 学习。 字节扣子。 秘塔写作猫:通用写作。 xmind:思维导图。 标小智 LOGO 生成:图像生成。 liblib.art:图像生成。 稿定设计:设计工具。 千帆大模型平台:模型。 DeepSeek:AI 聊天机器人。 墨刀 AI:设计工具。 沉浸式翻译:翻译。 火山方舟:AI 训练模型。 bigjpgAI 图片无损放大:图片增强。 processon:思维导图。 Pika:图生视频。 千库网:资源。 无限画:图像生成。 autoDL 云服务租用。 同花顺问财:金融。
2024-11-17
如何用ai练习日语口语
以下是用 AI 练习日语口语的方法和推荐的工具: 1. 语言学习应用: Duolingo:使用 AI 个性化学习体验,根据进度和错误调整练习内容,通过游戏化方式提供词汇、语法、听力和口语练习。下载应用,选择日语,按课程指引学习。 Babbel:结合 AI 技术,提供个性化课程和练习,重点在于实际交流所需语言技能。注册账户,选择日语课程,按学习计划学习。 Rosetta Stone:使用动态沉浸法,通过 AI 分析学习进度,提供适合的练习和反馈。注册并选择日语,使用多种练习模式(听力、口语、阅读和写作)学习。 2. 语言学习平台: FluentU:使用真实世界的视频,通过 AI 生成个性化的词汇和听力练习。选择日语,观看视频并完成相关练习,积累词汇和提升听力理解能力。 Memrise:结合 AI 技术,根据学习者的记忆曲线提供复习和练习,增强记忆效果。选择日语,使用应用提供的词汇卡和练习进行学习。 3. 发音和语法检查: Speechling:提供口语练习和发音反馈,帮助改进口音和发音准确性。录制语音,提交给 AI 系统或人类教练,获取反馈和改进建议。 Grammarly:可以提高写作的语法和词汇准确性,支持多种语言,包括日语。将写作内容粘贴到 Grammarly 编辑器中,获取语法和词汇改进建议。 4. 实时翻译和词典工具: Google Translate:提供实时翻译、语音输入和图像翻译功能,适合快速查找和学习新词汇。输入或语音输入需要翻译的内容,查看翻译结果和示例句子。 Reverso Context:提供单词和短语的翻译及上下文例句,帮助理解和学习用法。输入单词或短语,查看翻译和例句,学习实际使用场景。 5. AI 对话助手: ChatGPT:可用来模拟对话练习,帮助提高语言交流能力。在聊天界面选择日语,与 AI 进行对话练习,询问语法、词汇等问题,模拟实际交流场景。 Google Assistant:支持多种语言,包括日语,可以进行日常对话练习和词汇学习。设置日语,通过语音命令或文本输入与助手互动,练习日常用语。
2024-11-17
如果给AI数据,AI可以做出小波分析并出图吗
目前的 AI 技术在给定相关数据的情况下,是有可能进行小波分析并出图的。但这取决于多个因素,如数据的质量、数量、特征,以及所使用的 AI 模型和算法的能力和适应性。一些专门为数据分析和图像处理设计的 AI 模型,经过适当的训练和配置,能够处理数据并生成小波分析的结果图像。然而,要实现准确和有意义的小波分析及出图,还需要对数据进行预处理、选择合适的模型架构,并进行精细的调参和优化。
2024-10-31
给我找国内较好的Ai设计出图网站
以下是为您推荐的国内较好的 AI 设计出图网站: 爱设计 PPT:在国内 AI 辅助制作 PPT 的产品领域表现出色,其背后有强大的团队,能敏锐把握 AI 与 PPT 结合的市场机遇,已确立市场领先地位。对于经常制作 PPT 的商务人士、教育工作者、学生等都是值得尝试的工具,能提高效率并保证高质量输出。 如果您想了解关于 AI 生成 CAD 图的相关资料,可以参考以下几个方面: 学术论文:通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库搜索。 专业书籍:查找相关专业书籍。 在线课程和教程:参加 Coursera、edX、Udacity 等平台上的相关课程,在 YouTube 等视频平台上查找教程和演示视频。 技术论坛和社区:加入如 Stack Overflow、Reddit 的 r/AI 和 r/CAD 等,关注相关博客和新闻网站。 开源项目和代码库:探索 GitHub 等开源平台上的相关项目,例如 OpenAI 的 GPT3、AutoGPT 等在 CAD 设计中的应用。 企业案例研究:研究 Autodesk、Siemens 等公司在 AI 在 CAD 设计中的应用案例。 以下是一些用户在工作中对出图的需求示例: |用户|联系方式|需求| |||| |kone|18616571618|AI 短片、AI 商业广告| |晓涵|17801234978|做视频| |uohigher|13902973307|个人学习| |卿卿子|18610036923|图片批处理| |lok|18529409793|设计| |hell 小明|13590623865|产品图| |iseeu|15532394695|提高工作效率,页面设计,配文出图| |大白光|17704034008|出图和视频| |三川|18681537236|出图和 AI 出视频| |李小蜗|18366606265|动漫真人电影| |Lucky|18475643966|出图,视频| |无名之辈|15813236448|自媒体 ip 打造,影音行业的创新,母婴等电商行业的赋能| |龙|13911904101|画图,工作,变现| |colour|19977743192|工作流设计| |小熠|13242135972|视频、图片处理| |顺势上马|/|自媒体和电商办公等| |叉子|15103211190|儿童绘图,小红书引流| |harry|15921430685|兴趣学习,自媒体素材,自定义节点开发| |古戈尔|18975394699|视频,动画| |二师兄|13818462550|图像流制作,装修工程和建筑工程| |fyu|15880036058|生图|
2024-10-29
相同的参数下,用SD comfyui出图可以和SD webui出图保持图片效果一模一样么?
理论上,在应用完全相同参数(如 Step、CFG、Seed、prompts)的情况下,SD ComfyUI 出图和 SD WebUI 出图应当能保持图片效果一模一样。但在实际操作中可能会存在一些差异,比如: 提示词的多个条件下,SD 生成的图像可能无法全部满足,这与提示词引导系数有关,该系数关系到出图与文字的相关程度。 不同的模型和配置也可能影响出图效果,例如 SDXL 的大模型分为 base、refiner 以及配套的 VAE 模型,用于调节图片的画面效果和色彩。 需要注意的是,相同参数下要达到完全一致的出图效果并非绝对,还会受到多种因素的综合影响。
2024-10-14
SD和MJ出图的效果怎么样?
SD(Stable Diffusion)和 MJ(Midjourney)出图效果各有特点: 初步生成方面:DALLE 3 具有强大的文本识别能力,能快速生成符合意图的画面;MJ 则通过垫图功能(Sref 和iw 组合)确保图像风格一致。 图像优化方面:对于 DALLE 3 和 MJ 跑不出来的图,SD 可用于图像的细节处理,尤其是局部重绘,如调整人物手部细节。 角色原画设计方面:相较于 SD,MJ 能生成更多样、更具设计感的角色设计,不受制于特定模型风格。使用 Midjourney + Stable Diffusion 混合模式进行原画设计,有两到三次的 Prompt 调整空间,能运用 SD Controlnet 的各种功能对设计细节进行更多更细致的调节,可产出更合理的结构、更丰富的细节,效率极高,在合适条件下一个完整方案产出示例不超过十五分钟,还能极大避免 Midjourney 可能造成的版权争议和信息泄露风险。 模型表现方面:在 UI 设计的图标类型中,SDXL 的训练素材可能较久远,表现不如 MJ。Stability AI 称 SDXL 能识字,能还原文字内容,但字形和图像效果不如 MJ。您可以在使用 SDXL 的 API 构建内容。
2024-08-19
我想利用AI创作出图片视频在抖音变现我应该怎么做?
利用AI创作图片和视频在抖音变现是一个多步骤的过程,涉及到内容创作、账号运营和商业变现等方面。以下是一些基本步骤和建议: 1. 确定内容方向: 确定你想要创作的内容类型,比如教学、娱乐、生活记录、产品展示等。 2. 学习和研究: 学习AI创作的基础知识,研究抖音平台的内容规则和用户偏好。 3. 选择AI创作工具: 选择适合你需求的AI创作工具,如图像生成工具(DALLE、Stable Diffusion等)和视频编辑工具(Adobe系列、Filmora等)。 4. 内容创作: 使用AI工具创作图片和视频内容。确保内容具有创意、高质量,并且符合抖音用户的口味。 5. 内容编辑和优化: 对生成的内容进行编辑和优化,确保画面美观、剪辑流畅,并符合抖音的格式要求。 6. 添加字幕和特效: 利用AI工具或抖音内置功能为视频添加字幕和特效,提高视频吸引力。 7. 制定发布计划: 制定合理的发布计划,保持定期更新,以吸引和维持粉丝。 8. 互动与社区建设: 在抖音上与粉丝互动,回复评论,参与挑战和话题,建立社区。 9. 分析数据: 分析视频数据,了解哪些类型的内容更受欢迎,根据数据调整创作策略。 10. 变现策略: 利用抖音的变现工具,如商品橱窗、广告植入、直播带货、参与抖音的变现计划等。 11. 合作与推广: 寻找品牌合作机会,参与抖音的推广活动,扩大你的影响力。 12. 遵守规则: 遵守抖音和相关法律法规,确保内容不侵权、不违规。 13. 持续学习和改进: 持续学习最新的AI创作技巧和抖音运营策略,不断改进你的内容和运营方式。 14. 注意版权问题: 确保使用的素材、音乐等不侵犯他人的版权。 15. 建立个人品牌: 在抖音上建立个人品牌,提高自己的知名度和影响力。 通过上述步骤,你可以利用AI创作图片和视频在抖音上进行内容创作和变现。记住,内容的质量和创意是吸引观众的关键,而持续的学习和改进则是长期成功的重要因素。
2024-07-26
用别人的模型出图商用 会侵权吗
使用别人的模型出图商用是否侵权,需要根据具体情况来判断。 以腾讯混元大模型为例,其适用场景包括给自己或身边人做头像、公众号和媒体版面排版时的文字配图、制作海报、PPT 的素材以及广告配图等。但需要注意的是,腾讯混元大模型并不主张生成图片的版权,且原素材涉及到的版权风险可能存在争议。比如,如果用混元生成了某个 IP 如皮卡丘、米奇老鼠等,或者某个名人的真人脸,都可能存在侵权风险。建议在使用配图过程中尽量避免此类情况。如果最终使用了腾讯混元大模型生成的图片,应注明“由腾讯混元大模型生成”。 从全国首例 AI 生成图片著作权案例解读来看,软件设计者通过设计算法训练出智能模型,对模型设计投入了智力成果。但图片是由创作者根据个人意愿,选取提示词、修改参数等步骤得出的最终成品,著作权属于人类创作者。尽管 AI 是工具,但法院强调著作权仍然属于人类创作者,保护了人类在知识产权领域的权益。 根据《中华人民共和国著作权法》第十一条规定,著作权属于作者,创作作品的自然人是作者。由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者。在未显示作者身份信息的情况下使用图片可能构成侵权。
2024-07-22
我需要一个能写生成文生视频prompt的机器人,这个机器人只负责生产宠物做饭视频的文字prompt,请学习文生视频prompt写作技巧,并给我写一个这样的机器人
以下是关于文生视频 prompt 写作技巧及为您生成的一个宠物做饭视频的文字 prompt 示例: 文生视频 prompt 写作技巧: 1. 明确视觉样式:要具体描述视频的视觉基调和风格,比如是想要现实的、电影的、动画的还是超现实的。对美学的描述越具体,生成的效果就越接近期望。 2. 考虑视觉风格创意:如电影感要注重戏剧性照明、镜头光晕和高对比度;逼真风格要追求自然光、清晰细节和逼真角色;动画风格可使用卡通、3D 动画或 2D 动画等术语;艺术风格可用印象派、极简主义或抽象等形容词来指导艺术方向。 宠物做饭视频的文字 prompt 示例:“创建一个 2D 动画、色彩鲜艳的视频,一只可爱的猫咪在厨房里熟练地烹饪美味的鱼餐,画面具有温馨的灯光和可爱的卡通风格。”
2024-11-06
豆包的使用技巧
以下是关于豆包使用技巧的相关内容: Prompt 之术: 三板斧中的分配角色:“你是一个哲学家。” 不分配角色时,⇒角色模式,行为模式包括知识域、语言风格、决策倾向等。 给出示例:给我讲个笑话,如“小时候我家特别穷。有多穷呢?不管每次我生什么病,我妈都从抽屉里拿出风油精。” 不使用 Fewshots 时,⇒类比学习。 思维链⇒逻辑推理。 Prompt 之用: 豆包划词:包括场景一的翻译,如测试“cognitive distinguish”;场景二的汉语新解,如测试“奢华游戏”。 利用 AI 批量生成、模仿和复刻《小林漫画》: 扣子使用链接:https://www.coze.cn/s/iMCq73wp/ 批量生产图片:有相关视频演示
2024-10-26
帮我制定《通往AGI之路》的学习规划。并在为期一个月内将内容全部学完并掌握AI基本操作技巧
以下是为您制定的为期一个月的《通往 AGI 之路》学习规划: 第一周: 了解并选择感兴趣的学习小组,如 AI 音乐之路、关键词学社(AI 绘画)、SD 学社(AI 绘画)、AI 视频学社等。按照相应要求进群,如添加微信或飞书群,并备注相关信息。 第二周: 熟悉所选学习小组的活动规则和学习内容。 对于 AI 绘画相关的小组,开始学习相关软件的基本操作。 第三周: 积极参与小组活动,如根据关键词出图测试、案例实操等。 尝试将所学应用到实际操作中,如创建图像流智能体等。 第四周: 总结所学知识和实践经验。 巩固 AI 基本操作技巧,确保能够熟练运用。 在学习过程中,要注重学以致用,通过学习、分享不断填补知识的缝隙,成长进步。同时,要记住“少就是多”“先有个初识”“目录索引推荐”“兴趣最重要”“先动手”等学习要点,找到适合自己的学习路径。
2024-10-23
怎么样写prompt?有哪些技巧?你能举个例子吗
写 prompt(提示)是一个关键步骤,决定了 AI 模型如何理解并生成文本。以下是一些编写 prompt 的技巧和建议: 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:用简单、清晰的语言描述,避免模糊或歧义词汇。 4. 给出具体要求:明确格式、风格等特定要求。 5. 使用示例:提供期望结果的示例,帮助模型理解需求。 6. 保持简洁:避免过多信息导致模型困惑。 7. 使用关键词和标签:有助于模型理解任务主题和类型。 8. 测试和调整:生成文本后检查结果,根据需要调整 prompt。 此外,还有“Fewshots”的技巧,即在写 Prompt 时,通过提供 1 3 个输入 输出示例,让 GPT 学到样本共性,提升输出结果质量。比如: 初始 Prompt: 你是一个优秀的翻译人员,你会把我说的汉字翻译成英文和日语,日语同时展示日语汉字和假名。不要有任何额外的解释说明。 输入:邻居 输出:Neighbor 输入:自行车 输出:Bicycle 结构化的 prompt 方法论中,结构化是对信息进行组织,使其遵循特定模式和规则,方便有效理解。常用模块包括: Role:<name>:指定角色让 GPT 聚焦对应领域输出。 Profile author/version/description:Credit 和迭代版本记录。 Goals:一句话描述 Prompt 目标,让 GPT 聚焦。 Constrains:描述限制条件,帮 GPT 剪枝。 Skills:描述技能项,强化对应领域信息权重。 Workflow:重点,希望 Prompt 按特定方式对话和输出。 Initialization:冷启动时的对白,强调重点。
2024-10-22
liblib的生图技巧
以下是关于 Liblib 的生图技巧: Lora 模型地址: 原作者:C 站 DucK113 在线下载地址:https://civitai.com/models/802364/flux1orlabubulora 本地下载:file:flux_labubu.safetensors 使用方式: 方式一:Liblib 在线生图 方式二:本地 ComfyUI Flux + Lora 工作流,相关介绍可参考之前的作业:,工作流中涉及的主要模型网盘:https://pan.quark.cn/s/2797ea47f691 ,包括 FLUX.1schnell:https://huggingface.co/blackforestlabs/FLUX.1schnell/blob/main/flux1schnell.safetensors ,file:ae.safetensors ,file:clip_l.safetensors ,t5xxl_fp8_e4m3fn:https://huggingface.co/comfyanonymous/flux_text_encoders/blob/main/t5xxl_fp8_e4m3fn.safetensors Lora 效果提示词: Labubu,monkey Labubu,Chinese style 1cowboy,Labubu 简易上手教程: 简明操作流程: 定主题:确定生成图片的主题、风格和表达的信息。 选择 Checkpoint:根据主题选择贴近的模型,如麦橘写实、麦橘男团、墨幽人造人等。 选择 lora:寻找内容重叠的 lora 控制图片效果及质量。 设置 VAE:选择 840000 那一串。 CLIP 跳过层:设成 2。 Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开。 负向提示词 Negative Prompt:用英文写避免产生的内容,单词和短语组合,用英文半角逗号隔开。 采样方法:一般选 DPM++ 2M Karras,也可参考模型作者推荐的采样器。 迭代步数:选 DPM++ 2M Karras 时,在 30 40 之间。 尺寸:根据喜好和需求选择。 生成批次:默认 1 批。 概念与功能说明: 生图入口 1:网页顶部的右方有生图按钮,点击进入生图界面。 生图入口 2:点进模型广场上任意一个模型(checkpoint 或 lora),有立即生图按钮。 生图入口 3:点进任意一个模型下面的返图区,点开一张喜欢的图片,右侧有在线生成的按钮。点开之后可以选择自动复制所有设置,尝试复现图片。
2024-10-17
My GPTs使用技巧
以下是关于 GPTs 的使用技巧: 教育方面:一位历史老师用 GPT 给学生讲课,需注意模拟历史存在不准确之处,有时幻觉可能是特点而非缺陷。文末提供了可用于模拟不同历史设置的详细提示链接,也可用于 Claude 或 ChatGPT(免费版效果相当,GPT4 效果最佳)。 入门方法: 创建方式: 点击 Explore。 点击 Create a GPT 进入配置页面。 进入自定义 GPT 配置界面。 选择 Configure 进入配置页面,栏位详细解释包括添加图像、Name(GPT 名称)、Instructions(提供提示词)、Conversation starters(提示用户开始对话的示例)、Knowledge(允许提供文件作为额外上下文)、Capabilities(启用网页浏览、DALL·E 图像生成和高级数据分析等功能)、Actions(使用第三方 API 或现有的插件)。 上传个人 Logo 等图片。 填写相关信息,如无外部知识作为上下文,可不填写 Knowledge 和 Actions。 填写完自动保存,试用。 上传图片开始分析。 多次测试满意后,可在右上角点击 Save 进行发布,发布方式有 Only me(只有自己可用)、Only people with a link(通过链接访问)、Public(所有人可访问,需开启个人名称和绑定公共域名)。 其他尝试: 小七姐提到 GPTs 原理是调用 Code Interpreter 检查字数和扩写 Prompt,提供了 GPTs 地址。 也可通过代码调用 OpenAI 官方 API 实现同样效果。 还提到了一些不太正经的办法,如情绪勒索等。省事可用分治法分段输出,程序员可选择 API 方式。
2024-10-06
撰写内容概要:以ai换脸诈骗和声音合成诈骗为蓝本查阅网站、文献期刊等专家在相关方面的研究进展及其成果,并进行汇总评述。(1)表述收集资料的来源情况、收集资料的数量情况;(2)将所收集的资料进行分类,按照几个分类方面逐一进行表述,表述涵盖专家的观点、结论、思路、方案等;(3)小组综合性的对所收集到的资料进行评述,描述当前的进展情况、优劣点、未来发展等。)
以下是根据您提供的资料进行的汇总评述: 一、收集资料的情况 1. 来源情况:资料来源于陶力文律师的相关论述、关于 AI 音乐的论文、质朴发言的研究报告等。 2. 数量情况:共收集到 3 份相关资料。 二、资料分类及专家观点 1. 关于律师如何写好提示词用好 AI 观点:强调结构化内容组织、规定概述内容解读结语结构、案例和挑战结合、结合法规和实际操作、使用商业术语等。 结论:通过多种方式提升文章的专业性和针对性。 思路:从标题、文章结构等方面进行规划。 方案:按照特定的结构和要求进行写作。 2. 基于频谱图的音乐录音中自动调谐人声检测 观点:聚焦音乐中人声音高的自动调音检测,提出数据驱动的检测方法。 结论:所提方法在检测上表现出较高的精确度和准确率。 思路:包括音频预处理、特征提取和分类等步骤。 方案:创建新数据集,进行全面评估。 3. 文生图/文生视频技术发展路径与应用场景 观点:从横向和纵向梳理文生图技术发展脉络,分析主流路径和模型核心原理。 结论:揭示技术的优势、局限性和未来发展方向。 思路:探讨技术在实际应用中的潜力和挑战。 方案:预测未来发展趋势,提供全面深入的视角。 三、综合性评述 当前在这些领域的研究取得了一定的进展,如在音乐自动调音检测方面提出了新的方法和数据集,在文生图/文生视频技术方面梳理了发展路径和应用场景。 优点在于研究具有创新性和实用性,为相关领域的发展提供了有价值的参考。但也存在一些不足,如音乐检测研究中缺乏专业自动调音样本,部分技术在实际应用中可能面临一些挑战。 未来发展方面,有望在数据样本的丰富性、技术的优化和多模态整合等方面取得进一步突破,拓展更多的应用场景。
2024-11-15
如何用两张照片,合成一张绘画效果的图
以下是将两张照片合成为一张绘画效果的图的步骤: 1. 利用 Dalle3 绘图,根据以下提示词分别把高中和大学时期的内容绘制成两幅四格漫画: 高中:中午,急急忙忙跑到食堂,排长队买饭。 大学:中午,懒洋洋在宿舍点外卖,直接送到宿舍楼下。 2. 利用 Python 进行图片处理: 统一设置:使用上传的字体,字体颜色黑色。 首先: 在每张图片的上面创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上“高中”,大学的图片写上“大学”)。 文字的字体大小设置成 65px,居中显示。 然后: 在图片下方创建一个空白的白色背景区域(从原图片进行延长,而不是遮盖原图),用来放置文字(高中的图片写上),如果句子过长,要注意换行显示。 文字的字体大小设置成 45px,居中显示。 最后把两张图片拼成一张图,高中的图片在左,大学的图片在右。两张图中间放置 50px 的空白区域。 另外,还有一些相关的知识供您参考: Double Exposure 是一种视觉艺术风格,将两个或多个照片合成到一起,创建出具有艺术效果的图像,灵感来自于传统的双重曝光摄影技术。最佳提示词:Double Exposure。 在 Stable Diffusion 中,可以使用【X/Y/Z plot】脚本来做参数对比,例如将 X 轴设置为提示词相关性,取值范围是 1 30。通过对比找到合适的参数,如提示词相关性在 6 11 中间为最佳。还可以使用绘图功能进行局部修改,如增加红色眼镜、去掉衣服上的图案、更换头部或帽子等部分。
2024-11-04
两个人物图合成一张图片,有什么好工具?
以下是一些可以将两个人物图合成一张图片的工具和方法: 1. Midjourney(MJ): 确定人物形象,通过相关提示词生成人物图像。 利用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图在 MJ 中重新生图。 2. Stable Diffusion(SD): 可使用 Roop 插件进行多人物脸部替换。例如生成一张包含两个古风人物的图片,通过图生图调整重绘幅度,并在 Roop 插件中载入相应人物照片形象进行脸部替换,最后使用 PS 扩图。 3. 其他方法: 利用 MJ 画图制作底图,使用 InsightFaceSwap 插件处理脸部,分割裁剪图片、处理后缝合,再用相关软件让图片动起来。 直接在网上寻找能够融合两张照片的软件或项目,若没有则进行纯 P 图,然后利用图生视频的项目完成。
2024-10-28
照片人物与虚拟人合成
以下是关于照片人物与虚拟人合成的相关内容: 使用 Midjourney(MJ)生成人物图片: 确定人物形象,如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 MJ 中生成直到得到满意的人物图像。可使用垫图 URL 及相关提示词,如“In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”,其中“iw 取值范围,不填写默认 iw = 1,iw 值越大越接近垫的图像,反之更接近提示词。为了确保人物一致性,取 iw 2”。 合成人物和场景: 使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐,可将合成后的图作为垫图(iw 2),在 MJ 中重新生图,提示词如“垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2”。 在 StableDiffusion(SD)中绘制一致性多角度头像: 准备工作:准备一张人物的多角度图片,尺寸设置为 1328×800px,放大两倍后保证每张小图都是 512×512px。加上网格图,通过 lineart 来分割不同的块面。设置 controlnet,第一张图选择 openpose_face 得到人物的 15 个面部角度,第二张图选择 lineart_standard得到清晰的表格分区,为防止小图模式下人脸崩坏,可增加 ADetailer 的脸部修复插件。 制作数字人的工具: HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关条款和政策,并注意版权和伦理责任。
2024-10-28
如何利用自动对齐技术,确保16位不同地点的人员录制的同一句口号音频同步且整齐,请推荐具有此功能的音频编辑工具、网站或AI工具,以便将这16段音频精确叠加并融合成一个协调一致的整体
以下是关于利用自动对齐技术确保 16 位不同地点人员录制的同一句口号音频同步且整齐的相关信息及工具推荐: 在音频编辑中,常见的步骤如下: 1. 选择合适的数字音频工作站(DAW),如 Studio One。上传 FLAC 无损格式的音频,只对融合部分进行 Inpaint 处理,保持其他音频信息不变,以避免音质问题。 2. 在 DAW 中对接音轨后,播放试听,并缩放波形图,检查波形是否正确对齐。若出现波形未对齐或播放时有咔哒声等问题,可能是在导出和处理过程中对音频施加了额外的效果器处理,如混响、限制器、压缩等,导致音频前后不一致,影响对接效果。因此,需要确保在不同的导出和处理步骤中,音频不受到额外的处理,或者在每次处理时保持相同的效果设置。 具有此功能的音频编辑工具和网站包括: 1. Studio One:可用于对齐拼接音轨,并进行后续的叠加额外音轨、调整音量和平衡等操作,以丰富音频的层次,注意叠加后各音轨的电平,避免过载或失衡。 2. Udio:具有混音功能,可对现有剪辑进行微妙或明显的变化。在提示框中有新的区域,通过滑块控制混音效果的强度。 此外,阿里的相关研究全面概述了大语言模型自动对齐的主要技术路径,将现有的自动对齐方法分为四大类:利用模型固有偏好实现对齐、通过模仿其他模型行为实现对齐、利用其他模型反馈实现对齐、通过环境交互获得对齐信号,并探讨了自动对齐背后的机理以及实现有效自动对齐的关键因素。但此研究主要针对大语言模型,对于音频对齐的直接应用可能有限。
2024-10-17
如何合成照片
以下是关于合成照片的相关内容: 使用 Midjourney(MJ)生成人物图片: 1. 确定人物形象:如“a little girl wearing a yellow floral skirt + 人物动作 + 风格词”,在 MJ 中生成直到得到满意的人物图像。 垫图 URL + “In the forest,a little girl wearing a yellow floral skirt is playing happily,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2” “iw”取值范围在,不填写默认“iw = 1”,“iw”值越大越接近垫的图像,反之更接近提示词。为确保人物一致性,取“iw 2”。 合成人物和场景: 1. 使用 PS 或者 Canva 将人物和场景合成到一张图,若色调不和谐: 将合成后的图作为垫图(“iw 2”),MJ 重新生图,提示词如:“垫图 url + Little girl wearing a yellow floral skirt,and her friend brown bear,taking shelter in the cave,rainstorm,super high details,HDsmooth,by Jon Burgerman,s 400 ar 3:4 niji 5 style expressive iw 2” 使用 Camera Motion 合成照片: 1. 上传图片:点击“AddImage”上传图片。 2. 输入提示词:在“Prompt”中输入提示词。 3. 设置运镜方向:选择想要的运镜方向,输入。 4. 设置运动幅度:运动幅度和画面主体运动幅度有关,与运镜大小无关,可设置成任意值。 5. 其它:选择好种子(seed),是否高清(HD Quality),是否去除水印(Remove Watermark)。 6. 生成视频:点击“create”,生成视频。 照片数字人工作流及语音合成(TTS)API 出门问问 Mobvoi: 1. 照片数字人工作流 使用文档: 出门问问:语音合成(TTS)API 获取地址 参数及说明: 字段名:text,必填,类型为 String,要合成的文本内容,限制为 1000 字符。支持 ssml 标记语言,使用说明见附录 3。 字段名:appkey,必填,类型为 String,开发者在 AI 开放平台上申请的 appkey。 字段名:signature,必填,类型为 String,签名,通过“appkey + secret + timestamp”进行 md5 加密,得到的 32 位 MD5 值。每次请求实时计算签名,签名有效期为 10 分钟。 字段名:timestamp,必填,类型为 Long,当前时间戳,单位为秒。 字段名:speaker,否,类型为 String,合成音频指定发音人,默认值:cissy_meet,其他发音人传值及计费价格请参考声音商店。 字段名:audio_type,否,类型为 String,合成音频的格式,默认值:mp3,可选值:pcm/mp3/speexwb10/wav,只支持这四种格式中的一种。 字段名:speed,否,类型为 Float,发音人合成的语速,支持小数点后两位,默认值:1.0,可选值:0.5 2.0。 字段名:convert,否,类型为 String,默认值:无,可选值:robot,是否转化为机器声。 Request Header 设置
2024-10-16