直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

AI 出图合成技巧

回答

以下是一些 AI 出图合成的技巧:

方法 1(SD 出图 + AI 视频软件): 在 SD 的 controlnet 中上传原图,选择深度,通过文生图生成图片,然后将生成好的图放在 AI 视频工具中进行视频生成。相关网站:dreamina:https://dreamina.jianying.com/ai-tool/video/generate

方法 2(MJ 出图 + AI 视频软件): 使用 Midjourney 垫图加上描述出图,再去视频工具中转成视频。可在下载[素材]项里的深度图,打开 MJ 官网(https://www.midjourney.com/)上传深度图。局部重绘有一定难度,最终方式可以是分开画,比如先画个被关着的红衣服女孩,再画个二战德国士兵的背影,然后合成,拼在一起再交给 MJ。各种垫图局部重绘也能无中生有。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

第1期已完成:Video Battle 视频挑战第1期:巨大三角

[title]第1期:Video Battle AI 视频挑战-巨大三角[heading1]Video Battle 视频挑战第一期 主题:巨大三角[heading2]教程:89[heading3]方法3【SD出图+AI视频软件】[content]在SD的controlnet中上传原图,选择深度。文生图就可以生成图片。再把生成好的图放在AI视频工具中进行视频生成dreamina:https://dreamina.jianying.com/ai-tool/video/generate成片:

第1期:Video Battle AI 视频挑战-巨大三角

[title]第1期:Video Battle AI 视频挑战-巨大三角[heading1]Video Battle 视频挑战第一期 主题:巨大三角[heading2]教程:89[heading3]方法3【SD出图+AI视频软件】[content]在SD的controlnet中上传原图,选择深度。文生图就可以生成图片。再把生成好的图放在AI视频工具中进行视频生成dreamina:https://dreamina.jianying.com/ai-tool/video/generate成片:

第7期:Video Battle AI 视频挑战-爱

使用Midjourney垫图➕描述出图,再去视频工具中转成视频下载[素材]项里的深度图,打开MJ官网上传深度图Midjourney官网:https://www.midjourney.com/局部重绘有点难度⬇️,放弃最终方式:分开画:先画个被关着的红衣服女孩,再画个二战德国士兵的背影,再合成。p在一起再丢给MJ各种垫图局部重绘也能无中生有

其他人在问
如何用AI绘画赚钱
以下是一些用 AI 绘画赚钱的方式: 1. 参与创作者招募:WaytoAGI 联合 GreaterHeat 进行手机壳创作,当商品售出后,创作者会获得相应收益。在 7 8 月测试期间,每件商品售出按 3 美元/件计算收益(需扣除韩国的预扣税),预扣税以财务的计算口径为准,7 8 月产生的收益,9 月可以开始提现。9 月平台正式上线后,收益计算公式为:×分成比例 预扣税净额支付 = 当月总收益,采用阶梯分成机制,按商品售价的实际分成比例结算。 2. 在小红书上变现: 用 AI 做手机壁纸,6 块钱一张,卖了 463 张,一个月约 2400 左右。这种号一般能同时上架很多壁纸,速度快的一天可以做几十套。制作时把咒语搞定以后不停出图,唯一需要花时间的就是排版,可使用美图秀秀或者醒图自带的手机壁纸模版。 3. 电商领域的珠宝设计:提升珠宝玉器行业定制效率,包括输入原始纹理、生成 AI 设计、叠加纹理效果、机器雕刻生产等环节。
2024-09-17
@ 用ai制作优美的歌曲用什么工具软件,详细的使用教程
以下是用 AI 制作优美歌曲的相关工具软件及使用教程: 工具软件: 1. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。网址:https://www.udio.com/ 2. Suno AI:是一款革命性的人工智能音乐生成工具,它通过先进的深度学习技术,能够将用户的输入转化为富有情感且高质量的音乐作品。网址:https://suno.com/ 使用教程: 1. 导出时间轴歌词:使用剪映(剪辑软件),其导出时间轴歌词的功能位置如下图所示。 2. 音乐分轨:可以使用腾讯 QQ 音乐旗下的 TME Studio,支持一键分轨,再将分轨好的音频文件进行全部导出。TME Studio 网站链接:https://y.qq.com/tme_studio/ 3. 音频编辑:对于分轨好的视频,可以导入 Adobe Audition 进行编辑。有编曲经验的同学可以自由发挥,没有编曲经验的小白可以打开电脑的录屏工具,录制歌曲的工程文件,上传提供创作证明。 4. 准备音频素材: 使用干声转换时,在软件中分别导入人声干声和伴奏,放在两个轨道上。干声用于转成 MIDI 做 AI 演唱。 男歌女唱或者女歌男唱时,在导入前先进行变调。常用的工具包括 TME Studio(腾讯音乐开发的 AI 音频工具箱,其中最常用的是音频分离,可用于将人声和伴奏从歌曲中提取出来。地址:https://y.qq.com/tme_studio/index.html/editor)和 Vocalremover(包含音频分离、变调、BPM 查询等功能,使用较多的是变调和 BPM 查询。建议在准备素材阶段,就将音频调整到所需调,并获取到 BPM。地址:https://vocalremover.org/zh/keybpmfinder) 关于申请网易云音乐人和上传音乐,只提供了认证成功的方法和过程,不能确保所有人都能成功,这是一个概率性的问题。此外,根据 AI 创作目前的特殊性,会在平台上声明此音乐为 AI 创作,并且也绝对支持尊重所有原创作品,也希望平台能尽快开辟一个 AI 创作的专区,可以提供一个容纳并保护所有群体的不同板块。
2024-09-17
能整理网上信息的ai
以下是为您整理的关于能整理网上信息的 AI 的相关内容: 存在能联网检索的 AI,它们通过连接互联网,实时搜索、筛选并整合所需数据,为用户提供更精准和个性化的信息。例如: 1. ChatGPT Plus 用户现在可以开启 web browsing 功能,实现联网功能。 2. Perplexity 结合了 ChatGPT 式的问答和普通搜索引擎的功能,允许用户指定希望聊天机器人在制定响应时搜索的源类型。 3. Bing Copilot 作为一个 AI 助手,旨在简化您的在线查询和浏览活动。 4. 还有如 You.com 和 Neeva AI 等搜索引擎,它们提供了基于人工智能的定制搜索体验,并保持用户数据的私密性。 在利用 AI 打造爆款公众号文章时,可在搜索框中输入具体的 Prompt 来快速定位相关资讯,如“查找关于 OpenAI 对马斯克言论回应的博客文章”。通过 AI 工具如 Perplexity.AI 获取搜索结果,结果中包含大量引用和来源链接,可点击回答内容下方的拷贝按钮获取相关引用网站链接。同理,微软的 Bing 搜索引擎等也提供类似功能,从而快速搜集大量相关资料。 收集完资料后,可使用月之暗面开发的 Kimi 这个 AI 会话助手进行整理。Kimi 具备读取网页内容的能力,并能在此基础上生成一定内容,读取完毕会显示绿色标点作为提示。但需注意其阅读能力有一定限制,可能无法一次性处理大量资讯或读取某些网站内容,可分批次提供资料以确保其有效读取和理解。 内容由 AI 大模型生成,请仔细甄别。
2024-09-17
中国好用的ai
以下是为您推荐的中国好用的 AI 产品: 图像类产品:通义万相。它在中文理解和处理方面表现出色,用户可选择多种艺术和图像风格,生成的图像质量高、细节丰富,操作界面简洁直观、用户友好度高,且能与阿里其他产品和服务无缝整合。目前免费,每天签到获取灵感值即可。但也存在一些局限性,如为符合国内监管要求,某些类型图像无法生成,处理非中文语言或国际化内容可能不够出色,处理多元文化内容时可能存在偏差。 健身类产品: Keep:中国最大的健身平台,为用户提供全面的健身解决方案。网址:https://keep.com/ Fiture:沸彻魔镜由核心 AI 技术打造,集硬件、丰富课程内容、明星教练和社区于一体。网址:https://www.fiture.com/ Fitness AI:利用人工智能进行锻炼,增强力量和速度。网址:https://www.fitnessai.com/ Planfit:健身房家庭训练与 AI 健身计划,AI 教练是专门针对健身的生成式人工智能,使用 800 多万条文本数据和 ChatGPT 实时提供指导。网址:https://planfit.ai/
2024-09-17
能将论文形成总结的AI
在论文写作领域,AI 技术提供了多方面的辅助,以下是一些相关的工具和方法: 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,助于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,能提供文献推荐和引用分析。 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化,助力复杂数据分析和模型构建。 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 对于医学课题需要 AI 给出修改意见,您可以考虑使用以下工具: Scite.ai:是一个创新平台,提供引用声明搜索、自定义仪表板和参考检查等工具,增强对科学文献的洞察。 Scholarcy:能从文档中提取结构化数据,并通过知识归纳引擎生成文章概要,包含关键概念、摘要、学术亮点等板块内容。 ChatGPT:强大的自然语言处理模型,可提供修改意见。 关于总结长文档,由于 GPT 具有固定的上下文长度,不能在单个查询中总结太长的文本。要总结长文档,如一本书,可以使用一系列查询来总结文档的每一部分,部分总结连接并再次总结,递归进行直至完成。若需使用早期章节信息理解后期章节,在总结某一点内容时,可包括前文的运行总结。OpenAI 在使用 GPT3 的变体进行的之前的研究中,已研究过此程序对总结书籍的有效性。
2024-09-17
适合短剧的ai
以下是关于适合短剧的 AI 相关内容: 介绍了使用 Pika、Pixverse、Runway、SVD 四大 AI 视频工具制作 AI 短片的情况。 决定每张图片只抽一次卡,包括科幻片、战争片等剧情的远景、特写、全景、中景等画面。 提到 Midjourney 的语义理解有进步,在生图时可采用生成动物或特定名人/有特殊属性人物的取巧方式。 确定影片风格为皮克斯动画风格,明确主要角色形象并按特定格式写 prompt。 解决了部分人物和场景一致性问题,如主场景为四面是书柜的屋子,采用穿书方式分布场景。但双人关系镜头部分仍有困难,如特定场景的中景或全景镜头生成较难。
2024-09-17
SD和MJ出图的效果怎么样?
SD(Stable Diffusion)和 MJ(Midjourney)出图效果各有特点: 初步生成方面:DALLE 3 具有强大的文本识别能力,能快速生成符合意图的画面;MJ 则通过垫图功能(Sref 和iw 组合)确保图像风格一致。 图像优化方面:对于 DALLE 3 和 MJ 跑不出来的图,SD 可用于图像的细节处理,尤其是局部重绘,如调整人物手部细节。 角色原画设计方面:相较于 SD,MJ 能生成更多样、更具设计感的角色设计,不受制于特定模型风格。使用 Midjourney + Stable Diffusion 混合模式进行原画设计,有两到三次的 Prompt 调整空间,能运用 SD Controlnet 的各种功能对设计细节进行更多更细致的调节,可产出更合理的结构、更丰富的细节,效率极高,在合适条件下一个完整方案产出示例不超过十五分钟,还能极大避免 Midjourney 可能造成的版权争议和信息泄露风险。 模型表现方面:在 UI 设计的图标类型中,SDXL 的训练素材可能较久远,表现不如 MJ。Stability AI 称 SDXL 能识字,能还原文字内容,但字形和图像效果不如 MJ。您可以在使用 SDXL 的 API 构建内容。
2024-08-19
我想利用AI创作出图片视频在抖音变现我应该怎么做?
利用AI创作图片和视频在抖音变现是一个多步骤的过程,涉及到内容创作、账号运营和商业变现等方面。以下是一些基本步骤和建议: 1. 确定内容方向: 确定你想要创作的内容类型,比如教学、娱乐、生活记录、产品展示等。 2. 学习和研究: 学习AI创作的基础知识,研究抖音平台的内容规则和用户偏好。 3. 选择AI创作工具: 选择适合你需求的AI创作工具,如图像生成工具(DALLE、Stable Diffusion等)和视频编辑工具(Adobe系列、Filmora等)。 4. 内容创作: 使用AI工具创作图片和视频内容。确保内容具有创意、高质量,并且符合抖音用户的口味。 5. 内容编辑和优化: 对生成的内容进行编辑和优化,确保画面美观、剪辑流畅,并符合抖音的格式要求。 6. 添加字幕和特效: 利用AI工具或抖音内置功能为视频添加字幕和特效,提高视频吸引力。 7. 制定发布计划: 制定合理的发布计划,保持定期更新,以吸引和维持粉丝。 8. 互动与社区建设: 在抖音上与粉丝互动,回复评论,参与挑战和话题,建立社区。 9. 分析数据: 分析视频数据,了解哪些类型的内容更受欢迎,根据数据调整创作策略。 10. 变现策略: 利用抖音的变现工具,如商品橱窗、广告植入、直播带货、参与抖音的变现计划等。 11. 合作与推广: 寻找品牌合作机会,参与抖音的推广活动,扩大你的影响力。 12. 遵守规则: 遵守抖音和相关法律法规,确保内容不侵权、不违规。 13. 持续学习和改进: 持续学习最新的AI创作技巧和抖音运营策略,不断改进你的内容和运营方式。 14. 注意版权问题: 确保使用的素材、音乐等不侵犯他人的版权。 15. 建立个人品牌: 在抖音上建立个人品牌,提高自己的知名度和影响力。 通过上述步骤,你可以利用AI创作图片和视频在抖音上进行内容创作和变现。记住,内容的质量和创意是吸引观众的关键,而持续的学习和改进则是长期成功的重要因素。
2024-07-26
用别人的模型出图商用 会侵权吗
使用别人的模型出图商用是否侵权,需要根据具体情况来判断。 以腾讯混元大模型为例,其适用场景包括给自己或身边人做头像、公众号和媒体版面排版时的文字配图、制作海报、PPT 的素材以及广告配图等。但需要注意的是,腾讯混元大模型并不主张生成图片的版权,且原素材涉及到的版权风险可能存在争议。比如,如果用混元生成了某个 IP 如皮卡丘、米奇老鼠等,或者某个名人的真人脸,都可能存在侵权风险。建议在使用配图过程中尽量避免此类情况。如果最终使用了腾讯混元大模型生成的图片,应注明“由腾讯混元大模型生成”。 从全国首例 AI 生成图片著作权案例解读来看,软件设计者通过设计算法训练出智能模型,对模型设计投入了智力成果。但图片是由创作者根据个人意愿,选取提示词、修改参数等步骤得出的最终成品,著作权属于人类创作者。尽管 AI 是工具,但法院强调著作权仍然属于人类创作者,保护了人类在知识产权领域的权益。 根据《中华人民共和国著作权法》第十一条规定,著作权属于作者,创作作品的自然人是作者。由法人或者非法人组织主持,代表法人或者非法人组织意志创作,并由法人或者非法人组织承担责任的作品,法人或者非法人组织视为作者。在未显示作者身份信息的情况下使用图片可能构成侵权。
2024-07-22
某银行计划对外采购2024年分行内训师培训项目,现需要对采购内容做详细要求,培训内容以AI工具课程开发与设计,课程制作与实践,短视频制作,直播授课技巧等,我该如何对培训老师资质,授课经验,AI工具运用等技能做细化要求
以下是为您提供的关于银行采购 2024 年分行内训师培训项目中对培训老师资质、授课经验、AI 工具运用等技能的细化要求建议: 培训老师资质: 具备相关领域的专业教育背景,如计算机科学、人工智能等。 持有相关的行业认证或资格证书。 授课经验: 拥有丰富的企业内训经验,特别是在金融行业的培训经历。 成功完成过类似 AI 工具课程开发与设计、课程制作与实践等相关课程的授课。 AI 工具运用技能: 熟练掌握多种主流的 AI 工具,如常见的机器学习框架、自然语言处理工具等。 能够运用 AI 工具进行实际项目开发,并具有相关的案例成果。 熟悉短视频制作和直播授课中涉及的 AI 辅助技术,如智能剪辑工具、虚拟主播技术等。 希望以上建议对您有所帮助。
2024-09-13
kimi的使用技巧
以下是关于 Kimi 的使用技巧: 1. 主界面栏使用: 网址阅读与分析(国内文章几乎都能读): 发送链接:在与 Kimi 智能助手的对话中,直接发送您想要 Kimi 阅读的链接。 解析链接:Kimi 会自动解析您发送的链接内容,并在回复中提供该链接的内容概要。 提问:在 Kimi 解析链接内容后,您可以针对链接内容提出具体问题。 获取回答:Kimi 会根据链接内容和您的问题,给出相应的回答。 2. 浏览器 Kimi 插件: 文末的 ZIP 格式插件应该可以自定义提示词,大佬们自己探索。 插件介绍: 概述:安装后,在浏览网络文章时点击插件图标,或使用快捷键 Ctrl/Cmd+Shift+K,即可一键召唤 Kimi 总结网页内容。 特点: 极简,点击一键总结,没有其它花里胡哨的功能。 Kimi 无法访问的网页也可以进行总结,如推特等。 英文文章直接用中文总结要点。 支持 Dark Mode。 注意: 本插件为第三方爱好者开发,不是 Kimi 或月之暗面官方产品。 由于 Arc 等浏览器没有所需的 API,所以本插件在 Arc 等浏览器无法使用。 3. 利用 Kimi 整理资料: 收集完资料后,可使用 Kimi 进行整理。Kimi 具备读取网页内容的能力,并且能够在此基础上生成一定的内容。当 Kimi 读取完毕时,会显示绿色标点作为提示。 需要注意的是,Kimi 的阅读能力有一定的限制,它可能无法一次性处理大量的资讯,或者某些网站的内容可能无法被读取。为了克服这些限制,可以分批次地将资料提供给 Kimi,确保它能有效地读取并理解所有可用的网站内容。
2024-08-28
新手如何掌握提示词技巧
对于新手掌握提示词技巧,以下是一些建议: 1. 实践和尝试:在理论学习后,通过实践来巩固知识,尝试使用各种产品并制作自己的作品。同时,可在知识库中分享实践成果。 2. 体验 AI 产品:与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等互动,了解其工作原理和交互方式,获得实际应用的体验。 3. 持续学习和跟进:关注 AI 领域的新闻、博客、论坛和社交媒体,加入相关社群和组织,参加研讨会等,以了解最新发展。 在具体的提示词技巧方面: 1. 对于一般的提示词: 语气:指定所需语气,如正式、随意、信息性、说服性等。 格式:定义格式或结构,如论文、要点、大纲、对话等。 限制:指定约束条件,如字数或字符数限制。 引用:要求包含引用或来源以支持信息。 语言:指明回应的语言。 反驳:要求解决潜在的反驳论点。 术语:指定要使用或避免的行业特定或技术术语。 类比:要求用类比或示例阐明概念。 2. 对于 Stable Diffusion 的提示词: 学习基本概念:了解其工作原理、模型架构,理解提示词对生成结果的影响,掌握提示词的组成部分。 研究官方文档和教程:通读官方文档,研究开发团队和专家的教程与技巧分享。 学习常见术语和范例:熟悉相关领域的专业术语和概念,研究优秀的图像标题和描述。 掌握关键技巧:学会组合多个词条精确描述效果,掌握使用特定符号控制生成权重,处理抽象概念和情感等无形事物的描述。 实践和反馈:尝试生成不同风格和主题的图像,对比结果并总结经验,在社区分享并获取反馈。 创建提示词库:按主题、风格等维度建立自己的提示词库,记录成功案例。 持续跟进前沿:关注最新更新和社区分享,掌握新技术、新范式和新趋势。 总之,学习提示词技巧是一个长期的过程,需要耐心和持续的努力,不要害怕犯错,每个挑战都是成长的机会。
2024-08-28
prompt的技巧
以下是关于 prompt 技巧的相关内容: 最早接触 Prompt engineering 时学到的一些常见技巧包括:“你是一个 XX 角色”“你是一个有着 X 年经验的 XX 角色”“你会 XX,不要 YY”“对于你不会的东西,不要瞎说”等。对比直接像使用搜索引擎一样提问,这些技巧能明显提升回复效果。 从 Github 上的中发现,Prompt 还可以在运行中调整各种变量并立即生效,对话语言可以随时更改,像编程一样提前预置好命令供用户调用。 为了更好地控制效果,写 prompt 时建议结构化书写。可以用 Markdown 文本格式,以中文说明 prompt 的八大结构,但实操中要用英文。详细的 prompt 教程请见。 后续教程会补充如何给提示词加权重,入门阶段可以先简单写 prompt,甚至交给翻译器进行中文输入英文输出。负向提示词 Negative Prompt 技巧目前还在学习中,后续会补充完善。
2024-08-24
AI画图有哪些技巧
以下是关于 AI 画图的一些技巧: 1. 选择工具:根据具体需求选择合适的 AI 绘图工具,例如 Midjourney、Stable Diffusion 等。 2. 创建账户:注册并登录所选平台。 3. 选择模板:利用平台提供的模板库,挑选适合需求的模板。 4. 添加内容:根据需求添加并编辑图形和文字,利用 AI 自动布局功能优化图表布局。 5. 协作和分享:若需团队协作,可邀请成员一起编辑,完成后导出并分享图表。 对于绘制 CAD 图,存在一些辅助或自动生成的 AI 工具和插件,如: 1. CADtools 12:Adobe Illustrator 插件,添加 92 个绘图和编辑工具。 2. Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 3. nTopology:基于 AI 的设计软件,用于创建复杂 CAD 模型。 4. ParaMatters CogniCAD:根据输入自动生成 3D 模型。 5. 主流 CAD 软件中的生成设计工具:如 Autodesk 系列、SolidWorks 等。 使用这些工具通常需要一定的 CAD 知识和技能,初学者建议先学习基本 3D 建模技巧。 在商业化应用方面,例如: 1. 对于给定的产品实体图,稳定输出商品背景与产品图融合的商品宣传图。 2. 将产品名字嵌入背景,形成新型营销玩法。 平时可多关注相关报告,跟进图像领域的发展,多实践和记忆相关参数和技巧。例如,可参考秋叶的 SD 绘画教程。
2024-08-20
提示词有哪些技巧
以下是关于提示词的一些技巧: 1. 对于通用的提示词运用: 理解提示词的作用:提示词为模型提供上下文和指示,影响输出质量。 学习构建技巧:明确任务目标,用简洁准确的语言描述,提供足够背景信息和示例,使用清晰指令,明确特殊要求。 参考优秀案例:在领域社区、Github 等资源中研究学习。 实践、迭代、优化:多与语言模型互动,根据输出改进提示词。 活用提示工程工具:如 Anthropic 的 Constitutional AI 等。 跟上前沿研究:关注最新成果和方法论。 2. 对于向 ChatGPT 提问的提示词: 包含提问的几要素:思考问题需要的前置信息、主要解决的主客体和关系、对回答的要求、有无类似问题的参考样例,然后编辑问题模板,包括相似问题的问题与答案(非必需)、问题主体、前置条件、回答要求。 3. 对于 Stable Diffusion 的提示词: 学习基本概念:了解工作原理、模型架构,理解提示词对生成结果的影响,掌握组成部分。 研究官方文档和教程:通读官方指南,学习开发团队和专家的分享。 学习常见术语和范例:熟悉相关领域术语,研究优秀图像的标题和描述。 掌握关键技巧:学会组合词条精确描述效果,运用符号控制生成权重,处理抽象概念和情感描述。 实践和反馈:尝试生成不同图像,对比分析结果,在社区分享获取反馈。 创建提示词库:按主题、风格等建立,记录成功案例。 持续跟进前沿:关注最新更新和社区动态。
2024-08-10
我给你设计一个有机化学结构式,你能找出合成路线吗
目前的技术可以帮助您找出化学结构式的合成路线。例如,像“Coscientist”这样的人工智能系统,当被问及能否合成某个分子时,它会首先在互联网上搜索相关的合成路线,然后根据搜索结果制定实验协议,接着将实验协议写成代码以指导自动化实验设备,最后由机器人执行实验任务。这个过程是可迭代的,能够根据实验结果调整协议以改进实验并实现预期目标。 另外,在一些研究中也提到,解决诸如寻找化学合成途径等问题遵循一定的模式,虽然在实际情况中相关的可能性图可能非常庞大,但可以通过一些常见的方法来应对挑战,比如为不同的可能状态或结果分配分数,只追求得分较高的路径;在自动定理证明中,也有从初始命题向下和从最终定理向上工作,试图找到中间的交汇路径等方法。同时,如果已经确定了从 X 到 Y 存在路径的“引理”,可以将 X → Y 作为新规则添加到规则集合中。
2024-08-30
我给你分子结构,能设计合成路线吗
目前利用大型语言模型,如“Coscientist”人工智能系统,可以为给定的分子结构设计合成路线。其工作流程大致为:当被问及能否合成某个分子时,首先会在互联网上搜索相关合成路线,接着根据搜索结果制定实验协议,然后将实验协议写成代码以指导自动化实验设备,最后由机器人执行实验任务。这个过程是可迭代的,能根据实验结果调整协议以改进实验并实现预期目标。 在生物学领域,AI 也能在创造新的蛋白质方面发挥作用。例如,华盛顿大学的研究员克里斯·诺恩先生最近使用 AI 创造了一种类似萤火虫的发光蛋白质,其他研究人员也已在寻找治疟疾疫苗和帕金森病研究中使用了 AI。过去创造新蛋白质需要确定氨基酸序列如何折叠成最终分子结构以确定其实际功能,过程艰难,而现在 AI 极大地提高了效率。
2024-08-30
项目六 语音合成和音乐生成 6.1语音合成基础知识 6.1.1语⾳合成技术的发展历程 6.1.2新语⾳合成技术的优势 6.2语音合成和音乐生成应用场景 6.2.1语⾳合成技术的发展历程应⽤场景 6.2.2 ⾳乐⽣成在旅游⾏业的应⽤ 6.3语音合成和音乐生成的常用工具 6.3.1语音合成的常用工具 6.3.2音乐生成的常用工具 请根据以上内容生成思维导图
以下是为您生成的关于语音合成和音乐生成的思维导图: 一、语音合成基础知识 1. 语音合成技术的发展历程 2. 新语音合成技术的优势 二、语音合成和音乐生成应用场景 1. 语音合成技术的发展历程应用场景 2. 音乐生成在旅游行业的应用 三、语音合成和音乐生成的常用工具 1. 语音合成的常用工具 11labs(官网:https://elevenlabs.io/) 2. 音乐生成的常用工具 Manglemoose(新工具名称未公布) OpenAI 的 Jukebox(项目地址:https://openai.com/research/jukebox ) 希望这个思维导图对您有所帮助!如果您还有其他需求,请随时告诉我。
2024-08-10
音频视频合成
以下是关于音频视频合成的相关知识: 一、开源的 aiauto_v0.1 流程 跑通流程包括小说生成、语音合成、字幕生成、图像生成和视频合成: 1. 小说生成:使用 openai 的 api“gpt40613”模型 prompt 生成小说开篇,并续写至 2000 字左右。 2. 语音合成:使用 pyttsx3 开源库进行文本到语音的生成。 3. 字幕生成:使用开源 whisper 进行语音到文字识别(可输出每个词的开始与结束时间),并处理成字幕。 4. 图像生成:使用 openai 的 api“gpt40613”模型 prompt,进行“字幕文件“的分段,以及生成 dalle3 prompt,并调用 dalle3 api 接口,生成对应图片。 5. 视频合成:将图片、音频、字幕合成视频。 二、语音合成的技术原理 传统的语音合成技术一般会经过以下三个步骤: 1. 文本与韵律分析:先将文本分词,再标明每个字的发音以及重音、停顿等韵律信息,然后提取文本的特征,生成特征向量。 2. 声学处理:通过声学模型将文本特征向量映射到声学特征向量。 3. 声音合成:使用声码器将声学特征向量通过反变换生成声音波形,然后依次拼接得到整个文本的合成语音。在反变换过程中,可以调整参数,从而改变合成语音的音色、语调、语速等。 三、照片数字人工作流及语音合成(TTS)API 出门问问 Mobvoi 1. 调用参数及说明: 字段名“text”:必填,类型为 String,要合成的文本内容,限制为 1000 字符。支持 ssml 标记语言,使用说明见附录 3。 字段名“appkey”:必填,类型为 String,开发者在 AI 开放平台上申请的 appkey。 字段名“signature”:必填,类型为 String,签名,通过“appkey+secret+timestamp”进行 md5 加密,得到的 32 位 MD5 值。其中加号也参与 MD5 的计算。每次请求实时计算签名,签名有效期为 10 分钟。 字段名“timestamp”:必填,类型为 Long,当前时间戳,单位为秒。 字段名“speaker”:否,类型为 String,合成音频指定发音人。默认值:cissy_meet,其他发音人传值及计费价格请参考声音商店。 字段名“audio_type”:否,类型为 String,合成音频的格式。默认值:mp3,可选值:pcm/mp3/speexwb10/wav,只支持这四种格式中的一种。 字段名“speed”:否,类型为 Float,发音人合成的语速,支持小数点后两位。默认值:1.0,可选值:0.5 2.0。 字段名“convert”:否,类型为 String,默认值:无,可选值:robot,是否转化为机器声。
2024-08-09
合成图片用哪个平台比较好?
以下为您推荐几个合成图片的平台: 1. Stable Diffusion:可以通过 img2img 功能生成最初的背景图。在使用时,不需要过于在意画面细节,即使有错误也暂不修补。提示词如“masterpiece,best quality,low angle,depth of field,a forest with sunbeams shining through the trees,rocks laying on the ground in the foreground”可帮助生成所需图片。 2. 线上绘图网站:在绘图广场上可以发现想要的画风,点击创作会自动匹配创作使用的模型 lora 和 tag。可以截取一小张游戏人物作为底图,将线上平台有限的算力集中在人物身上。多批次、多数量地尝试不同画风,找到最符合需求的模型+lora 组合。最后还能在 C 站()下载对应模型到本地,加载部署后正式生图。 您可以根据自己的需求和使用习惯选择适合您的平台。
2024-07-16