Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何输入文字生成视频和配音

Answer

目前有以下两种输入文字生成视频和配音的方式:

  1. Meta Movie Gen 模型:
    • 由视频生成和音频生成两个模型组成。
    • Movie Gen Video 是 30B 参数的 Transformer 模型,能从单个文本提示生成 16 秒、16 帧每秒的高清视频。
    • 对于精确视频编辑,可执行添加、删除或替换元素等全局修改,在保持角色身份一致性和运动自然性方面性能出色。
    • Movie Gen Video 通过预训练-微调范式完成,沿用了 Llama3 的许多设计,预训练阶段在海量视频和图像文本数据集上联合训练,微调阶段进行有监督微调,并引入流匹配作为训练目标。
    • Movie Gen Audio 是 13B 参数的 Transformer 模型,可接受视频输入及可选文本提示生成与视频同步的高保真音频。
  2. PixVerse V3 模型:
    • Lipsync 功能可以为视频配音配口型,生成视频最长可达 30 秒,目前只支持对 PixVerse 生成的视频进行口型适配。
    • 支持多种语言,多样化音频适配,包括演讲、音乐、歌剧等。
    • 使用时,先上传带有人脸的图片,写好提示词生成视频,然后点击生成的视频,在下方找到“Lipsync”,输入文案,从预设声音中选择合适的声音或上传音频,最后点击“create”生成视频。生成视频的长度取决于文案或音频的长度,最长为 30 秒。
Content generated by AI large model, please carefully verify (powered by aily)

References

新王登基-Meta发布Meta Movie Gen文生视频模型

具体来说Movie Gen由视频生成和音频生成两个模型组成。Movie Gen Video:30B参数Transformer模型,可以从单个文本提示生成16秒、16帧每秒的高清视频,相当于73K个视频tokens。对于精确视频编辑,它可以执行添加、删除或替换元素,或背景替换、样式更改等全局修改。对于个性化视频,它在保持角色身份一致性和运动自然性方面取得SOTA性能。Movie Gen Audio:13B参数Transformer模型,可以接受视频输入以及可选的文本提示,生成与视频同步的高保真音频。Movie Gen Video通过预训练-微调范式完成,在骨干网络架构上,它沿用了Transformer,特别是Llama3的许多设计。预训练阶段在海量的视频-文本和图像-文本数据集上进行联合训练,学习对视觉世界的理解。这个阶段的训练数据规模达到了O(100)M视频和O(1)B图像,用以学习运动、场景、物理、几何、音频等概念。微调阶段研究人员精心挑选了一小部分高质量视频进行有监督微调,以进一步提升生成视频的运动流畅度和美学品质。为了进一步提高效果,模型还引入了流匹配(Flow Matching)作为训练目标,这使得视频生成的效果在精度和细节表现上优于扩散模型。扩散模型通过从数据分布逐渐加入噪声,然后在推理时通过逆过程去除噪声来生成样本,用大量的迭代步数逐步逼近目标分布。流匹配则是通过直接学习样本从噪声向目标数据分布转化的速度,模型只需通过估计如何在每个时间步中演化样本,即可生成高质量的结果。

新王登基-Meta发布Meta Movie Gen文生视频模型

Use video and text inputs to generate audio for your videos.Movie Gen allows you to create and extend sound effects,background music or entire soundtracks.使用视频和文本输入为您的视频生成音频。Movie Gen允许您创建和扩展音效、背景音乐或整个配乐。[AQM2lzIy5kQwBQ7F0FEBzOwq2YGB-hFKnmoz5SZmOmGhZCMKRc1sqsG0tK7EOVl8133rQjPhHxfRlp_WFBurPqR4.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/YkDLbXxxVohTwsxurZ0cj64HnIe?allow_redirect=1)[AQMVJRWskddOrnf-VBG9TiU7UvT52Nrzx9RtjEGPLZ3xFHHcFEJ99UrwBsa-zvvDn0JzsB25XYzU42ROH7IQZCYk.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/CiKib9WLSoqRTFxADVAc9uwHnig?allow_redirect=1)

PixVerse V3 使用指南🆕

Lipsync可以为视频配音配口型,生成视频最长可达30s,目前只支持对PixVerse生成的视频进行口型适配。Lipsync的优点是什么?支持多种语言(英语、汉语、法语、日语等等皆可适配)最长可以生成30s多样化音频适配,演讲、音乐、歌剧等等都允许[heading3]使用指南[heading4]上传图片[content]选择一张带有人脸的图片上传,写好提示词,点击生成视频。为保证最佳生成效果,建议使用单人图片。[heading4]口型同步[content]点击生成的视频,在生成的视频下方找到“Lipsync”并点击。之后,您可以输入文案,从右边的预设声音中选择合适的声音,或者点击“Upload Audio”上传一段音频,最后点击“create”生成视频。注意:生成视频的长度取决于您文案或音频的长度,最长为30s。例如,5s视频+3s音频=3s语音视频,5s视频+30s音频=30s语音视频。[heading4]口型同步实例[content]注:以下示例有声音,请打开声音后观看。文案:Ladies and gentlemen,fellow Americans,Thank you for entrusting me once again with the incredible honor of serving as your President.God bless you,and God bless the United States of America.声音:Chloe[pixverse-preview%2Fmp4%2Fmedia%2Fweb%2F86478b9d-ac02-4e3a-8f0d-0250f05aafc1_seed1823532749.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/JNrTbr4NCoMFfhxDaT8cSO53nFh?allow_redirect=1)

Others are asking
免费的AI-配音软件
目前免费的 AI 配音软件有不少,例如剪映、讯飞快读等。剪映操作相对简单,提供多种音色选择;讯飞快读则具有较高的语音合成质量。您可以根据自己的需求进行选择和试用。
2025-01-18
视频配音工具,并且可以完美对嘴型
以下为一些可以完美对嘴型的视频配音工具: PixVerse V3:Lipsync 功能可以为视频配音配口型,生成视频最长可达 30 秒,目前只支持对 PixVerse 生成的视频进行口型适配。支持多种语言,多样化音频适配,包括演讲、音乐、歌剧等。使用时,先选择一张带有人脸的图片上传,写好提示词生成视频,然后点击生成的视频,在下方找到“Lipsync”,输入文案,从预设声音中选择合适的声音或上传音频,最后点击“create”生成视频。注意生成视频的长度取决于文案或音频的长度,最长为 30 秒。 Pika:可控性强,可以对嘴型,可配音。 字节跳动开源的 LatentSync:自动根据音频调整角色嘴型,实现精准口型同步,无需复杂中间步骤。提出“时间对齐”技术,解决画面跳动或不一致问题,效果显著。开箱即用,预训练模型加持,操作简单,支持高度定制化训练。GitHub 链接:https://github.com/bytedance/LatentSync 论文:https://arxiv.org/pdf/2412.09262 此外,还有以下相关工具: Runway:网址为 https://runwayml.com ,有网页有 app 方便。 即梦:网址为 https://dreamina.jianying.com/,为剪映旗下产品,生成 3 秒,动作幅度有很大升级,最新 S 模型,P 模型。 Minimax 海螺 AI:网址为 https://hailuoai.video/ ,非常听话,语义理解能力非常强。 Kling:网址为 kling.kuaishou.com ,支持运动笔刷,1.5 模型可以直出 1080P30 帧视频。 Vidu:网址为 https://www.vidu.studio/ 。 haiper:网址为 https://app.haiper.ai/ 。 智谱清影:网址为 https://chatglm.cn/video ,开源了,可以自己部署 cogvideo 。 luma:网址为 https://lumalabs.ai/ 。 SVD:网址为 https://stablevideo.com/ ,对于景观更好用。
2025-01-15
视频配音工具
以下是一些给视频配音效的 AI 工具: 1. Vidnoz AI: 支持 23 多种语言的配音,音质高保真。 支持文本转语音和语音克隆功能。 提供语音参数自定义和背景音乐添加工具。 提供面向个人和企业的经济实惠的定价方案。 2. Wavel Studio: 支持 30 多种语言的配音,音质自然流畅。 自动去除背景噪音和杂音。 提供添加字幕和文本叠加层的工具。 界面友好,提供多种自定义选项。 3. Elai.io: 支持 65 多种语言的配音,音色和语调真实。 自动将唇形与语音同步。 生成字幕,提高视频的可访问性。 支持多位配音者,适合复杂对话场景。 4. Rask AI: 支持 130 多种语言的配音,包括稀有和濒危语言。 采用先进语音合成技术,音质高保真。 提供语音参数自定义和音效添加工具。 与多种视频编辑平台和工作流程整合。 5. Notta: 提供快速实惠的多语言配音解决方案。 保留原声说话风格和细微差别。 提供调整语音速度和音调的工具。 支持批量处理,高效完成多视频配音。 6. Dubverse: 支持 60 多种语言的配音,音质接近真人。 提供文本转语音和语音克隆功能。 提供语音参数自定义和情感添加工具。 与多种视频平台和社交媒体渠道整合。 在选择视频配音工具时,请考虑支持的语言数量、语音质量、自定义选项和价格等因素。希望以上信息对您有所帮助。如果您还有其他问题,请随时提出。
2025-01-15
配音用那个软件
以下是一些常用的配音软件及相关介绍: 1. 睿声:文字转语音配音效果较好,使用门槛较低,适合新手。操作步骤如下: 打开睿声(https://dash.reecho.ai/),登录账户。 在首页左侧选择声音社区,在搜索框中输入“宣传”后搜索,点击“宣传配音角色”并添加到列表。 回到首页,点击左侧“语音生成”,将旁白输入到文本框,选择角色“宣传 8”,点击“添加段落”,选择“高质量模式”“V2.1 均衡”,然后点击“开始生成”。 注意:睿声对于和英文字母并在一起的数字的生成效果可能不好,可把数字用中文汉字代替。生成完配音后可点击结果右上方的三个点下载保存。 2. 微软 axure:操作方法复杂,门槛高,效果和睿声类似。 3. elevenlabs:有一定门槛,推荐老手使用。 4. 魔音工坊:新用户 1 天免费体验。可以选择喜欢的主播,调整语速、语调和停顿,然后导出音频文件。 在影视作品中,如果对 AI 语音的情绪表达不满意,也可以邀请专业声音表演者来配音。音效方面,剪映中有音效资源库可供使用。此外,还为您分享以下三个音效资源站: 1. https://www.lookae.com/sucai/sfx/ :大部分免费且分好类的音效包可供下载。 2. https://www.epidemicsound.com/ :专业的音效站点。 3. https://sc.chinaz.com/yinxiao/ :适合搜索单个音效下载的站点。
2025-01-09
配音用那一个软件
以下为一些常见的配音软件推荐: 1. 睿声:文字转语音配音效果较好,使用门槛较低,适合新手。操作步骤如下: 打开睿声(https://dash.reecho.ai/),登录账户。 在首页左侧选择声音社区,在搜索框中输入“宣传”后搜索,点击“宣传配音角色”并添加到列表。 回到首页,点击左侧“语音生成”,将旁白输入到文本框,选择角色“宣传 8”,点击“添加段落”,选择“高质量模式”“V2.1 均衡”,然后点击“开始生成”。 注意睿声对于和英文字母并在一起的数字的生成效果可能不好,可把数字用中文汉字代替。生成完配音后可点击结果右上方的三个点下载保存。 2. 微软 axure:操作方法复杂,门槛高,效果和睿声类似。 3. elevenlabs:有门槛,推荐老手使用。 4. 剪映:免费,音色克隆强,背景音乐可用 elevenlabs。 5. 布谷鸟配音:免费。 6. 讯飞配音:付费。 此外,在影视作品中,如果对配音的情绪表达要求较高,也可以邀请专业声音表演者来配音。音效方面,剪映中有音效资源库可供使用,随着 AI 技术发展,未来可能会有 AI 生成音效的工具。同时为您分享三个音效资源站: 1. https://www.lookae.com/sucai/sfx/ :大部分免费且分好类的音效包可供下载。 2. https://www.epidemicsound.com/ :专业的音效站点。 3. https://sc.chinaz.com/yinxiao/ :适合搜索单个音效下载的站点。
2025-01-09
有什么AI工具能帮助我配音,输入文本即可输出声音。还有什么AI工具能复制其他人的声音,使其可以唱歌。
以下是一些能够输入文本即可输出声音的 AI 工具: 1. Vidnoz AI:支持 23 多种语言的配音,音质高保真,支持文本转语音和语音克隆功能,提供语音参数自定义和背景音乐添加工具,提供面向个人和企业的经济实惠的定价方案。 2. Wavel Studio:支持 30 多种语言的配音,音质自然流畅,自动去除背景噪音和杂音,提供添加字幕和文本叠加层的工具,界面友好,提供多种自定义选项。 3. Elai.io:支持 65 多种语言的配音,音色和语调真实,自动将唇形与语音同步,生成字幕,提高视频的可访问性,支持多位配音者,适合复杂对话场景。 4. Rask AI:支持 130 多种语言的配音,包括稀有和濒危语言,采用先进语音合成技术,音质高保真,提供语音参数自定义和音效添加工具,与多种视频编辑平台和工作流程整合。 5. Notta:提供快速实惠的多语言配音解决方案,保留原声说话风格和细微差别,提供调整语音速度和音调的工具,支持批量处理,高效完成多视频配音。 6. Dubverse:支持 60 多种语言的配音,音质接近真人,提供文本转语音和语音克隆功能,提供语音参数自定义和情感添加工具,与多种视频平台和社交媒体渠道整合。 目前能够复制他人声音使其唱歌的 AI 工具相对较少,且在使用此类工具时需要注意法律和道德规范。在选择 AI 配音工具时,请考虑支持的语言数量、语音质量、自定义选项和价格等因素。
2024-12-04
将歌曲MP3转成视频形式的AI工具
以下是一些将歌曲 MP3 转成视频形式的相关 AI 工具及操作步骤: 工具推荐: 1. TME Studio:腾讯音乐开发的 AI 音频工具箱,常用功能为音频分离,可用于将人声和伴奏从歌曲中提取出来。 地址:https://y.qq.com/tme_studio/index.html/editor 2. Vocalremover:包含音频分离、变调、BPM 查询等功能,常用的是变调和 BPM 查询。建议在准备素材阶段,就将音频调整到所需调,并获取到 BPM。 地址:https://vocalremover.org/zh/keybpmfinder 实操步骤: 1. 准备音频素材: 使用干声转换,在软件中分别导入人声干声和伴奏,放在两个轨道上。干声是用来转成 MIDI 做 AI 演唱的。 注意,如果是男歌女唱或者女歌男唱,请在导入前先进行变调后再导入(不会变调的可参考工具推荐)。通常女声比男声高 5 个 key 左右,不绝对,大家根据听感测试调整即可。 2. 干声转换: 在转换之前,先将工程 BPM 设置为与歌曲一致(界面顶部,前面是 BPM 后面是拍数,把 BPM 修改为上述操作获取到的数字),这一步是为了后续微调的时候方便音符对齐节奏。设置完成后,将音频轨道的文件拖入到空白的歌手轨道,即可进行干声转换。 3. 选择歌手:软件左侧有歌手可以选择,长按拖动到歌手轨道的头像处即可切换歌手。
2025-01-18
通过文字生成视频需要使用哪个ai工具
以下是一些可以通过文字生成视频的 AI 工具: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 此外,还有以下根据视频脚本生成短视频的工具: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,用户提供文本描述,Pictory 帮助生成相应的视频内容。 4. VEED.IO:提供 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。 5. Runway:AI 视频创作工具,能够将文本转化为风格化的视频内容,适用于多种应用场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。 如果您想用 AI 把小说做成视频,可以参考以下工具和网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址: 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。网址: 以上工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。更多的文生视频的网站可以查看这里: 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-18
怎么做 agent,有什么 coze做 agent 的视频教程
以下是一些关于如何做 Agent 以及相关的 Coze 视频教程: 基础教程: 大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库 (https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb) 大聪明:保姆级教程:Coze 打工你躺平 (https://waytoagi.feishu.cn/wiki/PQoUwXwpvi2ex7kJOrIcnQTCnYb) 安仔:Coze 全方位入门剖析 免费打造自己的 AI Agent (https://waytoagi.feishu.cn/wiki/SaCFwcw9xi2qcrkmSxscxTxLnxb) 基础教程:Coze“图像流”抢先体验 (https://waytoagi.feishu.cn/wiki/AHs2whOS2izNJakGA1NcD5BEnuf) YoYo:Coze 图像流小技巧:探索视觉艺术的隐藏宝藏 (https://waytoagi.feishu.cn/wiki/CTajwJnyZizxlJk8a4AcJYywnfe) 【智能体】让 Coze 智能体机器人连上微信和微信群详细配置文档 (https://waytoagi.feishu.cn/wiki/ExHMwCDZ7i6NA7knCWucFvFvnvJ) 历史活动教程: 5 月 7 号():大聪明分享|主题:Agent 的前世今生,每个分享人分享最初是怎么接触 Coze 的,以及现在用 Coze 做什么 5 月 8 号():大圣分享|主题:我眼中的 AI Agent 以及通过搭建知识库实例入门 Coze 5 月 9 号():艾木分享|主题:Agent 系统的核心构成:Workflow 和 Multiagent Flow(以“Dr.Know”和“卧底”为例,线上答疑 5 月 10 号():罗文分享|主题:一个方法解锁 COEZ 所有插件的用法+如何自动化解锁每天抓取 X 内容+改写+发布到飞书 5 月 11 号():Itao 分享|主题:和 AI 成为搭子,线上答疑
2025-01-18
有哪些AI视频剪辑工具
以下是一些常见的 AI 视频剪辑工具: Morph Studio:https://app.morphstudio.com/ ,还在内测。 Heygen:https://www.heygen.com/ ,数字人/对口型。 Kaiber:https://kaiber.ai/ 。 Moonvalley:https://moonvalley.ai/ 。 Mootion:https://discord.gg/AapmuVJqxx ,3d 人物动作转视频。 美图旗下:https://www.miraclevision.com/ 。 Neverends:https://neverends.life/create ,操作傻瓜。 SD:Animatediff SVD deforum ,自己部署。 Leiapix:https://www.leiapix.com/ ,可以把一张照片转动态。 Krea:https://www.krea.ai/ 。 Opusclip:https://www.opus.pro/ ,利用长视频剪成短视频。 Raskai:https://zh.rask.ai/ ,短视频素材直接翻译至多语种。 invideoAI:https://invideo.io/make/aivideogenerator/ ,输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。 descript:https://www.descript.com/?ref=feizhuke.com 。 veed.io:https://www.veed.io/ ,自动翻译自动字幕。 clipchamp:https://app.clipchamp.com/ 。 typeframes:https://www.revid.ai/?ref=aibot.cn 。 此外,剪映在视频剪辑方面有很多人性化设计和简单的音效库/小特效,但无法协同工作和导出工程文件。剪辑流程通常包括视频粗剪、视频定剪、音效/音乐、特效、包装(如字幕)等步骤。 还有一些相关的教程: 以下几个工具也值得关注: Opusclip:利用长视频剪成短视频。 Raskai:短视频素材直接翻译至多语种。 invideoAI:输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。 descript:屏幕/播客录制>PPT 方式做视频。 veed.io:自动翻译自动字幕。 clipchamp:微软的 AI 版剪映。 typeframes:类似 invideoAI,内容呈现文本主体比重更多。 google vids:一口大饼。
2025-01-18
制作短视频方面,AI 能帮我做些什么
在制作短视频方面,AI 能为您提供以下帮助: 1. 根据视频脚本生成短视频: ChatGPT + 剪映:ChatGPT 生成视频脚本,剪映根据脚本分析出所需场景、角色、镜头等要素并生成素材和文本框架,实现从文字到画面的快速转化。 PixVerse AI:在线 AI 视频生成工具,支持将多模态输入转化为视频。 Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容。 VEED.IO:提供 AI 图像生成器和 AI 脚本生成器,帮助从图像制作视频并规划内容。 Runway:将文本转化为风格化视频内容,适用于多种场景。 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务。 2. 故事创作与剧本写作: 故事来源:可以是原创,如自身或周围人的经历、做过的梦、想象的故事等;也可以是改编,如经典 IP、名著、新闻、二创等。 剧本写作:编剧有一定门槛,建议先写再看书,不断实践和总结经验。短片创作可从自身或朋友经历改编入手,或对短篇故事进行改编,多与他人讨论修改。 3. 视频制作相关工具: 动画工具:用于在视频中为人脸制作动画的 DiD,用于从文本创建视频的 Runway v2。 语音克隆:ElevenLabs。 需要注意的是,深度伪造是一个问题,这些系统需要合乎道德地使用。同时,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-17
我想做一个猫咪做饭的短视频,有五个分镜头。我先用文生图生成图片,在用图片生成视,最后剪辑在一起。问题是文生图的时候,生成的图片,效果不太理想
以下是为您提供的一些可能有助于改善文生图效果不理想问题的建议: 1. 仔细检查您输入的画面描述,确保描述清晰、具体、准确,包含足够的细节和特征,以便模型更好地理解您的需求。 2. 尝试调整关键词和描述的侧重点,突出您想要的关键元素,比如猫咪做饭的动作、表情、厨房环境等。 3. 更换不同的文生图模型或工具,有些模型可能在某些特定类型的图像生成上表现更出色。 4. 参考其他优秀的类似主题的图像,学习其构图、色彩、光影等方面的处理方式,从而优化您的画面描述。 5. 多次尝试生成,并对每次生成的结果进行分析和总结,找出问题所在,逐步改进描述。
2025-01-17
如何再coze中引导用户输入内容
在 Coze 中引导用户输入内容可以参考以下步骤: 1. 设计一个吐槽心灵鸡汤的应用,允许用户输入心灵鸡汤类内容,AI 生成对应的反心灵鸡汤,并展示在前端页面。应用体验地址为:https://www.coze.cn/s/iDGHwn8t/ 核心操作流程: 用户在页面输入指定文本。 用户在页面点击【开喝】按钮。 Coze 后台调用工作流生成对应内容。 工作流生成的内容展示在前端界面内。 核心前端设计: 用户界面提供一个元素 A(Coze 中称作组件),让用户输入内容。 用户界面提供一个按钮 A,让用户点击后调用工作流。 用户界面提供一个元素 B,向用户展示工作流的结果。 核心业务逻辑: 读取元素 A 的用户输入。 将用户输入传递给 AI 大模型。 AI 大模型按照提示词设定生成指定内容。 在元素 B 展示 AI 大模型生成的内容。基于上述业务逻辑,只需要设计一个简单的工作流即可。该工作流由【开始】节点(用户输入)、【大模型】节点(AI 生成内容)、【结束】节点构成(内容输出)。 2. 搭建选择内容推荐流,用于根据用户输入的“想看 xxx 内容”,在稍后读存储地址(飞书多维表格)中,检索现有的收藏记录,匹配符合阅读兴趣的内容记录。 新建工作流「recommendRead」,根据弹窗要求自定义工作流信息。 工作流全局流程设置: 4.1 开始节点:收到用户输入的“想看 xxx 内容”这类指令就开始流程,不需要额外配置(至于如何判断哪些用户输入是在交代想阅读的内容主题,交由外层 bot 的大模型判断)。 4.2 变量节点:引入 bot 变量中保存的飞书多维表格地址,添加变量节点。 4.3 插件节点:添加「飞书多维表格search_records」插件,只需要设置{{app_token}}参数,在{{app_token}}引用变量节点的{{app_token}},输出结果的{{items}}里会返回需要的查询结果,也可以通过额外的配置定向检索状态为“仅记录(即未读状态)”的收藏记录。 4.4 大模型节点:为了处理的稳定性,这一步采用批处理,对检索出来的收藏记录逐个进行相关性匹配。可以继续优化提示词以提升匹配的精准度。
2025-01-09
在coze工作流中,怎样利用下一个代码节点合并前两个代码节点的输出,并以正确的格式输入传入飞书多维表格插件节点
在 Coze 工作流中利用下一个代码节点合并前两个代码节点的输出并以正确格式传入飞书多维表格插件节点的步骤如下: 1. 搭建整理入库工作流: 3.4 大模型节点:提取稍后读元数据。根据对稍后读阅读清单的元数据期望设置大模型节点,使用 MiniMax 6.5s 245k,设置最大回复长度至 50000 以完整解析长内容网页,用户提示词需相应设置。 3.5 日期转时间戳。后续的飞书多维表格插件节点在入库日期字段时只支持 13 位时间戳,需使用「日期转时间戳time_stamp_13」插件进行格式转化,具体设置明确。 3.6 大模型节点:把稍后读元数据转换为飞书多维表格插件可用的格式。飞书多维表格插件目前(2024 年 08 月)只支持带有转义符的 string,以 Array<Object>格式输入,所以要将之前得到的元数据数组进行格式转换,大模型节点配置及用户提示词需相应设置。 3.7 插件节点:将元数据写入飞书表格。添加「飞书多维表格add_records」插件,设置{{app_token}}与{{records}}参数。 3.8 结束节点:返回入库结果。「飞书多维表格add_records」插件会返回入库结果,直接引用该信息用于通知外层 bot 工作流的入库是否成功。 2. 搭建选择内容推荐流: 4.1 开始节点:输入想阅读的内容主题。收到用户输入的“想看 xxx 内容”这类指令开始流程,无需额外配置。 4.2 变量节点:引入 bot 变量中保存的飞书多维表格地址,添加变量节点并设置。 4.3 插件节点:从飞书多维表格查询收藏记录。添加「飞书多维表格search_records」插件,设置{{app_token}}参数,并在{{app_token}}引用变量节点的{{app_token}},输出结果的{{items}}里会返回需要的查询结果,也可在这一步定向检索未读状态的收藏记录。 4.4 大模型节点:匹配相关内容。为处理稳定采用批处理,对检索出来的收藏记录逐个进行相关性匹配,用户提示词可优化以提升匹配精准度。 搭到这里,别忘了对整个工作流进行测试。
2025-01-09
可否输入一次同时使用多个人工智能
360 于 8 月 1 日发布了集合国内 16 家主流模型的 AI 助手。用户可以通过其桌面客户端和浏览器等多个入口随时唤起,支持在同一问题上同时使用多个模型进行解答。当用户不确定选择哪个模型时,AI 助手会通过意图识别自动选择模型。您可以体验一下:https://bot.360.com
2025-01-05
🚀接着上期SOP+AI:打造职场高效能人士的秘密武器的分享,今天继续聊聊SOP+AI的应用,🎯今天的主题是“怎样利用AI节约10倍内容创作时间?”📚最近跟团队有开始运营小红书账号,就想着先给自己打造点顺手的工具,于是乎「小红书文案专家」就出生啦~🎉[heading1]一、先介绍下我们小Bot[content]🛺BOT名称:小红书文案专家功能价值:见过多个爆款文案长啥样,只需输入一个网页链接或视频链接,就能生成对应的小红书文案,可以辅助创作者生成可以一键复制发布的初稿,提供创意和内容,1
以下是关于“SOP+AI”的相关内容: 怎样利用 AI 节约 10 倍内容创作时间? 最近团队开始运营小红书账号,于是打造了“小红书文案专家”。 BOT 名称:小红书文案专家 功能价值:见过多个爆款文案,输入网页或视频链接就能生成对应的小红书文案,辅助创作者生成可一键复制发布的初稿,提供创意和内容,节约 10 倍文字内容创作时间。 应用链接:https://www.coze.cn/s/ij5C6LWd/ 设计思路: 痛点:个人时间有限,希望有人写初稿并生成配图。 实现思路:为自己和团队设计工作流,让 AI 按运营思路和流程工作。 一期产品功能: 1. 提取任何链接中的标题和内容。 2. 按小红书平台文案风格重新整理内容。 3. 加入 emoji 表情包,使文案更有活力。 4. 为文案配图片。 二期计划功能:持续优化升级,增加全网搜索热点功能,提炼热点新闻或事件关键信息,结合用户想要生成的内容方向输出文案和配图。 SOP+AI:打造职场高效能人士的秘密武器 案例分享:X 公司客服团队引入 SOP 和 AI 助手后,工作效率显著提升。引入 SOP 前,客服工作流程混乱,效率低下,客户满意度不高。引入 SOP 标准化操作后,效率提高。进一步引入 AI 助手,自动回复常见问题、处理简单请求,减少客服工作量,还能及时发现问题帮助优化。结果客服团队工作效率提升 30%以上,客户满意度显著提高。SOP 能提升效率、减少失误、促进协作,借助 AI 助手,SOP 制定和优化更高效智能。
2024-12-20
推荐一个生成bpm系统产品原型图的ai工具,可以实现文字输入,甄别分析后直接生成原型图,并且导入Figma或者Axure可以二次编辑
以下是为您推荐的可生成 BPM 系统产品原型图、用于产品原型设计或绘制示意图的 AI 工具: 1. 即时设计:https://js.design/ 这是一款可在线使用的「专业 UI 设计工具」,为设计师提供更加本土化的功能和服务,相较于其他传统设计工具,更注重云端文件管理、团队协作,并将设计工具与更多平台整合,一站搞定全流程工作。 2. V0.dev:https://v0.dev/ Vercel Labs 推出的 AI 生成式用户界面系统。每个人都能通过文本或图像生成代码化的用户界面。它基于 Shadcn UI 和 Tailwind CSS 生成复制粘贴友好的 React 代码。 3. Wix:https://wix.com/ Wix 是一款用户友好的 AI 工具,可让您在没有任何编码知识的情况下轻松创建和自定义自己的网站,提供广泛的模板和设计供您选择,以及移动优化和集成电子商务功能等功能。Wix 建站工具通过拖放编辑、优秀模板和 250 多种 app,能帮助不同领域的用户创建所有种类的网站。 4. Dora:https://www.dora.run/ 使用 Dora AI,可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。支持文字转网站,生成式 3D 互动,高级 AI 动画。 5. UIzard:是一个利用 AI 技术生成用户界面的工具,它可以根据设计师提供的信息快速生成 UI 设计。 6. Figma:是一个基于云的设计工具,它提供了自动布局和组件库,可以帮助团队快速协作并迭代产品设计。Figma 的社区也开发了一些 AI 插件,用于增强设计流程。 7. Sketch:是另一款流行的矢量图形设计工具,它提供了插件系统,其中一些插件利用 AI 技术来辅助设计工作,例如自动生成设计元素等。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-17
推荐一个生成bpm系统产品原型图的so工具,可以实现文字输入,甄别分析后直接生成原型图,并且导入Figma或者Axure)
目前暂时没有完全符合您需求的直接生成 BPM 系统产品原型图,并能实现文字输入、甄别分析后直接生成原型图且导入 Figma 或者 Axure 的工具。但您可以关注一些相关领域的发展动态,比如 Mockplus、Adobe XD 等工具,它们在原型设计方面具有一定的优势,或许未来会推出满足您需求的功能。
2024-12-17
免费生成数字人
以下为免费生成数字人的几种方法: 1. 剪映生成数字人: 在剪映右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择后软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中。左下角会提示渲染完成时间,完成后可点击预览查看效果。 为让视频更美观,可增加背景图片。先删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”选择本地图片上传,将图片添加到视频轨道上,可通过拖拽轨道右侧竖线使其与视频对齐,选中轨道后可调整背景图尺寸和数字人位置。 2. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片,上传后效果在My Avatar处显示,点开大图后点击Create with AI Studio进入数字人制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击Submit得到数字人视频。 3. DID: 优点:制作简单,人物灵活。 缺点:免费版下载后有水印。 使用方法:点击网址,点击右上角Create vedio,选择人物形象,可点击ADD添加照片或使用给出的人物形象,配音时可选择提供文字选择音色或直接上传音频,最后点击Generate vedio生成视频,打开生成的视频可下载或分享。 4. KreadoAI: 优点:免费,功能齐全。 缺点:音色很AI。 使用方法:点击网址注册后获得120免费k币,选择“照片数字人口播”功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮,点击背景添加背景图,最后点击生成视频。 5. 剪映数字人“个性化”: 尽管剪映已有很多公模数字人,但私模数字人更受欢迎。可使用AI换脸软件完成最后一步。 注意:需要谷歌账号(淘宝或者在“”购买)。 步骤: 第一步打开谷歌浏览器,点击链接https://github.com/facefusion/facefusioncolab 并点击open colab进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,点击红框对应的URL打开操作界面。 第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 第三步:等待专属数字人视频出炉。 有关数字人使用上的问题,欢迎在底部评论区留言交流。对数字人课程感兴趣,欢迎查看通往AGI之路X AI沃茨的《克隆你自己》课程。在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0 。
2025-01-18
图片生成文案的ai
AI 拍立得是一种为简化操作、提升效率而产生的概念,即拍即得,操作更直观高效。 在线体验方面,其名称为 Pailido,微信小程序可搜索使用,能丰富场景自由切换,快速生成闲鱼文案、外卖或大众点评等。 交互逻辑上,用户选择拍摄场景类型并拍照,AI 会自动识别和分析照片内容信息,依据预设场景规则迅速生成符合情境的反馈,避免繁琐额外操作。 实现场景包括: 1. 图片转成文本:用户上传图片后,大模型根据选择的场景生成相关文字描述或解说文本,核心在于图片理解和文本整理润色,可应用于生成美食点评、朋友圈发布文案、闲鱼上架示例模版等场景。 2. 图片转绘图片:用户上传图片后,大模型按照指定风格快速生成图像的转绘版本,适应不同风格和场景需求,如图片粘土风、图片积木风、图片像素风等。 此外,相关课程中还介绍了 AI 拍立得的概念起源及底层逻辑、小程序功能演示、图像流与工作流结合、添加 OCR 到工作流程并结合大模型生成文案标题和文案,以及用户提示词的写法等内容。
2025-01-18
现在页面UI生成有好用的AI辅助思路么
以下是关于页面 UI 生成的一些好用的 AI 辅助思路: 1. 使用 Midjourney 生成 UI 界面:如果想指定生成某个页面(如首页、登录页等),只需添加一段页面指令描述,例如“landing page”“Profile Page”等。通过一系列操作,会发现 Midjourney 产出的设计图视觉效果不错,适合在 APP 设计的初始阶段,如头脑风暴和风格探索中为设计师提供灵感和创意。但目前要直接用于开发仍有距离。 2. 推荐的网页原型图生成工具: 即时设计:https://js.design/ ,是可在线使用的“专业 UI 设计工具”,更注重云端文件管理、团队协作等。 V0.dev:https://v0.dev/ ,Vercel Labs 推出的 AI 生成式用户界面系统,能通过文本或图像生成代码化的用户界面。 Wix:https://wix.com/ ,用户友好的 AI 工具,无需编码知识即可创建和自定义网站,提供多种模板和设计选择。 Dora:https://www.dora.run/ ,使用 Dora AI 可通过一个 prompt 借助 AI 3D 动画生成强大网站。 3. 案例教程:在开发游戏时,让 AI 生成羊、狼、锤子、栅栏、胜利图片、失败图片等元素,其中部分元素生成较顺利,部分需多次尝试。生成的 HTML 代码简洁,CSS 结构不错但部分定位模式需调整。个人感觉 AI 生成的东西不能完全信任,仍需人工调整,学习和请教专家也是必要的。
2025-01-18
现在页面UI生成有好用的AI辅助思路么
以下是关于页面 UI 生成的一些好用的 AI 辅助思路: 1. 使用 Midjourney 生成 UI 界面:如果想指定生成某个页面(如首页、登录页等),只需添加页面指令描述,如“landing page”“Profile Page”等。通过一系列操作,其产出的设计图视觉效果不错,适合在 APP 设计的初始阶段,如头脑风暴和风格探索中为设计师提供灵感和创意。 2. 推荐的网页原型图生成工具: 即时设计:https://js.design/ ,是一款可在线使用的“专业 UI 设计工具”,更注重云端文件管理、团队协作等。 V0.dev:https://v0.dev/ ,Vercel Labs 推出的 AI 生成式用户界面系统,能通过文本或图像生成代码化的用户界面。 Wix:https://wix.com/ ,用户友好的 AI 工具,可在无编码知识的情况下创建和自定义网站,提供多种模板和设计选择等功能。 Dora:https://www.dora.run/ ,使用 Dora AI 可通过一个 prompt 借助 AI 3D 动画生成强大网站,支持文字转网站、生成式 3D 互动、高级 AI 动画。 3. 案例教程:在开发游戏的过程中,让 AI 生成羊、狼、锤子、栅栏、胜利图片、失败图片等元素,其中部分元素生成效果较好,部分需要多次生成和调整。生成的 HTML 代码简洁符合期待,但 CSS 结构的 position 定位模式可能不对,需要人工修改。个人感觉 AI 生成的东西不能完全信任,仍需要人工调整和学习。
2025-01-18
有没有好用的根据已有图片生成新图片的工具
以下是一些好用的根据已有图片生成新图片的工具: 1. 悠船: 通过网页最下方的输入框输入提示词按回车键开始创作图片。生成的图片可在开始想象页面中找到并查看大图。 在开始想象页面能对图片进行变体操作,编辑面板有高清、重塑、延展、扩图、局部重绘等工具来优化图片和进行实验性创作。 可在设置面板调整图像的长宽比、风格化、怪异化和多样化等参数,以及模型版本和生成速度。 能使用现有图片作为创作灵感,网站上的图片可直接拖放到输入框对应位置,站外图片可点击输入框的“+”上传或直接粘贴。 了解更多使用参考图片的信息可查看官网页面。 2. Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感,丰富创作过程。 3. Retrato:AI 工具,将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 4. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 5. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果很好。 这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出,但仍存在一些局限,如偶尔性能不稳定、生成内容不当等问题。
2025-01-17