Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

现在我想通过一段描述生成一段视频,那么我现在用哪一个?工具是最好的呢。我想说的是现在因为在国内访问不了国外的网站,那么国内有没有哪些应用比较功能强大的是视频生成工具。

Answer

以下是一些在国内可用且功能强大的视频生成工具:

  1. VIGGLE:可以直接通过文字描述让任何静态图动起来,能做各种动作,如跳舞等。其核心技术基于 JST-1 模型,能理解真实世界的物理运动原理,生成的视频很真实,还能直接文字生成视频,进行各种角色混合和动作替换。核心功能包括可控制的视频生成、基于物理的动画、3D 角色和场景创建。
  2. Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。
  3. SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。
  4. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。
  5. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。
  6. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。

此外,还有以下根据视频脚本生成短视频的工具:

  1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。
  2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。
  3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,用户提供文本描述即可生成相应的视频内容。
  4. VEED.IO:提供了 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。
  5. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。

这些工具各有特点,适用于不同的应用场景和需求,您可以根据自己的具体情况进行选择。需要注意的是,内容由 AI 大模型生成,请仔细甄别。

Content generated by AI large model, please carefully verify (powered by aily)

References

视频工具:VIGGLE

[小互](https://x.com/imxiaohu):https://x.com/imxiaohu/status/1771173928591093940兄弟们,又出来个牛P玩意阿里那个被截胡了,这个直接能用可以直接通过文字描述让任何静态图动起来,而且能做各种动作,跳舞什么的都是小case...最牛P的是,他们的模型能能理解真实世界的物理运动原理,所以出来的视频很真实。不仅如此,它还能直接文字生成视频,进行各种角色混合和动作替换...其核心技术基于JST-1模型。JST-1是首个具有实际物理理解能力的视频-3D基础模型,能够根据用户的需求,让任何角色按照指定的方式进行运动。核心功能:1、可控制的视频生成:用户可以通过文字描述指定角色的动作和场景的细节,Viggle将根据这些指示生成视频。2、基于物理的动画:JST-1模型的一个显著特点是其对物理原理的理解,这意味着生成的视频不仅看起来真实,而且角色的动作和互动符合实际物理规律。这提高了视频的质量和真实感。3、3D角色和场景创建:Viggle不仅限于传统的2D视频制作,它还能够创建3D角色和场景。

问:文字生成视频的 AI 产品有哪些?

"文生视频"通常指的是使用人工智能技术将文本内容转换成视频的服务。以下是一些国内外提供此类功能的产品推荐:1.Pika:这是一款非常出色的文本生成视频AI工具,擅长动画制作,并支持视频编辑。2.SVD:如果你熟悉Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由Stability AI开源的video model。3.Runway:这是一款老牌AI视频生成工具,提供实时涂抹修改视频的功能,不过需要注意的是,Runway是收费的。4.Kaiber:这是一款视频转视频AI,能够将原视频转换成各种风格的视频。5.Sora:由OpenAI开发,可以生成长达1分钟以上的视频。以上工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。另外,更多的文生视频的网站可以查看这里:[https://www.waytoagi.com/category/38](https://www.waytoagi.com/category/38)内容由AI大模型生成,请仔细甄别。

问:根据视频脚本生成短视频的工具

根据视频脚本生成短视频的AI工具有多种,它们能够帮助用户将文字脚本转化为具有视觉吸引力的视频内容。以下是一些工具:1.[ChatGPT](https://chat.openai.com/)+[剪映](https://www.capcut.cn/):ChatGPT可以生成视频小说脚本,而剪映则可以根据这些脚本自动分析出视频中需要的场景、角色、镜头等要素,并生成对应的素材和文本框架。这种方法可以快速实现从文字到画面的转化,节省大量时间和精力。2.[PixVerse AI](https://pixverse.ai/):在线AI视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。3.[Pictory](https://pictory.ai/):这是一个AI视频生成器,允许用户轻松创建和编辑高质量视频,无需视频编辑或设计经验。用户可以提供文本描述,Pictory将帮助生成相应的视频内容。4.[VEED.IO](https://www.veed.io/):提供了AI图像生成器和AI脚本生成器,帮助用户从图像制作视频,并规划从开场到结尾的内容。5.[Runway](https://runwayml.com/)[](https://runwayml.com/):这是一个AI视频创作工具,它能够将文本转化为风格化的视频内容,适用于多种应用场景。6.[艺映AI](https://www.artink.art/):专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,用户可以根据文本脚本生成视频。这些工具各有特点,适用于不同的应用场景和需求,能够帮助内容创作者、教育工作者、企业和个人快速生成吸引人的视频内容。内容由AI大模型生成,请仔细甄别。

Others are asking
ai视频
以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总: 4 月 11 日: Pika 上线 Pika Twists 能力,可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中,结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术,可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术,实现从单张图片快速生成超逼真的 3D 头像,在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage,通过图片生成可自由拼装 3D 场景,再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型,无缝支持各种视频生成任务(文本/图像/视频到视频)。 4 月 9 日: ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下,可生成完整的 1 分钟视频。 4 月 14 日: 字节发布一款经济高效的视频生成基础模型 Seaweed7B。 可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。
2025-04-20
ai视频教学
以下是为您提供的 AI 视频教学相关内容: 1. 第一节回放 AI 编程从入门到精通: 课程安排:19、20、22 和 28 号四天进行 AI 编程教学,周五晚上穿插 AI 视频教学。 视频预告:周五晚上邀请小龙问露露拆解爆火的 AI 视频制作,视频在视频号上有大量转发和播放。 编程工具 tree:整合多种模型,可免费无限量试用,下载需科学上网,Mac 可拖到文件夹安装,推荐注册 GitHub 账号用于代码存储和发布,主界面分为工具区、AI 干活区、右侧功能区等。 网络不稳定处理:网络不稳定时尝试更换节点。 项目克隆与文件夹:每个项目通过在本地新建文件夹来区分,项目运行一轮一轮进行,可新建会话,终端可重开。 GitHub 仓库创建:仓库相当于本地项目,可新建,新建后有地址,可通过多种方式上传。 Python 环境安装:为方便安装提供了安装包,安装时要选特定选项,安装后通过命令确认。 代码生成与修改:在 tree 中输入需求生成代码,可对生成的代码提出修改要求,如添加滑动条、雪花形状、颜色等,修改后审查并接受。 2. AI 视频提示词库: 神秘风 Arcane:Prompt:a robot is walking through a destroyed city,,League of Legends style,game modelling 乐高 Lego:Prompt:a robot is walking through a destroyed city,,lego movie style,bright colours,block building style 模糊背景 Blur Background:Prompt:a robot is walking through a destroyed city,,emphasis on foreground elements,sharp focus,soft background 宫崎骏 Ghibli:Prompt:a robot is walking through a destroyed city,,Spirited Away,Howl's Moving Castle,dreamy colour palette 蒸汽朋克 Steampunk:Prompt:a robot is walking through a destroyed city,,fantasy,gear decoration,brass metal robotics,3d game 印象派 Impressionism:Prompt:a robot is walking through a destroyed city,,big movements
2025-04-20
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
需要做一个自动化出视频的工作流
以下是一个关于自动化出视频工作流的详细介绍: 优势: 全自动化处理,解放双手。 40 秒快速出片,效率提升。 成本低廉,每条仅需 0.0x 元。 输出质量稳定专业。 DeepseekR1 保证文案质量。 还能改进,例如可以加入配套 BGM,让视频更有感染力;增加更丰富的画面内容和转场效果;使用免费节点替代付费插件,进一步降低成本;优化模板样式,支持更多展示形式;增加自动化程度,支持批量处理。 工作流程: 1. 可以在扣子商店体验,建议自己搭建。 2. 工作流调试完成后,加入到智能体中,可以选择工作流绑定卡片数据,智能体则通过卡片回复。 3. 选择发布渠道,重点如飞书多维表格,填写上架信息(为了快速审核,选择仅自己可用),确认发布等待审核,审核通过后即可在多维表格中使用。 4. 创建飞书多维表格,添加相关字段,配置选择“自动更新”,输入相关字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 5. 表单分享,实现“填写表单,自动创建文案短视频”的效果。 6. 全自动视频合成使用多视频融合插件,一键导出成品。但需注意节点产生的视频是异步生成,可能无法马上展现,需耐心等待几秒。 如果您还有其他疑问或需要进一步的帮助,请随时联系。
2025-04-14
新手怎么学习AI 做视频
对于新手学习 AI 做视频,以下是一些建议和指导: 一、了解 AI 视频的应用和价值 AI 视频能应用于多个领域,具有多种用途,例如: 1. 创意广告与营销:快速生成吸引眼球的短视频,降低成本,提高效率。 2. 社交媒体内容:制作独特的动态视觉效果,让帖子更出众。 3. 电商展示:生成商品展示视频或 3D 效果,生动呈现产品特性。 4. 数字人解说:借助数字人技术生成虚拟主播或形象来解说内容。 5. 个性化动画与故事:将想法变成生动的动画短片。 6. 教育与演示:生成解释性视频或动态图表,让信息更直观。 7. 艺术创作与实验:探索新的视觉表达方式。 8. 乐趣与分享:快速制作好玩的视频。 变现方式包括: 1. 接单制作商业广告、社交媒体视频。 2. 成为自由职业者,提供 AI 视频制作服务。 3. 创作自己的 IP 内容,通过流量或平台分成赚钱。 4. 开发相关教程或咨询服务。 二、学习制作流程 如果想用 AI 把小说做成视频,大致流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-04-14
生成提示词的提示词
以下是关于生成提示词的相关内容: 生成提示词的思路和方法: 可以根据效果好的图片中的高频提示词去反推效果,结合不同字体效果的描述,打包到一组提示词中。提示词给到 AI 后,AI 会根据给定文字的文义,判断适合的情绪风格,然后给出适合情绪的字体和风格描述、情感氛围等,加上一些质量/品质词,形成输出提示词结构。为了让 AI 更能描述清晰风格,可以先给定多种参照举例。 具体操作步骤: 打开 AI 工具的对话框,将相关提示词完整复制粘贴到对话框。推荐使用 ChatGPT 4o。 当 AI 回复后,发送您想要设计的文字。可以仅发送想要的文字,也可以发送图片(适合有多模态的 AI)让 AI 识别和反推。 将 AI 回复的提示词部分的内容复制到即梦 AI。 对生成提示词的一些观点: 提示词生成提示词并非必要,不一定能生成最好的 Prompt 框架,修改过程可能耗时且不一定能修改好,不如花钱找人写。 一句话生成完整符合需求的 Prompt 非常困难,只能大概给出框架和构思,需要更低成本地调整需求和修改 Prompt。 不同生图工具生成提示词的特点: 即使是简短的描述,生成的提示词也非常细节、专业。 会解析需求,找出核心要点和潜在的诠释点,并给出不同的提示词方案。 提示词构建更多在于增强,而不是发散,生成的内容更符合期望。 同时生成中、英双版本,国内外工具通用无压力。 14 款 AI 生图工具实测对比: 本次实测用到的工具包括国内版的即梦 3.0(https://jimeng.jianying.com/aitool/home)、WHEE(https://www.whee.com)、豆包(https://www.doubao.com/chat)、可灵(https://app.klingai.com/cn/texttoimage/new)、通义万相(https://tongyi.aliyun.com/wanxiang/creation)、星流(https://www.xingliu.art)、LibiblibAI(https://www.liblib.art),以及国外版的相关工具。
2025-04-20
有没有能根据描述,生成对应的word模板的ai
目前有一些可以根据描述生成特定内容的 AI 应用和方法。例如: 在法律领域,您可以提供【案情描述】,按照给定的法律意见书模板生成法律意见书。例如针对商业贿赂等刑事案件,模拟不同辩护策略下的量刑结果,对比并推荐最佳辩护策略,或者为商业合同纠纷案件设计诉讼策略等。 在 AI 视频生成方面,有结构化的提示词模板,包括镜头语言(景别、运动、节奏等)、主体强化(动态描述、反常组合等)、细节层次(近景、中景、远景等)、背景氛围(超现实天气、空间异常等),以及增强电影感的技巧(加入时间变化、强调物理规则、设计视觉焦点转移等)。 一泽 Eze 提出的样例驱动的渐进式引导法,可利用 AI 高效设计提示词生成预期内容。先评估样例,与 AI 对话让其理解需求,提炼初始模板,通过多轮反馈直至达到预期,再用例测试看 AI 是否真正理解。 但需要注意的是,不同的场景和需求可能需要对提示词和模板进行针对性的调整和优化,以获得更符合期望的 word 模板。
2025-04-18
如何自动生成文案
以下是几种自动生成文案的方法: 1. 基于其它博主开源的视频生成工作流进行优化: 功能:通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 涉及工具:Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。 大体路径:通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频;发布 coze 智能体到飞书多维表格;在多维表格中使用字段捷径,引用该智能体;在多维表格中创建自动化流程,推送消息给指定飞书用户。 2. 生成有趣的《图文短句》: 实现原理: 先看工作流:包括第一个大模型生成标题、通过“代码节点”从多个标题中获取其中一个(可略过)、通过选出的标题生成简介、通过简介生成和标题生成文案、将文案进行归纳总结、将归纳总结后的文案描述传递给图像流。 再看图像流:包括提示词优化、典型的文生图。 最终的 Bot 制作以及预览和调试。 3. 腾讯运营使用 ChatGPT 生成文案: 步骤:通过 ChatGPT 生成文案,将这些文案复制到支持 AI 文字转视频的工具内,从而实现短视频的自动生成。市面上一些手机剪辑软件也支持文字转视频,系统匹配的素材不符合要求时可以手动替换。例如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类 AI 视频制作工具让普罗大众生产视频变得更轻松上手。
2025-04-15
如何通过输入一些观点,生成精彩的口播文案
以下是通过输入观点生成精彩口播文案的方法: 1. 基于其它博主开源的视频生成工作流进行功能优化,实现视频全自动创建。 效果展示:可查看。 功能:通过表单输入主题观点,提交后自动创建文案短视频,并将创建完成的视频链接推送至飞书消息。 涉及工具:Coze平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程)。 大体路径: 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 发布 coze 智能体到飞书多维表格。 在多维表格中使用字段捷径,引用该智能体。 在多维表格中创建自动化流程,推送消息给指定飞书用户。 2. 智能体发布到飞书多维表格: 工作流调试完成后,加入到智能体中,可以选择工作流绑定卡片数据,智能体则通过卡片回复。 选择发布渠道,重点是飞书多维表格,填写上架信息(为快速审核,选择仅自己可用),等待审核通过后即可在多维表格中使用。 3. 多维表格的字段捷径使用: 创建飞书多维表格,添加相关字段,配置后使用字段捷径功能,使用自己创建的 Coze 智能体。 表单分享,实现填写表单自动创建文案短视频的效果。 4. 自动化推送:点击多维表格右上角的“自动化”,创建所需的自动化流程。 另外,伊登的最新 Deepseek+coze 实现新闻播报自动化工作流如下: 第一步是内容获取,只需输入新闻链接,系统自动提取核心内容。开始节点入参包括新闻链接和视频合成插件 api_key,添加网页图片链接提取插件,获取网页里的图片,以 1ai.net 的资讯为例,添加图片链接提取节点,提取新闻主图,调整图片格式,利用链接读取节点提取文字内容,使用大模型节点重写新闻成为口播稿子,可使用 Deepseek R1 模型生成有吸引力的口播内容,若想加上自己的特征,可在提示词里添加个性化台词。
2025-04-15
小红书图文批量生成
以下是关于小红书图文批量生成的详细内容: 流量密码!小红书万赞英语视频用扣子一键批量生产,这是一个保姆级教程,小白都能看得懂。 原理分析: 决定搞之后,思考生成这种视频的底层逻辑,进行逆推。这种视频由多张带文字图片和音频合成,带文字图片由文字和图片生成,文字和图片都可由 AI 生成,音频由文字生成,文字来源于图片,也就是说,关键是把图片和文字搞出来。 逻辑理清后,先找好看的模版,未找到好看的视频模版,最后看到一个卡片模版,先把图片搞出来,才有资格继续思考如何把图片变成视频,搞不出来的话,大不了不发视频,先发图片,反正图片在小红书也很火。 拆模版: 要抄这种图片,搞过扣子的第一反应可能是用画板节点 1:1 去撸一个,但扣子的画板节点很难用,Pass 掉。用 PS 不行,太死板不灵活,html 网页代码可以,非常灵活。经过 2 个多小时和 AI 的 battle,用 html 代码把图片搞出来了。这里不讲代码怎么写,直接抄就行。要抄,首先要学会拆,不管用什么方式批量生成这样的图片,都必须搞清楚里面有哪些是可以变化的参数,也就是【变量】,如主题、主题英文、阶段、单词数、图片、正文、翻译、普通单词、重点单词等。 想方法: 大概知道批量生成这样的图片需要搞清楚哪些参数,图片用 html 代码搞出来了。但问题是视频怎么搞,这种视频由多张不同的【带文字的图片】生成,比如读到哪句,哪句就高亮起来,图片也可以随着读到的句子变更。最后,视频就是用这样的图片一张张拼起来的。
2025-04-14
ai如何什么生成表格
AI 生成表格通常可以通过以下技术实现: 1. 利用变分自编码器(VAEs)和序列到序列模型(Seq2Seq)等技术生成表格文件、表格公式,并清理、创建、转换和分析表格中的文本数据,例如表格结构设计、数据分析表、表格自动化等。 2. 借助一些办公软件中的 AI 插件,如飞书中的相关插件,先通过 AI 理解图片中的内容并填充到表格列中,然后利用自带插件总结生成相关指令。 此外,在多模态数据生成中,结构化数据生成包括表格生成,多模态合成数据从大类来看有非结构化数据(图片、视频、语音等)和结构化数据(表格等)两大类。非结构化数据生成包括文本生成、图像生成、音频和语音生成、视频生成、3D 生成、合成数据生成等。
2025-04-14
帮我写一段cursor的user rules,符合前端开发
以下是关于 Cursor 的 User Rules 相关内容,适用于前端开发: Cursor Rules 简单来说是为 Cursor 做角色定位,使其以更专业的角色服务。它允许开发者为 AI 助手设置特定指导原则和行为模式,让 AI 在生成代码、提供建议和响应查询时能更好适应开发者的编码风格和项目需求。 设置通用规则的步骤如下: 1. 点击界面右上角的小齿轮图标。 2. 在 cursor settings 中找到 Rules。 3. 将相关文本拷贝到 User Rules 后,关掉页面即可。 当您从新手阶段进阶,希望进行更专业的 APP 开发、前后端项目时,可以通过以下方式获取更专业的 Cursor Rules: 1. 访问下方的 github 项目:https://github.com/PatrickJS/awesomecursorrules 。 2. 使用 https://cursor.directory/generate ,根据项目重点直接生成。 设置好 Cursor Rules 后,就可以开始创作第一个小作品,比如一个打砖块的小游戏。首先在右侧对话框中输入本次项目的内容(可以非常口语化),使用 claude3.7 模型等待代码生成完毕。可以看到左侧文件夹生成多个文件,中间显示 AI 生成的不少代码,右边是 AI 告知的互动生成内容。点击右下方的 Accept all 使代码生效。若想查看项目效果,直接跟 AI 说“运行项目”,点击 AI 提示的 Run command 会跳转到预览页面。如果玩起来有问题(如操控感不好、不美观),可以让 AI 进一步帮助美化。 另外,在某些情况下,比如导入 cursor 时,需要上传到 github 并下载到本地,在设置里把 user rules 改成“always respond in 中文”,在 terminal 里输入“npm i”“npm run dev”等操作。
2025-03-31
用女生台湾腔,生成一段wav格式的音频"我在,你回来了呀"
很抱歉,目前无法直接为您生成具有女生台湾腔的“我在,你回来了呀”的 wav 格式音频。但您可以通过以下几种方式来实现: 1. 使用一些专业的语音合成软件,如科大讯飞语音合成、百度语音合成等,它们通常提供多种语音风格和腔调的选择,包括台湾腔,您可以输入您想要的文本进行合成,并设置输出为 wav 格式。 2. 在一些在线语音生成平台上寻找相关服务,部分平台可能会满足您的需求。 3. 如果您有一定的音频处理能力,也可以自己录制女生说这句话的声音,然后通过音频编辑软件进行处理和转换为 wav 格式。
2025-03-24
现在我想通过一段描述生成一段视频,那么我现在用哪一个?工具是最好的呢。
以下是一些可用于根据文字描述生成视频的工具: 1. Adobe Firefly:其“生成视频”(测试版)能将书面描述转换为视频剪辑。您可以使用文本提示定义内容、情感和设置,包括摄像机角度,还能合并图像为视频生成提供视觉提示。操作步骤为:在 Adobe Firefly 网站上选择“生成视频”,在 Generate video 页面输入文本提示,也可在图像部分上传图像用于第一帧并提供方向参考,在 General settings 部分确定 aspect ratio 和 frames per second。 2. VIGGLE:其核心技术基于 JST1 模型,能理解真实世界的物理运动原理,生成的视频很真实。核心功能包括可控制的视频生成、基于物理的动画、3D 角色和场景创建。用户可通过文字描述指定角色动作和场景细节来生成视频。 3. Pika:出色的文本生成视频 AI 工具,擅长动画制作,支持视频编辑。 4. SVD:如果熟悉 Stable Diffusion,可安装此最新插件,在图片基础上直接生成视频,是由 Stability AI 开源的 video model。 5. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但收费。 6. Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 7. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 以上工具适用于不同的使用场景和需求,您可以根据自身具体情况选择。更多文生视频的网站可查看:。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-03-23
我现在是学了一段时间的comfyui+flux,接下来准备学Python开发comfyui节点、对接模型,这样学下去方向有没有问题呢
您学习 ComfyUI 和 Flux 一段时间后准备学习 Python 开发 ComfyUI 节点并对接模型,这个方向是可行的。以下是一些相关的知识和要点供您参考: 工作流方面: 工作流节点可直接拖动单个节点到任意位置,也可按住 Control 键并用鼠标左键滑框选中多个节点,再按 Shift 键一起拖动。 选中节点后右键新建组,可修改组名、颜色等,组被覆盖时可直接拖动组。 选中节点后右键选择对齐方式,如顶部对齐、左边对齐等。 第三方节点的安装方式包括在 customer NODE manager 中安装、在 GitHub 上复制链接安装、通过终端输入指令安装、在秋叶启动器的版本管理中安装。 可通过 group by Parser 节点控制组,也可通过按住节点按 control b 跳过或按 control m 终止执行。 模型方面: 噪声强度由种子调节,种子固定噪声分布方式,噪声与 CLIP 无关,增大噪声设置值会增强模型对图片重绘的程度。 模型版本的提示词差异:1.5 以 tag 为主,XL 论文称以自然语言为主,但实际使用中因模型微调情况可能仍需用 tag。 Flux 模型有时生成黑图,可能有修复方案,需自行查询。图像生成结果为空,可能是 VAE 编码器与大模型未连接,调整连接后问题解决。 安装方面: 自动打标 joy_caption 副本的节点安装地址为 D:\\ComfyUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes。 安装步骤包括:(Comfyui evn python.exe)python m pip install rrequirements.txt 或点击 install_req.bat,注意 transformers 版本不能太低。 下载模型或者运行 ComfyUI 自动下载模型到合适文件夹,如从 https://huggingface.co/unsloth/MetaLlama3.18Bbnb4bit 下载并放到 Models/LLM/MetaLlama3.18Bbnb4bit 文件夹内。 新版的 PuLID 解决了模型污染的问题,使用新版的节点需要禁用或者删除之前的 PuLID 节点,不然可能会有冲突问题。模型放在 ComfyUI\\models\\pulid 文件夹里面,注意用新版的。 如果使用 PuLID,还需要安装 EVA CLIP 等模型。
2025-03-21
我想在飞书里面将一段话批量翻译成不同国家的语言 该 怎么做
目前飞书中可能没有直接将一段话批量翻译成不同国家语言的内置功能。但您可以借助一些第三方的翻译工具或软件来实现,比如谷歌翻译、百度翻译等。您将需要翻译的段落复制到这些工具中,然后选择您想要翻译的目标语言进行批量翻译。
2025-03-19
把一段录音转化成文字
以下是将录音转化成文字的几种方法: 1. 办公场景: 可以使用通义听悟、飞书妙记、钉钉闪记来实现录音转文字。以钉钉闪记为例,操作步骤如下: 第一步打开钉钉闪记。 结束录音后点击“智能识别”。 点击智能摘要,就可以获得本次会议的纪要。 如果需要更多内容,复制所有文案或下载文本文件到GPT、GLM、通义千问等大语言模型对话框中,再将会议内容发送。 该场景对应的关键词库包括会议主题、参与人员、讨论议题、关键观点、决策、时间、地点、修改要求、文本格式、语言风格、列表、段落。 提问模板: 第一步:用飞书会议等软件整理好会议记录,并分段式发给 ChatGPT 生成总结:请根据以下会议资料,整理会议的关键信息,包括:会议主题、参与人员、讨论议题、关键观点和决策。会议资料:1、时间:XXX 年 XXX 月 XXX 日;2、地点:XXXX;3、参与人员:XXX、XXX;4、会议主题:XXXX;5、讨论内容:Speaker1:XXX;Speaker2:XXX;Speaker3:XXX。 第二步:检查生成的总结:请根据我提供的会议补充信息和修改要求,对 XXX 部分进行修改。 第三步:优化文本格式和风格:1、请将生成的总结,以 XXX 形式呈现(例如:以列表的形式、以段落的形式、使用正式/非正式的语言风格);2、请给上述会议总结,提供修改意见,并根据这个修改意见做最后的调整。 2. 外语学习场景(雅思口语急速备考): 如果时间充裕,建议把每个 topic 的问题喂给 GPT,让它一道道问您,您回答(可以用苹果自带的录音转文字)。转成文本后差不多能知道自己发音的问题。 然后让 GPT 对您的内容执行 correct 或者 another native answer 两个指令。前者可以基于您的内容做修正,后者是自己完全没思路让它给您弄一个。 之后要归纳,把语料按照教育、工作、购物、科技、消费分成几大类,然后再弄吃、环保、交通、历史几个专题,可以挑最不熟悉、现场水不出来的准备。 3. 教师场景: 7 月 31 日录音可以用通义听悟整理录音笔记,网址为:https://tingwu.aliyun.com ,有智能速览、关键词、保存导出等功能。
2025-03-14
根据简历,模拟面试的工具
以下是一些根据简历进行模拟面试的工具: 1. Kimi 新出的常用语功能中有“【🎤面试模拟】”,它可以作为私人面试 mock 伙伴,根据简历信息和求职岗位进行模拟面试。 2. 通过让 ChatGPT 接入 Siri 可以模拟前端电话面试。具体操作是首先按照特定文章接入,然后在手机上唤起 ChatGPT 版本的 Siri 并设定身份和对话目的,如让其作为一位来面试的前端高级开发工程师,接着依次提问。 3. ChatGPT 可以更高效地辅助复习面试,您可以把问题给到 ChatGPT 让它帮您生成答案,并展示 demo 和解释,帮助您更好地掌握知识。相关文档在线地址:https://xzfeinterview.gitbook.io/feinterview/readme
2025-04-18
作为一个想要使用AI工具提升工作效率的AI小白,我已经学习了怎么编写prompt,接下来我应该学习什么
如果您已经学习了如何编写 prompt ,接下来可以学习以下内容: 1. 理解 Token 限制:形成“当前消耗了多少 Token”的自然体感,把握有效记忆长度,避免在超过限制时得到失忆的回答。同时,编写 Prompt 时要珍惜 Token ,秉承奥卡姆剃刀原理,精简表达,尤其是在连续多轮对话中。 熟练使用中英文切换,若 Prompt 太长可用英文设定并要求中文输出,节省 Token 用于更多对话。 了解自带方法论的英文短语或句子,如“Chain of thought”。 2. 学习精准控制生成式人工智能:重点学习提示词技术,编写更清晰、精确的指令,引导 AI 工具产生所需结果。 探索构建智能体(AI Agents),将工作单元切割开,赋予其特定角色和任务,协同工作提高效率。 在实际应用中遵循准则,如彻底变“懒人”、能动嘴不动手、能让 AI 做的就不自己动手、构建自己的智能体、根据结果反馈调整智能体、定期审视工作流程看哪些部分可用更多 AI 。 3. 若想进一步提升: 学习搭建专业知识库、构建系统知识体系,用于驱动工作和个人爱好创作。 注重个人能力提升,尤其是学习能力和创造能力。 您还可以结合自身生活或工作场景,想一个能简单自动化的场景,如自动给班级孩子起昵称、排版运营文案、安排减脂餐、列学习计划、设计调研问卷等。选一个好上手的提示词框架开启第一次有效编写,比如从基础的“情境:”开始。
2025-04-15
那些ai工具可以world转pdf
以下是一些可以将 Word 转换为 PDF 的 AI 工具: 1. DeepL(网站):点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 内容由 AI 大模型生成,请仔细甄别。
2025-04-15
作图的ai工具
以下是一些常见的作图 AI 工具: 绘制软件架构视图(逻辑视图、功能视图、部署视图)的工具: Lucidchart:流行的在线绘图工具,支持多种图表创建,有拖放界面方便创建架构图。 Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板。 draw.io(diagrams.net):免费在线图表软件,支持多种视图创建。 PlantUML:文本到 UML 转换工具,可通过描述文本生成逻辑视图相关图表。 Gliffy:基于云的绘图工具,支持创建架构图。 Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型。 Rational Rose:IBM 的 UML 工具,支持逻辑视图和部署视图创建。 绘制 CAD 图的工具: CADtools 12:Adobe Illustrator 插件,添加绘图和编辑工具。 Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 nTopology:基于 AI 的设计软件,帮助创建复杂 CAD 模型。 ParaMatters CogniCAD:基于 AI 的 CAD 软件,自动生成 3D 模型。 主流 CAD 软件(如 Autodesk 系列、SolidWorks 等)中的生成设计工具。 此外,Controlnet 的作者 lllyasviel(张吕敏)在 Github 上发布了全新的开源 AI 绘画工具 Fooocus,可像 Stable diffusion WebUI 一样部署到本地免费使用,且有类似 midjourney 的便捷操作界面。
2025-04-15
装修设计可以使用哪些AI工具
以下是一些可用于装修设计的 AI 工具: 1. 酷家乐装修设计软件:利用图像生成和机器学习技术,为用户提供装修设计方案,用户可根据喜好选择和调整。 2. CADtools 12:Adobe Illustrator 插件,为 AI 添加 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 3. Autodesk Fusion 360:集成了 AI 功能的云端 3D CAD/CAM 软件,能创建复杂几何形状和优化设计。 4. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 5. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 6. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供基于 AI 的生成设计工具,可根据输入自动产生多种设计方案。 7. HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster。 8. Maket.ai:面向住宅行业,在户型和室内软装设计方面有探索,能根据输入自动生成户型图。 9. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期引入标准和规范约束生成的设计结果。 10. Fast AI 人工智能审图平台:形成全自动智能审图流程,将建筑全寿命周期内信息集成,实现数据汇总与管理。 但每个工具都有特定应用场景和功能,建议根据具体需求选择合适的工具。
2025-04-15
推荐一些 AI 工具
以下是为您推荐的一些 AI 工具: 辅助编程的 AI 工具: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议。 2. 通义灵码:阿里巴巴团队推出,提供多种编程相关能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型。 5. Cody:Sourcegraph 推出的 AI 代码编写助手,借助强大的代码语义索引和分析能力了解开发者的整个代码库。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供的免费 AI 代码助手。 7. Codeium:由 AI 驱动的编程助手工具,提高编程效率和准确性。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可根据需求选择。 内容仿写的 AI 工具: 1. 秘塔写作猫:https://xiezuocat.com/ ,是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,还能实时同步翻译,支持全文改写等功能,并智能分析文章属性。 2. 笔灵 AI 写作:https://ibiling.cn/ ,是得力的智能写作助手,支持多种写作类型的一键改写/续写/扩写等。 3. 腾讯 Effidit 写作:https://effidit.qq.com/ ,由腾讯 AI Lab 开发的创作助手,提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看这里:https://www.waytoagi.com/sites/category/2 。内容由 AI 大模型生成,请仔细甄别。 与思维导图相关的 AI 工具: 1. GitMind:免费跨平台,可通过 AI 自动生成思维导图,支持多种模式。 2. ProcessOn:国内思维导图+AIGC 的工具,能利用 AI 生成思维导图。 3. AmyMind:轻量级在线,无需注册登录,支持自动生成节点。 4. Xmind Copilot:Xmind 推出的基于 GPT 的 AI 思维导图助手,可一键拓展思路,生成文章大纲。 5. TreeMind:“AI 人工智能”思维导图工具,可输入需求由 AI 自动完成思维导图生成。 6. EdrawMind:提供一系列 AI 工具,包括 AI 驱动的头脑风暴功能。 这些 AI 思维导图工具都能通过 AI 技术自动生成思维导图,提高制作效率,为知识工作者带来便利。内容由 AI 大模型生成,请仔细甄别。
2025-04-14