Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

目前有哪些免费可用的 AI视频生成软件

Answer

以下是一些免费可用的 AI 视频生成软件:

  1. Haiper:有免费额度,网址为 https://haiper.ai/ 。支持文生视频、图生视频、素描生视频、扩展视频,能生成 HD 超高清的视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值。图生视频只能写提示词、秒数(2s 和 4s)。还支持视频重绘,包括局部重绘。
  2. DynamiCrafter:免费,网址为 https://huggingface.co/spaces/Doubiiu/DynamiCrafter 及 https://github.com/Doubiiu/DynamiCrafter?tab=readme-ov-file ,可生成 2 秒图生视频,还能做短视频拼长视频。
  3. Morph studio:处于内测阶段,网址为 https://app.morphstudio.com/ 。暂未对外开放,可在官网提交内测申请。在 discord 上可以免费体验,支持文生视频、图生视频,英文提示词,支持运镜、运动强度、尺寸、秒数设置,默认生成 3s 视频。

此外,清影也是一款不错的 AI 视频生成工具,在首发测试期间所有用户均可免费使用。它具有不限量使用、生成速度快、提供配乐小功能等特色。生成参数包括时长 6s、清晰度 1440x960(3:2)、帧率 16fps 等,在风景、动物、超现实、人文历史类需求以及皮克斯风格、卡通风格、摄影风格、动漫风格等方面表现突出。

截至 2023 年,我们已经发现了 21 个公开的人工智能视频生成工具,大多数起初以 Discord 机器人的形式存在,随着产品成熟,越来越多的工具开始建立自己的网站甚至开发移动应用。

Content generated by AI large model, please carefully verify (powered by aily)

References

小歪:AI视频工具合集

https://haiper.ai/文生视频、图生视频、素描生视频、扩展视频,能生成HD超高清的视频文生视频支持选择风格、秒数(2s和4s)、种子值文生视频不同风格展示[AI视频提示词库](https://waytoagi.feishu.cn/wiki/FPLTwMwsxiXC0kkfcmncqI2XnDh?table=tblHfIXQT9G4fiNR&view=vewItBc7AK)图生视频只能写提示词、秒数(2s和4s)、种子值视频重绘,轻松修改颜色、纹理和元素以改变原视频的视觉内容。局部重绘是使用点选的方式,选中需要重绘的区域,再输入需要替换的内容提示词,如果是大量背景的重绘,效果一般,视频容易崩。相关界面截图:[heading3]DynamiCrafter(免费)[content]https://huggingface.co/spaces/Doubiiu/DynamiCrafterhttps://github.com/Doubiiu/DynamiCrafter?tab=readme-ov-file2秒图生视频,还可以做短视频拼长视频[heading3]Morph studio(内测)[content]https://app.morphstudio.com/知识库详细教程:[工具教程:morphstudio](https://waytoagi.feishu.cn/wiki/LkN4wiFaJiklVHkDG4Ec5nZpnLb)暂未对外开放,可在官网提交内测申请discord上可以免费体验支持文生视频、图生视频,英文提示词,支持运镜、运动强度、尺寸、秒数设置默认生成3s视频使用参数说明

工具教程:清影

生成参数:时长:6s清晰度:1440x960(3:2)帧率:16fps清影对以下类型和风格表现突出:视频类型维度:清言在风景、动物、超现实、人文历史类需求上表现更好视频风格维度:皮克斯风格、卡通风格、摄影风格、动漫风格镜头画面实现效果最好的是近景实体类型实现排序:动物>植物>物品>建筑>人物付费方案:首发测试期间,所有用户均可免费使用。付费5元,解锁一天(24小时)的高速通道权益,付费199元,解锁一年的付费高速通道权益。[heading2]主要特色[content]1、不限量使用!人人能用的AI视频来了!所有用户都能使用,无需预约。免费用户也可以不限次数使用!2、生成速度快清言的AI视频生成功能,基于智谱大模型团队自研打造的视频生成大模型CogVideoX。通过优化技术,智谱生成式视频模型的推理速度提升了6倍。目前生成6s视频,模型花费的理论时间是30s。3、配上音乐直接发布,清言是你最好的创作伙伴!清言将提供配乐小功能,可以直接配上音乐发布。清言拥有最齐的内容创作工具,提供一站式服务,打通视频生成创意全链条:从选题材料收集(AI搜索),到脚本(文案撰写),到图片、视频创作,甚至是推广文案,清言都能搞定。

为什么说2023年是AI视频的突破年?以及2024年的展望

截至目前,我们今年已经发现了21个公开的人工智能视频生成工具。你或许听过Runway、Pika、Genmo和Stable Video Diffusion这几个名字,但实际上还有许多其他的工具值得探索。大多数这类产品都是由初创公司推出的,它们往往起初以Discord机器人的形式存在,这有几个优点:无需开发面向消费者的界面,可以全力提升模型的质量借助Discord拥有的1.5亿月活跃用户群体进行推广—特别是当你的产品出现在平台的“发现”页面时公开频道能让新用户通过观看他人的创作来轻松获取灵感,并为产品提供社交认证但随着这些产品的成熟,我们发现越来越多的视频工具开始建立自己的网站甚至开发移动应用。虽然Discord是一个不错的起点,但它在添加工作流程和控制用户体验方面有限制。此外,还有一大部分人不怎么使用Discord,可能会觉得它的界面使人困惑或不经常登录。

Others are asking
请介绍一下中国AI发展历史
中国 AI 的发展历史可以追溯到二十世纪中叶。 最初,AI 领域的符号推理较为流行,也取得了一些重要进展,如专家系统。但由于从专家提取知识并以计算机可读形式表现和保持知识库准确性的任务复杂且成本高,20 世纪 70 年代出现了“人工智能寒冬”。 对于大众来说,对 AI 领域的使用在近 20 年随着国内互联网的发展才开始普及。最初的应用主要是基于 NLP 技术的聊天机器人和客服机器人。随后,中英文翻译、语音识别、人脸识别等技术取得突破,在日常生活中的应用广泛,如语音助手、智能翻译设备、人脸识别支付系统等。但此前这些技术突破大多限于特定领域,模型应用范围相对狭窄。 近年来,随着计算资源变得更便宜、可用数据增多,神经网络方法在计算机视觉、语音理解等领域展现出卓越性能。在过去十年中,“人工智能”一词常被用作“神经网络”的同义词。 2022 年 11 月 30 日,OpenAI 发布基于 GPT 3.5 的 ChatGPT ,引发全球 AI 浪潮。AI 的起源最早可追溯到 1943 年,心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续神经网络奠定基础。1950 年,图灵最早提出图灵测试作为判别机器是否具备智能的标准。1956 年,在美国达特茅斯学院召开的会议上,人工智能一词被正式提出并确立为一门学科。此后近 70 年,AI 的发展起起落落。
2025-03-18
哪个AI工具可以处理复杂的EXCEL数据
以下是一些可以处理复杂 Excel 数据的 AI 工具: 1. Excel Labs:这是一个 Excel 插件,新增了基于 OpenAI 技术的生成式 AI 功能,允许用户在 Excel 中直接利用 AI 进行数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的 AI 工具,整合了 Word、Excel、PowerPoint、Outlook、Teams 等办公软件,用户通过聊天形式告知需求,Copilot 会自动完成任务,包括 Excel 中的数据分析和格式创建等。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户可通过自然语言交互式地进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,除公式生成外,还能根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 随着技术的不断发展,未来可能会有更多 AI 功能被集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。但请注意,内容由 AI 大模型生成,请仔细甄别。 此外,Chat Excel 也可以处理 Excel 数据,用户提出要求后,它会逐步进行数据统计、分析和作图等操作。
2025-03-18
那个AI工具可以处理复杂数据?
以下是一些可以处理复杂数据的 AI 工具: Manus:由中国团队研发的全球首款通用型 AI 代理工具,于 2025 年 3 月 5 日正式发布。其技术架构基于多智能体架构,运行在独立的虚拟机中,通过规划、执行和验证三个子模块的分工协作,实现对复杂任务的高效处理。核心功能由多个独立模型共同完成,分别专注于不同任务或领域,如自然语言处理、数据分析、推理等。还包括虚拟机、计算资源、生成物、内置多个 agents 等关键组件,并采用“少结构,多智能体”的设计哲学。 Claude ChatGPT Bing Chat Perplexity 此外,在不同领域还有以下相关工具: 图片处理:DallE、Leonardo、BlueWillow、Midjourney 版权写作:Rytr、Copy AI、Wordtune、Writesonic 设计:Canva、Clipdrop、Designify、Microsoft Designer 网站搭建:10Web、Framer、Hostinger、Landingsite 视频处理:Klap、Opus、Invideo、Heygen 音频处理:Murf、LovoAI、Resemble、Eleven Labs SEO 优化:Alli AI、BlogSEO、Seona AI、Clearscope Logo 设计:Looka、LogoAI、Brandmark、Logomaster 聊天机器人:Droxy、Chatbase、Voiceflow、Chatsimple 自动化工具:Make、Zapier、Bardeen、Postman
2025-03-18
写学术论文用哪一个 AI大模型比较好
在写学术论文时,以下 AI 大模型可供选择: 1. 智谱 AI 大模型开放平台:其 GLM 系列模型凭借强大的语义理解能力,能够快速总结论文内容、进行精准翻译。模型通用性强,能适应不同学科和复杂文本,提炼核心观点,为研究工作提速。在使用前,需将文献转换为可供模型解析的文本格式,可借助平台工具高效完成文件内容的提取。 2. 对于论文排版,有以下工具: Grammarly:不仅是语法和拼写检查工具,还提供排版功能,可改进文档风格和流畅性。 QuillBot:AI 驱动的写作和排版工具,能改进文本清晰度和流畅性。 Latex:广泛用于学术论文排版,使用标记语言描述文档格式,有许多 AI 辅助的编辑器和插件简化排版过程。 PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 Wordtune:AI 写作助手,可重新表述和改进文本。 Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的工具取决于具体需求,如文档类型、出版标准和个人偏好。对于学术论文,Latex 和 Overleaf 通常是受欢迎的选择;对于一般文章和商业文档,Grammarly 和 PandaDoc 等可能更适用。
2025-03-18
会议记录ai
以下是关于会议记录 AI 的相关信息: 会议记录工具: 以下是一些可以用于会议总结的网站和工具: 免费的会议语音转文字工具: 有免费的会议语音转文字工具,不过大部分有使用的时间限制,超过一定的免费时间后就需要付费。以下是几款推荐的工具: 飞书妙记:https://www.feishu.cn/product/minutes ,飞书的办公套件之一 通义听悟:https://tingwu.aliyun.com/home ,阿里推出的 AI 会议转录工具 讯飞听见:https://www.iflyrec.com/ ,讯飞旗下智慧办公服务平台 Otter AI:https://otter.ai/ ,转录采访和会议纪要 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 会议记录相关内容: 2024 年 11 月 13 日的会议记录包括: 如果能和教育结合是最好的。 AI 的能力边界展示。 办公提效。 可以提前收集教育领域的需求,让小伙伴针对性地做一些产品和服务(云谷老师协助收集需求和案例,社群小伙伴帮助实现),包括办公提效的具体场景、家校沟通、个性化教育、心理疏导、备课体系、作业批改、出题建议、对老师出题后的建议和评估、辅助出题、建立孩子的成长体系记录、孩子的成长记录智能体、孩子成长的游戏(如寻宝游戏)、朗读(模拟老师来泛读,学生背诵,AI 来评判)、文生图和文生视频(备课时的针对性)、学科本身的一些教育辅助、分析学生行为并给出策略(基于教育心理学等)、教师模拟培训、公开课备课辅助。 需求可能需要描述更清晰的最终交付物形态和背后的思考等。 企业方面可能包括具身智能、3D 眼镜、AI 绘本、AI 图书、学习机、飞书的多维表格、蚂蚁的智能体、Coze 的智能体、Zeabur 等云平台、0 编码平台、大模型(通义、智谱、kimi、deepseek 等)、编程辅助、文生图(可灵、即梦等)、推荐咖啡和奶茶等 AI 调配(需要相应资质)。
2025-03-18
最新AI领域咨询
以下是最新的 AI 领域资讯: 新手学习 AI 方面:AI 是快速发展的领域,新的研究成果和技术不断涌现。新手应持续学习和跟进,关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。 法律法规方面:2022 年 7 月发布了政策文件,提出建立创新的 AI 监管非法定框架,基于包括透明、安全等一系列跨部门原则。2023 年的 AI 监管白皮书基于收到的反馈阐述了最新立场,尤其考虑了新的中央职能需求,如进行系统范围的风险监测和评估 AI 监管框架。欢迎对最新提案进行反馈,并将积极与利益相关者协商,截止到 6 月 21 日。 行政命令方面:拜登签署了 AI 行政命令。美国政府已与多国就 AI 治理框架进行广泛协商,采取的行动是美国在安全、可靠和可信 AI 方法上的重要步骤,未来还需更多行动,并将继续与国会合作推进两党立法。
2025-03-18
哪些模型的视频理解能力比较好?
以下是一些视频理解能力较好的模型: 1. 通义千问的 Qwen2.5VL 模型:具有以下优势: 视觉理解能力:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。 视频理解能力:支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。 万物识别:擅长识别常见物体及分析图像中的文本、图表、图标、图形和布局。 精准的视觉定位:采用矩形框和点的多样化方式对通用物体定位,支持层级化定位和规范的 JSON 格式输出。 全面的文字识别和理解:提升 OCR 识别能力,增强多场景、多语言和多方向的文本识别和文本定位能力。 增强的视频理解:引入动态帧率(FPS)训练和绝对时间编码技术,支持小时级别的超长视频理解,具备秒级的事件定位能力。 开源平台: Huggingface:https://huggingface.co/collections/Qwen/qwen25vl6795ffac22b334a837c0f9a5 Modelscope:https://modelscope.cn/collections/Qwen25VL58fbb5d31f1d47 Qwen Chat:https://chat.qwenlm.ai 2. Sora 模型:周鸿祎认为其技术思路完全不同,能像人一样理解现实世界,将大语言模型和 Diffusion 结合起来训练,实现了对现实世界的理解和模拟两层能力,对物理世界的模拟将对机器人具身智能和自动驾驶带来巨大影响。 3. 腾讯的混元模型:在语义理解方面表现出色,能够精准还原复杂的场景和动作,例如一只银渐层在游乐园里奔跑跳到小女孩怀里、一位紫衣女修在竹林中抚琴、星系边缘宇宙战舰引爆反物质引擎等场景。
2025-03-18
ai修改视频文案
以下是关于 AI 修改视频文案的相关内容: 在文案创作方面: 最初打算用旁白朗诵方式制作片子,类似《舌尖上的中国》,但直接让 GPT 写文案效果平淡,需更具体提出需求。 利用 360 浏览器字幕提取功能捕捉《爱我中华》视频文案,让 Kimi 和 ChatGPT 进行分析学习,以理解写作风格并融会贯通。对比发现,Kimi 在对中文的理解和写作能力上更突出。 让 AI 按此风格写作,整合两个 AI 的作品并调整,使文案更顺口,如将“钟山风雨起苍黄,江南佳丽地,金粉六朝都”改为“钟山风雨起苍黄,古都烟云梦犹长”。 在现阶段应用场景方面: 制作低成本的营销视频、企业宣传视频、培训课程,可使用 Synthesia、HeyGen AI、DID 等产品,用 Avatar 代替真人出镜。 出海企业给产品推广、介绍使用体验,诗云马良平台早在 21 年就推出给视频中模特换脸、切换语言的能力,近期 HenGen AI 也有相关能力,且能匹配 Avatar 口型与视频。 在歌词创作方面: 文案完成后,因剪映预设的 AI 语音效果不佳,决定为南京写歌并制作 MV。 将文案复制给 AI 进行歌词改写和取名,可定义风格和时间长度。 对比 Kimi 和 ChatGPT 写的歌词,最终修改 ChatGPT 写的歌词定稿,如“悠悠金陵风,古韵今犹存,钟山风雨起,金粉六朝魂。龙蟠虎踞地,文采风流情。梦开始之处,南京故事行。走过历史长廊,触摸时间痕迹,秦淮夜色下,灯火映繁华。夫子庙旧梦长,儒韵千古传,石头城波光里,岁月永流转。”
2025-03-18
有什么ai可以视频转文字
以下是一些可以进行视频转文字的 AI 工具: 1. Memo AI:支持将 YouTube、播客、本地音频视频轻松转文字、字幕翻译、语音合成,还可以由多种 AI 模型提炼内容精华总结,生成思维导图。同时支持多语言,包括中文、英语。 2. 通义听悟(或飞书妙记):可以将音频上传生成文字稿。 此外,海螺 AI 工具不仅能进行声音克隆,还能嵌入完整的 AI 录视频工作流中,其中包括将视频中的音频提取并转文字的步骤。
2025-03-18
我需要自己搭一个ai自动剪辑视频的插件
以下是搭建 AI 自动剪辑视频插件的详细步骤: 一、开通服务 1. 先获取搭建完成后需要用到的各种模型的 key。 首先注册火山引擎:https://volcengine.com/L/4lZ8oszvY20/ ,邀请码:KL9ZC1IF 。这个项目会使用到不少 Token,刚好火山现在还有赠送 Token 的活动,若未注册,使用此邀请码和链接注册可获得 375 万的 Token。 开通各项服务和拿到各个服务的 Key: 获取 LLM_ENDPOINT_ID、VLM_ENDPOINT_ID、CGT_ENDPOINT_ID、ARK_API_KEY 。注册后点击:控制台,进入火山方舟控制台(https://console.volcengine.com/ark/region:ark+cnbeijing/model?vendor=Bytedance&view=LIST_VIEW)。创建一个接入点,点击在线推理创建推理接入点。命名并选择 Doubaopro32k 模型。重复此步骤创建 Doubaovisionpro32k、Doubao视频生成模型这两个推理点。创建完成后,复制推理点的 ID 并对应填入相应位置。然后继续点击“API key 管理”创建一个并复制下来,这就是 ARK_API_KEY 。 获取 TOS_BUCKET 。 二、服务部署 1. 购买服务器:直接点击去购买:https://buy.cloud.tencent.com/lighthouse?blueprintType=APP_OS&blueprintOfficialId=lhbpr8j2ftq0&regionId=8&zone=apbeijing3&bundleId=bundle_rs_mc_med1_02&loginSet=AUTO&from=lhconsole 。 2. 根据以下配置购买即可。 3. 购买并付款完成后,回到服务器“控制台”。 4. 点击服务器卡片的空白处,去添加防火墙。按照如下方式添加:8887、8080 端口,点击确定即可。 5. 点击右上角的“登录”按钮,扫码验证后,看到一个命令行窗口。下边出现代码,复制的时候,注意复制全。代码已分好步骤,每次只需要复制粘贴一行,然后点击一次回车。回车后,只有最左边显示中括号对话前缀时,不要操作。若 ctrl+v 粘贴不进去,试试 shift+ctrl+v 粘贴。 6. 在命令行中,一条一条输入: echo\"8887\">/www/server/panel/data/port.pl sudo kill9$ sudo/etc/init.d/bt default 7. 保存并打开你的外网面板地址,输入账号和密码。 8. 选择已有账号登录,然后会有一个账号绑定页,这个是宝塔的账号,如有就直接登录,没有就去注册一个。注意,注册完成之后,要返回原页面登录!不要停留在宝塔的注册功能页。 9. 直接关掉推荐,来到文件。点击根目录,打开 home 文件。 10. 点击:文件目录上方的“终端”,出现下方窗口。 11. 粘贴输入:git clone https://github.com/volcengine/aiapplab.git 。 12. 然后关闭终端窗口,刷新一下会看到有一个 aiapplab 文件夹,打开文件夹找到 demohouse/chat2cartoon 文件夹,看到有一个“.env”。 13. 然后把提前准备的那些 key 和 token,对应的粘贴进去。 14. 粘贴完成之后,继续进入 backend 文件夹,然后打开“终端”输入以下命令: python3 m venv.venv source.venv/bin/activate pip install poetry==1.6.1 poetry install poetry run python index.py 15. 依次完成后,会如下图所示,看到下图到后端就启动成功了,把这个页面保持如下,不要关掉页面。保持这个终端是打开的。 16. 重新复制打开一个新的浏览器标签页面。返回上级文件夹,进入/home/aiapplab/demohouse/chat2cartoon/frontend/src/routes 。
2025-03-17
Google 图片视频AI
以下是关于 Google 图片视频 AI 的相关信息: Google 发布了 AI 视频 Veo2 和 AI 绘图 Imagen3。 关于 AI 视频 Veo2: 官网介绍可申请 waitlist,链接为 https://labs.google/fx/zh/tools/videofx 。 引入了改进后的物理引擎,能模拟真实世界动态变化。 能更好地捕捉和模拟人类动作、运动轨迹,并高精度呈现。 具有电影级视觉效果,能生成有深度感和层次感的场景。 提供灵活的镜头控制选项,允许用户调节镜头角度、视角和焦距等参数。 关于 AI 绘图 Imagen3: 绘图链接为 https://labs.google/fx/tools/imagefx 。 是最高质量的文本到图像模型,能生成比之前模型更好细节、更丰富光照和更少干扰伪影。 在图像细节和清晰度上有显著提高,生成的图像更生动、真实,细节更丰富。 相关报道和链接: 数字生命卡兹克:Google 全新发布 AI 视频 Veo2、AI 绘图 Imagen3 何以凌越,https://mp.weixin.qq.com/s/4ACndSdfG8az3gdLn5QLIQ 。 量子位:谷歌版 Sora 升级 4K 高清!一句话控制镜头运动,跑分叫板可灵海螺,https://mp.weixin.qq.com/s/8H286tyxbTeZrtEBDZHaA 。 锤爆 Sora,尺度最大,谷歌发布最强视频模型 Veo2,叫板海螺可灵,https://mp.weixin.qq.com/s/sMECORvSikuKHNaEzPor6Q 。 谷歌版 Sora 来了,4K 高清暴击 OpenAI!视频生图新卷王,更理解物理世界,https://mp.weixin.qq.com/s/PFeyrX2q9mWd6GIrJ9qdWQ 。 谷歌的 Imagen 3 终于来了——它是最好的 AI 图像生成器吗?https://mp.weixin.qq.com/s/gcyGvA6_9mxN9yz__jRRHQ 。 测评: ,Google 视频和图像生成模型更新包括 Veo 2、Imagen 3 和一个新工具 Whisk 。
2025-03-17
免费图生视频
以下为一些免费的图生视频工具及相关信息: Pika labs:目前推出了 Beta 版本,支持免费、不限次数地文生视频、图生视频,生成的视频会带上官方水印。使用方法如下: 在 Discord 试用 Beta 版本:http://discord.gg/pika 。 选择 generatex 开头的频道或者建立 pika labs 私信。 “/create”输入 prompt 即可完成文生视频,输入 prompt 后,点击“增加 1”可添加 image 进行文+图生视频。如果想仅输入图片,不输入 Prompt 来生成视频,可以使用/animate 命令。此外,🔄可以帮助用户快速进行多次生成,🔀则可以方便的可控参数能基本满足需求。 9 月,pika 更新了新能力加密信息。使用命令/encrypt_text,可以将最多 20 个字符的文本“加密”到给定的视频输出中。而/encrypt_image,则可以实现输入 logo image,生成图像动画中含有 logo 的效果。值得一提的是,最好将 logo 文件处理为黑底白图,否则 pika labs 可能无法识别。使用/encrypt_image 命令时,除了输入一张 logo image,还可以选择性增加一张垫图,垫图会对视频整体风格、内容产生影响。 在 Prompttutorial 频道,有很多值得一看的教学视频,而在 showcase 频道和官方 twitter 中可以看到许多优秀案例。官方 Twitter:https://twitter.com/pika_labs 。 Haiper(有免费额度):https://haiper.ai/ 。文生视频、图生视频、素描生视频、扩展视频,能生成 HD 超高清的视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值。图生视频只能写提示词、秒数(2s 和 4s)、种子值。视频重绘,轻松修改颜色、纹理和元素以改变原视频的视觉内容。局部重绘是使用点选的方式,选中需要重绘的区域,再输入需要替换的内容提示词,如果是大量背景的重绘,效果一般,视频容易崩。文生视频不同风格展示 。 DynamiCrafter(免费):https://huggingface.co/spaces/Doubiiu/DynamiCrafter ,https://github.com/Doubiiu/DynamiCrafter?tab=readmeovfile 。2 秒图生视频,还可以做短视频拼长视频。 Morph studio(内测):https://app.morphstudio.com/ 。暂未对外开放,可在官网提交内测申请。discord 上可以免费体验,支持文生视频、图生视频,英文提示词,支持运镜、运动强度、尺寸、秒数设置,默认生成 3s 视频。 另外,将图片拖到 runway 里面也可以图生 4s 视频(runway 是收费的,可在闲鱼或者淘宝买号)。进入 runway 官网首页,点击 start with image ,然后直接将图片拖进来,动画幅度尽量用 3,5 有时候会乱跑。啥都不用改,直接点击生成即可。注意:不需要等进度条转完,可以直接继续往里放图片,可以同步执行。直接点删除,然后重新上传下面的图即可(最多可以放几个可自行测试) 。
2025-03-17
推荐几个配音软件
以下是为您推荐的配音软件: 免费的配音软件:剪映配音、布谷鸟配音。 付费的配音软件:讯飞配音。 此外,还有一些效果较好的配音工具: 睿声:使用门槛较低,适合新手。例如,在之前生成的分镜中,Claude 已经给出了旁白内容,我们直接把旁白内容复制到睿声语音生成功能里。首先打开睿声(https://dash.reecho.ai/),登录自己的账户后,在首页左侧选择声音社区在搜索框中输入“宣传”后搜索点击“宣传配音角色”添加到列表。接着回到首页,点击选择左侧“语音生成”把所有旁白输入到文本框 1 处2 处选择角色“宣传 8”3 处点击“添加段落”4 处选择“高质量模式”5 处选择“V2.1 均衡”6 处点击“开始生成”。需要注意的是,睿声很多时候对于和英文字母并在一起的数字的生成效果并不好,很可能会把数字以英文的形式读出来,所以可以把数字用中文汉字代替。生成完配音后点击结果右上方的三个点,选择下载,即可保存配音文件到本地,留着后面剪辑用。 微软 axure:操作方法复杂,门槛高,效果和睿声类似。 elevenlabs:有门槛,推荐老手使用。 Wavel Studio:支持 30 多种语言的配音,音质自然流畅,自动去除背景噪音和杂音,提供添加字幕和文本叠加层的工具,界面友好,提供多种自定义选项。 Elai.io:支持 65 多种语言的配音,音色和语调真实,自动将唇形与语音同步,生成字幕,提高视频的可访问性,支持多位配音者,适合复杂对话场景。 Rask AI:支持 130 多种语言的配音,包括稀有和濒危语言,采用先进语音合成技术,音质高保真,提供语音参数自定义和音效添加工具,与多种视频编辑平台和工作流程整合。 Notta:提供快速实惠的多语言配音解决方案,保留原声说话风格和细微差别,提供调整语音速度和音调的工具,支持批量处理,高效完成多视频配音。 Dubverse:支持 60 多种语言的配音,音质接近真人,提供文本转语音和语音克隆功能,提供语音参数自定义和情感添加工具,与多种视频平台和社交媒体渠道整合。 Speechify
2025-03-18
写自媒体文章,哪个AI软件好
以下是一些适合用于写自媒体文章的 AI 软件: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体的 AI 写作助手,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于学生和写作人员的多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助用户在写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,可以帮助用户优化文章的语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可以根据输入生成符合要求的学术论文。 利用 AI 不到 30 分钟打造爆款公众号文章的步骤如下: 1. 收集相关资料:明确文章主题后,借助 AI 工具高效完成。例如使用 Perplexity.AI 的强大搜索功能获取信息,输入具体的 Prompt 定位相关资讯,还可使用具备联网搜索功能的工具如微软的 Bing 搜索引擎。 2. 整理资料:收集完资料后,使用月之暗面开发的 Kimi 这个 AI 会话助手进行整理。需注意 Kimi 阅读能力有限,可分批次提供资料确保其有效读取和理解。
2025-03-17
如何利用AI来打造自己的知识库?需要利用哪些软件?
以下是利用 AI 打造自己知识库的一些方法和可能用到的软件: 1. 飞书软件:例如“通往 AGI 之路”就是一个使用飞书搭建的 AI 知识库。您可以在飞书大群中与机器人对话获取资料。 2. Coze:在“大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库”中有相关介绍,能帮助您理解 AI 时代的知识库,包括其概念、实现原理和能力边界等。 3. AnythingLLM:包含所有 Open WebUI 的能力,额外支持选择文本嵌入模型和向量数据库。安装地址为 https://useanything.com/download 。安装完成后可进行配置,包括选择大模型、文本嵌入模型和向量数据库。在 AnythingLLM 中可创建独有的 Workspace 来构建本地知识库,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式和 Query 模式),配置完成后可进行测试对话。 4. GPT:通过将文本拆分成小文本块并转换为 embeddings 向量,保存在向量储存库中作为问答的知识库。当用户提问时,将问题转换为向量并与储存库中的向量比对,提取关联度高的文本块与问题组合成新的 prompt 发送给 GPT API 。 希望以上信息对您有所帮助。
2025-03-17
想要使用AI软件对学生成绩进行分析,请问应该用什么提示词
以下是一些关于使用提示词对学生成绩进行分析的建议: 1. 明确分析目标:例如找出成绩优秀和较差的学生特点、分析成绩的趋势等。 2. 描述数据特点:包括成绩的科目、分数范围、数据量等。 3. 确定分析方法:如比较不同时间段的成绩、按照班级或年级进行分类分析等。 4. 强调重点关注内容:比如特定学科的成绩表现、成绩波动较大的学生等。 5. 注意提示词的准确性和清晰性,避免模糊或歧义的表述。 在实际编写提示词时,可以参考以下格式:“对的表现。” 同时,不同的 AI 工具可能对提示词的要求和处理方式有所不同,您可能需要根据具体工具的特点进行适当调整。
2025-03-17
做ai音乐的经验和软件
以下是关于做 AI 音乐的经验和软件的相关内容: 经验方面: 1. 具备一定的 AI 音乐创作经验,如在 UDIO 和 SUNO 上制作过音乐。 2. 熟悉提示词(Prompt)的应用,了解如何使用 Prompt 进行创作。 3. 了解音乐编曲和结构,对编曲、歌曲结构有一定了解。 4. 掌握数字音频工作站(DAW)软件,如 Audition、Studio One 等。 5. 拥有对音乐的热爱,保持对音乐创作的热情和兴趣。 6. 在创建 AI 生成曲子的过程中,注意风格和语言的选择,以确保生成的曲子符合自己的需求。 7. 投喂给 AI 的旋律应保持清晰,避免复杂的节奏构架和变化,以提高 AI 的辨识度和创作效果。 软件方面: 1. 明天学习需要下载 flow 水果软件,可以在淘宝上购买并请人帮忙安装。 2. 可以使用 PS 里的工具进行抠图操作。 3. 利用分离人声的 AI 软件,能够将人声从背景音乐中分离出来。 4. 微软 AI 语音:制作使用了微软声音库制作旁白,语音库支持 147 种语言,还有定制声音。
2025-03-16
如何通过AI进行软件测试?有什么好用的AI工具,以及详细的步骤是什么?
以下是关于如何通过 AI 进行软件测试以及相关好用的 AI 工具和详细步骤的介绍: 一、基于规则的测试生成 1. 测试用例生成工具 Randoop:基于代码路径和规则生成测试用例,适用于 Java 应用程序。 Pex:微软开发的智能测试生成工具,自动生成高覆盖率的单元测试,适用于.NET 应用。 2. 模式识别 Clang Static Analyzer:利用静态分析技术识别代码模式和潜在缺陷,生成相应的测试用例。 Infer:Facebook 开发的静态分析工具,自动生成测试用例,帮助发现和修复潜在错误。 二、基于机器学习的测试生成 1. 深度学习模型 DeepTest:利用深度学习模型生成自动驾驶系统的测试用例,模拟不同驾驶场景,评估系统性能。 DiffTest:基于对抗生成网络(GAN)生成测试用例,检测系统的脆弱性。 2. 强化学习 RLTest:利用强化学习生成测试用例,通过与环境交互学习最优测试策略,提高测试效率和覆盖率。 A3C:基于强化学习的测试生成工具,通过策略梯度方法生成高质量测试用例。 三、基于自然语言处理(NLP)的测试生成 1. 文档驱动测试生成 Testim:AI 驱动的测试平台,通过分析文档和用户故事自动生成测试用例,减少人工编写时间。 Test.ai:利用 NLP 技术从需求文档中提取测试用例,确保测试覆盖业务需求。 2. 自动化测试脚本生成 Selenium IDE + NLP:结合 NLP 技术扩展 Selenium IDE,从自然语言描述中生成自动化测试脚本。 Cucumber:使用 Gherkin 语言编写的行为驱动开发(BDD)框架,通过解析自然语言描述生成测试用例。 四、基于模型的测试生成 1. 状态模型 GraphWalker:基于状态模型生成测试用例,适用于复杂系统的行为测试。 Spec Explorer:微软开发的模型驱动测试工具,通过探索状态模型生成测试用例。 2. 场景模拟 Modelbased Testing :基于系统模型自动生成测试用例,覆盖各种可能的操作场景和状态转换。 Tosca Testsuite:基于模型的测试工具,自动生成和执行测试用例,适用于复杂应用的端到端测试。 五、实践中的应用示例 1. Web 应用测试:使用 Testim 分析用户行为和日志数据,自动生成高覆盖率的测试用例,检测不同浏览器和设备上的兼容性问题。 2. 移动应用测试:利用 Test.ai 从需求文档中提取测试用例,确保覆盖关键功能和用户路径,提高测试效率和质量。 3. 复杂系统测试:采用 GraphWalker 基于系统状态模型生成测试用例,确保覆盖所有可能的状态和操作场景,检测系统的边界情况和异常处理能力。 六、好用的 AI 工具 Testim:AI 驱动的自动化测试平台,生成和管理测试用例。 Test.ai:基于 NLP 技术的测试用例生成工具,适用于移动应用和 Web 应用。 DeepTest:利用深度学习生成自动驾驶系统测试用例。 GraphWalker:基于状态模型生成测试用例,适用于复杂系统的行为测试。 Pex:微软开发的智能测试生成工具,自动生成高覆盖率的单元测试。 希望以上内容对您有所帮助。
2025-03-16
百度的ai大模型免费的新闻?
以下是关于百度 AI 大模型免费的相关新闻: 2024 年 5 月 21 日,阿里云宣布通义千问主力模型 QwenLong 的 API 输入价格大幅下降,同时下午百度宣布文心大模型两大主力模型全面免费。 2024 年 2 月 13 日,百度宣布文心一言将全面免费,AI 价格战加剧。
2025-03-17
现在最强最新的文本模型是什么,如何免费使用
目前较为强大和新的文本模型包括: BERT:由谷歌推出,是“来自Transformer的双向编码器表示”的缩写。可在免费下载和使用。能用于文本摘要、问答、分类、命名实体识别、文本相似度、攻击性信息/脏话检测、理解用户查询等多种自然语言处理任务。 GPT3:由 OpenAI 创建,生成真实文本的能力令人惊讶。 GPT4:OpenAI 目前最先进的自然语言生成模型,可用于回答问题、撰写文章等。 Gemini Ultra:Google 的多模态人工智能模型,采用神经网络架构,对标 GPT4,可用于回答问题、生成代码、处理文本等。 Claude 3 Opus:Anthropic 的多模态模型,能处理超过 1 百万 token 的输入,具有实时聊天、数据处理、分析预测等功能,实现了接近完美的召回率。 “悟道・天鹰”:北京智源人工智能研究院推出,是首个具备中英文双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。 文心一言:百度的大语言模型,可用以文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。 需要注意的是,免费使用这些模型可能存在一定限制,部分模型可能需要特定的条件或授权。同时,模型的性能和适用性也会因具体应用场景和需求而有所不同。
2025-03-15
直接分析excel的数据,有哪些AI推荐,免费的
以下是一些可用于直接分析 Excel 数据的免费 AI 工具推荐: 1. 让 AI 帮您写 Excel 宏函数,适用于几乎所有主流 AI。 2. Claude 网页版或 ChatGPT,可上传 CSV 进行可视化分析。 3. Excel Labs:Excel 插件,新增生成式 AI 功能,基于 OpenAI 技术,可在 Excel 中利用 AI 进行数据分析和决策支持。 4. Microsoft 365 Copilot:微软推出的 AI 工具,整合了多种办公软件,通过聊天形式完成数据分析或格式创建等任务。 5. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,可通过自然语言交互式地进行数据分析和生成 Excel 公式。 6. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,能执行公式生成、文本内容生成、情感分析、语言翻译等任务。 随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-03-14
免费的文字生视频软件
以下是一些免费的文字生成视频软件: 1. Pika:是一款出色的文本生成视频AI工具,擅长动画制作,支持视频编辑,目前内测免费。生成服务托管在discord中,加入Pika Labs的Discord频道,在“generate”子区可进行操作,输入/create并在弹出的prompt文本框内输入描述即可生成视频,还能上传本地图片生成对应指令动态效果。 2. SVD:如果熟悉Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,由Stability AI开源。 3. Kaiber:这是一款视频转视频AI,能够将原视频转换成各种风格的视频。 4. Sora:由OpenAI开发,可以生成长达1分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。 Pika labs的特点及使用方法: 目前推出了Beta版本,支持免费、不限次数地文生视频、图生视频,生成的视频会带上官方水印。 官方Twitter:https://twitter.com/pika_labs 使用方法: 在Discord试用Beta版本:http://discord.gg/pika 选择generatex开头的频道或者建立pika labs私信 “/create”输入prompt即可完成文生视频,输入prompt后,点击“增加1”可添加image进行文+图生视频。 若仅输入图片,不输入Prompt来生成视频,可以使用/animate命令。 9月,pika更新了新能力加密信息。使用命令/encrypt_text,可以将最多20个字符的文本“加密”到给定的视频输出中。使用/encrypt_image,则可以实现输入logo image,生成图像动画中含有logo的效果。 请注意,以上内容由AI大模型生成,请仔细甄别。
2025-03-14
索引模型哪家的免费?
以下是一些免费的索引模型: 1. Trae 标配的 Claude3.5sonnet 模型免费不限量。Trae 是一款与 AI 深度集成,提供智能问答、代码自动补全以及基于 Agent 的 AI 自动编程能力的 IDE 工具,其编辑器所有功能原生支持中文,上手门槛低。 2. Stability AI 社区发布的模型,个人和组织可以免费将其用于非商业用途,包括科学研究;初创公司、中小型企业和创作者可以免费将其用于商业目的,只要年总收入低于 100 万美元。 此外,OpenAI 还发布了开源模型,包括 PointE、Whisper、Jukebox 和 CLIP。访问供研究人员的模型索引(https://platform.openai.com/docs/modelindexforresearchers)可详细了解其研究论文中介绍的模型以及 InstructGPT 和 GPT3.5 等模型系列之间的差异。
2025-03-13