Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

现在学AI视频怎么学上手快些

Answer

以下是一些能帮助您快速上手学习 AI 视频的途径和方法:

  1. 您可以先查看 AI 视频学社的相关内容,包括入门教程:
  2. 加入 AI 视频学社的交流群,需要学习 AI 视频的,参与 AI 视频挑战赛,参与 AI 视频提示词共创的小伙伴,可以扫二维码或联系:三思或小歪【备注:AI 视频学社】,但必须有 AI 视频账号才能进群。
  3. 参加每周都举办的 Video Battle 以及不定期举办的各种视频比赛。
  4. 您还可以学习我 AI 北京系列共学课,例如:
  5. 对于小白来说,做 AI 视频思路清晰很重要,提示词方面要注意主体(什么东西)+动作(干啥了)+场景+镜头(怎么拍),您可以参考相关案例,如:
Content generated by AI large model, please carefully verify (powered by aily)

References

AI视频学社

[AI视频【学社说明】](https://waytoagi.feishu.cn/wiki/Nr1CwYYsfi0DBPkZkgXckJ30ngg)不熟悉AI视频的小伙伴请看下面的教程,或直接参加比赛,在比赛中学习更快更好[AI视频-软件教程](https://waytoagi.feishu.cn/wiki/UvHUw3wGriB2uvkuWkacwSc1nTy)[AI视频:工作流教程](https://waytoagi.feishu.cn/wiki/FSP0wkMbkiAtI0kNeD4ch5LYnCg)[AI视频:热门视频玩法拆解](https://waytoagi.feishu.cn/wiki/PmaMww7sHiKZf1k1wGfcgMXpnGe)[heading1]学社:交流群[content]需要学习AI视频的,参与AI视频挑战赛,参与AI视频提示词共创的小伙伴,直接扫二维码或联系:三思或小歪【备注:AI视频学社】,必须有AI视频账号才能进群。请勿随便申请好友。[heading1]AI视频学社:每周1次比赛(周日交稿)[content]每周都举办的Video Battle,以及不定期举办的各种视频比赛[heading3][Video Battle AI视频挑战赛](https://waytoagi.feishu.cn/[heading1]AI视频【提示词精华】[heading1]AI视频【案例精华】

我AI北京系列共学课

|时间|内容|相关文档|讲师||-|-|-|-||12/13 20:00<br>([直播回放](https://www.bilibili.com/video/BV1SHBLYtELB/))|(单镜头)?1分钟学会,5分钟上手!AI创意视频创作指南!|[我AI北京比赛&有手就行的10s创意视频制作](https://waytoagi.feishu.cn/wiki/QybpwA9Ftid68AkN8WwcG8cLnWg)|@啊朔||12/14 20:00<br>([直播回放](https://www.bilibili.com/video/BV1WZqdYwEDo/))|(蒙太奇)用AI讲好一个故事|[我AI北京比赛&VB 5金选手教你做视频精英](https://waytoagi.feishu.cn/wiki/Rfu6wR1L2igZEXkuhzZc9yWPnib)|@二金||待定|用AI做好一张海报||@咖菲猫|

从零开始:AI视频制作小白的成长之路?

提示词的坑太多了,我周围甚至有人花了钱去学提示词模板、学了不少提示词框架的课程···然后还是上手就麻爪主体(什么东西)+动作(干啥了)+场景+镜头(怎么拍)举个例子:生成视频:[1月8日(2).mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Fxj3biZ3hoFxvjxhXLfcN7kCnmf?allow_redirect=1)第一次生成[失败案例.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Emslboy2no9z6ixsxG8cemANnNe?allow_redirect=1)抽卡结果不理想[纳米哄孩子01.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/DYwtbYWfAoJPx2xuzyVcswmpnVe?allow_redirect=1)符合要求,修改提示词:母亲很疲惫看着孩子

Others are asking
AI产品经理招聘
以下是为您整理的 AI 产品经理招聘信息: 特看科技: 岗位要求: 负责 AI 视频工具方向产品工作,对生成式 AI 产品有一定研究,熟悉 Transformer 和 Diffusion 模型的优先。 英文好,有海外产品经验优先,有内容工具或 SaaS 产品经验优先。 2 年以上产品岗位经验,职级根据经验能力制定,对标阿里 P6P8 区间。 您能得到: 确定性的商业化应用场景,已有大量品牌客户。 初创公司充沛的早期期权池。 强大的工程师团队,将新技术快速落地应用。 最高可到合伙人级别。 加分项:有电子商务、企业服务、人工智能、海外产品等行业经验。 联系方式:欢迎推荐或自荐简历至 qingshen@tabcut.com,或飞书与@清慎联系。 阿里大文娱妙鸭团队: 工作地点:北京 职位要求: 熟悉图像、视频、文本领域的前沿大模型和应用。 对算法能力边界有很好的感知。 有某一场景下的大模型微调和应用的项目经验。 联系方式:欢迎推荐简历至 xiaocen.cxc@alibabainc.com 其他: 职责描述: 负责基于通用人工智能技术(AGI)的智慧医疗诊断产品的规划、研发、发布上市的全过程管理。 通过市场调研和分析,开发满足客户需求的产品或服务,为公司制定产品战略。 制定并执行产品开发计划和目标,协调项目相关人员,推动产品开发工作的顺利进行。 提出产品优化建议,推动产品快速迭代,并协调增长部门实现产品的持续增长。 任职要求: 本科及以上学历,计算机、信息技术、工程、检验、生物科学、细胞生物学等相关专业优先考虑。 具备 3 年以上产品管理经验,有医疗领域产品管理经验者、有极致产品案例者优先。 在产品创新、研发、迭代改进及商业化方面有丰富的项目管理经验。 对客户需求具有高度敏感度,熟悉竞品分析、定价策略。
2025-04-15
金融业相关AI应用场景或AI技术介绍
在金融业中,AI 有以下应用场景和技术: 1. 风控和反欺诈:用于识别和阻止欺诈行为,降低金融机构的风险。 2. 信用评估:评估借款人的信用风险,帮助金融机构做出更好的贷款决策。 3. 投资分析:分析市场数据,辅助投资者做出更明智的投资决策。 4. 客户服务:提供 24/7 的客户服务,回答客户常见问题。 例如,Hebbia 获得近 1 亿美元 B 轮融资,其 AI 技术能够一次处理多达数百万份文档,在短时间内浏览数十亿份包括 PDF、PowerPoint、电子表格和转录内容等,并返回具体答案,主要面向金融服务公司,如对冲基金和投资银行,同时也适用于律师事务所等其他专业领域。
2025-04-15
AI meeting summary tools
以下是一些 AI 会议总结工具: :这是一款 GDPR 合规的 AI 会议助手,专为 Zoom、Google Meet、Microsoft Teams 会议设计,能够根据用户的指令制作定制笔记,将长时间录音压缩成 2 分钟会议摘要,以用户偏好结构和语言编写笔记,捕捉重要细节,用户可连接日历让其代做笔记,提高效率,其笔记功能出色,能识别行动项提高会议效率,远超其他提供商。
2025-04-15
AI Agents(智能体)
AI 智能体(Agents)是人工智能领域中一个重要的概念: 1. 从 AGI 的发展等级来看,智能体不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 2. 作为大模型的主要发展方向之一,智能体中间的“智能体”其实就是大模型(LLM)。通过为 LLM 增加工具、记忆、行动、规划这四个能力来实现。目前行业里主要用到的是 langchain 框架,它把 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。 3. 从智能体的起源探究来看,心灵社会理论认为智能是由许多简单的 Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能,通过协作实现复杂的智能行为。心灵社会将智能划分为多个层次,每个层次由多个 Agent 负责,每个 Agent 类似于功能模块,专门处理特定类型的信息或执行特定任务。同时存在专家 Agent、管理 Agent、学习 Agent 等不同类型的 Agent 及其相应功能。从达特茅斯会议开始讨论人工智能,到马文·明斯基引入“Agent”概念,“AI”和“Agent”就彻底聚齐,往后被称之为 AI Agent。
2025-04-15
B端AI Agent
以下是关于 B 端 AI Agent 的相关知识: 一、概念定义 1. 智能体(Agent)简单理解就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。随着 ChatGPT 与 AI 概念的爆火,出现了很多相关新名词,如 bot 和 GPTs 等。AI 大模型是技术,面向用户提供服务的是产品,因此很多公司关注 AI 应用层的产品机会。 C 端案例:如社交方向,用户注册后先捏一个自己的 Agent,然后让其与他人的 Agent 聊天,两个 Agent 聊到一起后真人再介入;还有借 Onlyfans 入局打造个性化聊天的创业公司。 B 端案例:字节扣子和腾讯元器若为面向普通人的低代码平台,类似 APP 时代的个人开发者,那么帮助 B 端商家搭建 Agent 就类似 APP 时代专业做 APP 的。 2. 智能体开发平台:最早接触到的扣子 Coze 是通过一篇科技报道,如 2 月 1 日,字节正式推出 AI 聊天机器人构建平台 Coze 的国内版“扣子”,主要用于开发下一代 AI 聊天机器人。国内还有很多智能体开发平台,如 Dify.AI,但个人较常用的是扣子,所以常对比字节扣子和腾讯元器。 3. 关注智能体的原因:目前 AI Agent 的概念在市场上未达成共识,存在被滥用现象。AI Agent 指的是一种智能代理系统,接近人类大脑,可形成记忆、达成行动规划、自动交互、主动预测。其应用具有个性化、自主完成任务、多 Agent 协作等特点。目前 AI Agent 应用大多集中在 2B 场景,面向个人消费者的产品少,一方面是高度智能化的 Agent 能力需打磨,概念落地有距离;另一方面是 AI 和娱乐消费诉求结合少,主要带来生产方式和效率变革,个人消费者方向目前只看到“私人助理”场景。
2025-04-15
我想做电商主图,用什么ai
如果您想制作电商主图,可以考虑以下几种 AI 工具和方法: 1. Midjourney:通过输入相关关键词,如“Guerlain Perfume,plant flowers,top light.cean natural backaround with water,saturation color scheme.The productis bright,Motled shading,studo lighfing,contrast high precision,Fine gloss,Centered composition,Photography,HD4Krealism–q 2–v 5–s 750–ar 9:16”,生成图片后再进行后期修改调整和文字排版。 2. Stable Diffusion:对于运营网店的女装店主,可采用局部重绘的方法。先真人穿衣服拍照,获取真实质感的照片,选好真人照片风格的底模,如 majicmixRealistic_v7,再根据不同平台需求换头,如面向海外市场换白女头,然后在图生图下的局部重绘选项卡下涂抹自己替换的部分,并设置相关的 prompts 和 parameters,如“breathtaking cinematic photo,masterpiece,best quality,,blonde hair,silver necklace,carrying a white bag,standing,full body,detailed face,big eyes,detailed hands”。
2025-04-15
有哪些最新的ai技术可用在课堂教学上
以下是一些可应用在课堂教学上的最新 AI 技术: 1. 智慧技术助理:为教师提供辅助,帮助教师在课前、课中、课后呈现新的教学样态,驱动学生高效和差异化学习。 2. 生成式人工智能:可用于为教师减负,例如辅助设计教学内容、生成提示词等。 3. 个性化学习支持:通过 AI 技术实现对学生的个性化学习支持,如智能评估学生的学习情况,为每个学生提供定制化的学习方案。 4. 教育过程和结果的结构化表征:利用 AI 进行分析,帮助教师更好地了解学生的学习过程和结果。 5. 多维度数据采集与评价:AI 可以整合行为、情感、认知等多维度数据,为学生绘制发展全景图,实现更全面的教育评价。 需要注意的是,AI 在教育中是“助手”而非“替代”,教师应充分利用这些成熟的技术促进教育变革。
2025-04-13
如何科学上网使用chatgpt
以下是关于科学上网使用 ChatGPT 的相关内容: 对于使用 ChatGPT 4,建议注册的账号如下: 1. 苹果用户:ChatGPT 账号、美区 AppleID、谷歌账号。 2. 安卓用户:ChatGPT 账号、下载 GooglePlay、谷歌账号。 国外很多软件支持谷歌账号一键登录,ChatGPT 也可以用谷歌账号登录,目前注册谷歌账号支持国内手机号码和国内邮箱验证,过程简单。 注册谷歌账号的详细流程: 1. 访问注册页面:打开浏览器,输入进入谷歌账号注册页面。 2. 填写个人信息:按照提示填写姓名、用户名、密码,年龄最好大于 18 岁。 3. 填写邮箱账号:可以选择推荐前缀或者创新的邮箱地址。 4. 设置密码:采用大小写字母+数字的组合。 5. 验证电话号码:有一定概率跳到接收短信验证,可填写国内号码。有时不用验证手机号码。 6. 填写辅助邮箱:可用国内邮箱。 7. 确认账户信息,同意服务条款和隐私政策:阅读谷歌的服务条款和隐私政策,点击“我同意”完成账号注册。 8. 完成注册:可在“Personal info”里设置语言、头像等信息。 另外,还有一种不用魔法上网的方式,即 3 分钟极速、免费搭建自己的 ChatGPT 网站。推荐使用云原生服务,注意只有这个 dev 域名才能调用 ChatGPT 的服务。步骤如下: 后端接口部分: 1. 添加环境变量,输入您的 api keys,apikeys 的获取地址:https://platform.openai.com/ 。注意是否有免费流量,注意流量是否过期,否则无法调用。 1. 开始写代码。 前端上传资源部分: 1. 上传打包后的前端静态资料代码。 上传后直接访问右侧的域名即可。 请注意,在中国,未经电信主管部门批准,不得自行建立或租用专线(含虚拟专用网络 VPN)等其他信道开展跨境活动。请您在合法合规的前提下使用相关服务。
2024-10-15
不用科学上网,功能最接近chatgpt的AI工具
以下为不用科学上网且功能接近 ChatGPT 的 AI 工具介绍: 1. Kimi 智能助手: 是 ChatGPT 的国产平替,实际上手体验好,适合新手入门学习和体验 AI。 无需梯子、无需付费、支持实时联网。 是国内最早支持 20 万字无损上下文的 AI,也是目前对长文理解做得最好的 AI 产品。 能一次搜索几十个数据来源,无广告,能定向指定搜索源(如小红书、学术搜索)。 PC 端: 移动端(Android/ios): 2. Fly AI: 官网:https://letsflyai.com/ 是一个方便的 AI 工具,可直接从 Mac 操作系统访问 OpenAI 的 ChatGPT。由 macOS 用户专用开发,提供无与伦比的 OpenAI ChatGPT 功能,无缝集成到 macOS 环境中,提供增强的效率和即时访问。
2024-09-03
目前全世界最厉害的对视频视觉理解能力大模型是哪个
目前在视频视觉理解能力方面表现出色的大模型有: 1. 昆仑万维的 SkyReelsV1:它不仅支持文生视频、图生视频,还是开源视频生成模型中参数最大的支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其具有影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等优势。 2. 通义千问的 Qwen2.5VL:在 13 项权威评测中夺得视觉理解冠军,全面超越 GPT4o 与 Claude3.5。支持超 1 小时的视频理解,无需微调即可变身为 AI 视觉智能体,实现多步骤复杂操作。擅长万物识别,能分析图像中的文本、图表、图标、图形和布局等。
2025-04-15
目前全世界最厉害的视频视觉理解大模型是哪个
目前全世界较为厉害的视频视觉理解大模型有以下几个: 1. 昆仑万维的 SkyReelsV1:不仅支持文生视频、图生视频,是开源视频生成模型中参数最大且支持图生视频的模型。在同等分辨率下各项指标实现开源 SOTA。其优势包括影视化表情识别体系、人物空间位置感知、行为意图理解、表演场景理解等。 2. 腾讯的混元:语义理解能力出色,能精准还原复杂的场景和动作,如特定品种的猫在复杂场景中的运动轨迹、从奔跑到跳跃的动作转换、琴音化作七彩音符等。 3. Pixverse V3.5:全球最快的 AI 视频生成模型,Turbo 模式下可在 10 秒内生成视频,最快仅需 5 6 秒。支持运动控制更加稳定、细节表现力强、首尾帧生成功能,具备顶尖动漫生成能力。
2025-04-15
需要做一个自动化出视频的工作流
以下是一个关于自动化出视频工作流的详细介绍: 优势: 全自动化处理,解放双手。 40 秒快速出片,效率提升。 成本低廉,每条仅需 0.0x 元。 输出质量稳定专业。 DeepseekR1 保证文案质量。 还能改进,例如可以加入配套 BGM,让视频更有感染力;增加更丰富的画面内容和转场效果;使用免费节点替代付费插件,进一步降低成本;优化模板样式,支持更多展示形式;增加自动化程度,支持批量处理。 工作流程: 1. 可以在扣子商店体验,建议自己搭建。 2. 工作流调试完成后,加入到智能体中,可以选择工作流绑定卡片数据,智能体则通过卡片回复。 3. 选择发布渠道,重点如飞书多维表格,填写上架信息(为了快速审核,选择仅自己可用),确认发布等待审核,审核通过后即可在多维表格中使用。 4. 创建飞书多维表格,添加相关字段,配置选择“自动更新”,输入相关字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 5. 表单分享,实现“填写表单,自动创建文案短视频”的效果。 6. 全自动视频合成使用多视频融合插件,一键导出成品。但需注意节点产生的视频是异步生成,可能无法马上展现,需耐心等待几秒。 如果您还有其他疑问或需要进一步的帮助,请随时联系。
2025-04-14
新手怎么学习AI 做视频
对于新手学习 AI 做视频,以下是一些建议和指导: 一、了解 AI 视频的应用和价值 AI 视频能应用于多个领域,具有多种用途,例如: 1. 创意广告与营销:快速生成吸引眼球的短视频,降低成本,提高效率。 2. 社交媒体内容:制作独特的动态视觉效果,让帖子更出众。 3. 电商展示:生成商品展示视频或 3D 效果,生动呈现产品特性。 4. 数字人解说:借助数字人技术生成虚拟主播或形象来解说内容。 5. 个性化动画与故事:将想法变成生动的动画短片。 6. 教育与演示:生成解释性视频或动态图表,让信息更直观。 7. 艺术创作与实验:探索新的视觉表达方式。 8. 乐趣与分享:快速制作好玩的视频。 变现方式包括: 1. 接单制作商业广告、社交媒体视频。 2. 成为自由职业者,提供 AI 视频制作服务。 3. 创作自己的 IP 内容,通过流量或平台分成赚钱。 4. 开发相关教程或咨询服务。 二、学习制作流程 如果想用 AI 把小说做成视频,大致流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-04-14
高清视频修复ai工具
以下为一些高清视频修复的 AI 工具: 1. 星流一站式 AI 设计工具: 高级模式下,基础模型允许使用更多的微调大模型,图片参考允许使用更多的图像控制功能。星流基础大模型下,增加了 tile 分块与 softedge 线稿。 高清分辨率修复:利用算法对初步生成的图像进行简单的图生图高清放大(目前仅支持基础模型 xl 和 1.5 模型)。 放大算法影响图像放大后的图像质量,重绘幅度与初步生成的图像的相似度,其他参数默认即可。 采样器和采样步数会影响出图质量和生成时间,随机种子和 CFG Scale 也有相应作用,脸部/手部修复利用算法对人像的脸部或者手部进行修复。 2. Pika: 发布 Pikaddition 能力,可以将用户图片物体融合到拍摄视频,不会改变原视频且保证新视频创意效果自然。 支持用户自行上传视频(视频时长需 5s 以上),支持物体、人物(卡通、真人)图像,有 15 次免费尝试机会。 使用方法:进入 Pika 官网,页面底部选择 Pikaddition,上传视频、图像,输入文字描述提示词,点击确认即可。 地址:https://pika.art/ 3. Topaz Labs: 推出 Starlight 首个用于视频修复的扩散模型,只需输入素材,AI 可自动降噪、去模糊、放大、抗锯齿,无需手动调整与参数调整,达成专业视频高清修复。 目前正在 Beta 中。 地址:https://www.topazlabs.com/ 4. Tusiart: 具有高清修复功能,在本来设置的图像分辨率基础上,让图像分辨率变得更加精细。 有 ADetailer 面部修复插件。
2025-04-14
AI视频模型排名
以下是一些关于 AI 视频模型的排名信息: 腾讯混元视频生成模型:在开源 AI 视频中无可争议地处于 T0 级别,闭源模型中排在 T1 附近。其特点包括超强的真实质感、很强的语义理解和可以切换镜头。开源地址为:https://github.com/Tencent/HunyuanVideo 。普通用户可在腾讯元宝 APP 的 AI 应用中查看,可能需要申请资格,腾讯处理速度较快。 在 2025 年 2 月 24 日的 AI 视觉模型测评排行榜中: Pixverse 在文生视频方面获胜率达 70%,表现出色。 豆包在图生图方面效果良好,美感度较高,在中文模型中领先。 Request 模型在国外模型中表现出色,甚至超过 Midjourney。 Luma 模型是一匹黑马,在图生图方面表现不错。 Midjourney 常用,但在本次图生图的排行中未居前列。 此外,国内如混元、阶跃等模型开源,通义万象即将开源,开源有利于形成更好更强的生态。测评活动会联合多位小伙伴对 AI 模型进行测评,并根据结果了解模型的偏好和能力,榜单会在微信公众号发布且定期更新。
2025-04-14