Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI图生视频前沿

Answer

以下是关于 AI 图生视频前沿的相关信息:

在近半年闭源产品趋势方面:

  1. 服务头部创作者方面,产品将逐渐增强编辑器能力,强化视频细节可控性,并智能化后期制作任务。
  2. 影视后期方向,可将动捕演员表演转化为虚拟角色,提高特效制作效率。
  3. 专业领域,创作者能通过草图分镜快速验证效果,但目前效果不够成熟。
  4. 随着实时生成能力提升和成本下降,AI 实验性艺术在博物馆、展览等互动应用将增多。
  5. 在 C 端大众消费侧,AI 视频在小说、网文阅读、短情景剧等内容消费方向有潜力,人物识别和替换可衍生电商平台虚拟试衣间能力。
  6. 模板套用能力若以低成本开放在短视频产品中,可能带来新的爆发周期。

其他动态包括:

  1. Krea 用开放的 API 做了自己的 AI 视频功能,支持对任何视频输入提示词进行延长。
  2. Runway 发布 Act-One 功能,支持将现实视频的人物表情和动作迁移到生成的视频上,且已全量开放。
  3. Ideogram 发布 Ideogram Canvas,可在无限画布上对生成的图片进行编辑。
  4. Meta 的图像分割模型 SAM 更新了 2.1,大幅加强了相似物体和小物体的分割和识别效果。

在 2024 年国内外 AI 企业竞争方面:

  1. 中国开源项目赢得全球粉丝,成为积极开源贡献者。DeepSeek 在编码任务中表现出色,阿里巴巴的 Qwen-2 系列视觉能力令人印象深刻,清华大学的 OpenBMB 项目催生了 MiniCPM 项目。
  2. 国外 Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,并在定制化方面进步显著。今年 3 月推出的 Stable Video 3D 可预测三维轨道。
  3. OpenAI 的 Sora 能生成长达一分钟的视频,保持三维一致性等,还使用原始大小和纵横比的视觉数据训练。
  4. Google DeepMind 的 Veo 将文本和可选图像提示与嘈杂压缩视频输入结合,创建并解码独特的压缩视频表示。
Content generated by AI large model, please carefully verify (powered by aily)

References

AI视频爆发式更新- 近半年闭源产品趋势

这半年来,除传统的文生视频、图生视频能力迭代外,当前的主要技术发展还围绕着通过转绘改变画风、视频内人物识别和替换方向。1.在服务头部创作者方面,各家产品未来会逐渐转向编辑器能力增强,强化视频细节可控性,并逐渐将剪辑、音效生成匹配等后期制作任务智能化,逐步转变当前AI创作者跨N个产品完成创作的现状。2.影视后期方向,未来可以将动捕演员的表演直接转化为虚拟角色,大大提高特效制作效率。3.专业领域,创作者未来可以快速通过草图分镜验证效果。例如动画制作产品Fable在今年4月试水了Prism Beta功能。用户可以制作简单的几何图形串联的动画逐帧渲染实现更丰富的动画效果。但目前效果还不够成熟。4.随着实时生成能力的进一步提升,生成成本的下降,AI实验性艺术在博物馆、展览等互动应用将会增多。5.在C端大众消费侧,看好AI视频在小说、网文阅读、短情景剧等内容消费方向发挥潜力;另外人物识别和替换也可以衍生电商平台虚拟试衣间能力。6.Viggle、DomoAI的产品中的模板套用能力若以更低成本开放在短视频产品中,可能会带来短视频平台效果模板新的爆发周期。

AIGC Weekly #94

[Krea用那些开放的API做了自己的AI视频功能](https://x.com/krea_ai/status/1849393245887062082)。支持对任何视频输入提示词进行延长。应该是用视频最后一帧做的图生视频,不过也省事很多了,他接入的几家都没做。千问周畅、面壁智能核心成员秦禹嘉、零一万物核心成员黄文灏都加入了字节,有钱真好啊,经得起折腾,无限投入。[Runway发布Act-One功能](https://x.com/runwayml/status/1848785907723473001),支持将现实视频的人物表情和动作迁移到生成的视频上,效果非常好,目前已经全量开放。[Ideogram发布Ideogram Canvas](https://x.com/ideogram_ai/status/1848757699606983143)。可以在无限画布上对生成的图片进行编辑,比如扩图、局部重绘,以及最基本的生成功能。[Meta的图像分割模型SAM更新了2.1](https://github.com/facebookresearch/sam2/blob/main/demo/README.md)。大幅加强了相似的物体和小物体的分割和识别效果。

2024人工智能报告|一文迅速了解今年的AI界都发生了什么?

**中国开源项目在今年赢得全球粉丝,并且已经成为积极开源贡献者。**其中几个模型在个别子领域中脱颖而出,成为强有力的竞争者。DeepSeek在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的deepseek-coder-v2。阿里巴巴最近发布了Qwen-2系列,社区对其视觉能力印象深刻,从具有挑战性的OCR任务到分析复杂的艺术作品,都完成的非常好。在较小的一端,清华大学的自然语言处理实验室资助了OpenBMB项目,该项目催生了MiniCPM项目。这些是可以在设备上运行的小型<2.5B参数模型。它们的2.8B视觉模型在某些指标上仅略低于GPT-4V。2024年是AI图像视频迅速发展的一年,这个赛道竞争异常激烈国外Stability AI发布的Stable Video Diffusion,是第一个能够从文本提示生成高质量、真实视频的模型之一,并且在定制化方面取得了显著的进步。并且在今年3月,他们推出了Stable Video 3D,该模型经过第三个对象数据集的微调,可以预测三维轨道。OpenAI的Sora能够生成长达一分钟的视频,同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁,类似于在变压器模型中使用的令牌,但用于视觉内容,以高效地从大量视频数据集中学习。除此之外,Sora还使用了其原始大小和纵横比的视觉数据进行训练,从而消除了通常会降低质量的裁剪和缩放。Google DeepMind的Veo将文本和可选图像提示与嘈杂压缩视频输入相结合,通过编码器和潜在扩散模型处理它们,以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。

Others are asking
图生图的AI有哪些?
目前比较成熟的图生图 AI 产品主要有: 1. Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。 此外,原画师或美术会使用的图生图工具,比如用一个线稿或原画,在原画基础上加一些 Prompt 和参数,就可以形成一个效果图和二级的素材,这种情况会越来越多。像 Stable Diffusion 在这方面也有应用。
2025-02-06
以图生图有什么好用的模型
以下是一些好用的以图生图模型和相关产品: 1. Tusiart: 首页包含模型、帖子、排行榜,可查看不同模型的详细信息,如checkpoint、lora等。 checkpoint是生图必需的基础模型,lora是低阶自适应模型,可有可无,常用于控制细节。 还有ControlNet用于控制特定图像,VAE类似于滤镜可调整饱和度,以及Prompt提示词和负向提示词。 图生图功能可根据上传图片和所选模型等信息重绘。 2. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 3. Retrato:AI工具,可将图片转换为非凡肖像,有500多种风格选择,适合制作个性头像。 4. Stable Diffusion Reimagine:新型AI工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 5. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的AI工具,能将上传的照片转换为芭比风格。 需要注意的是,这些AI模型可能存在性能不稳定、生成内容不当等局限,使用时需仔细甄别。
2025-02-05
图生图美食模型
以下是关于图生图美食模型的相关知识: 概念与功能说明: 首页模型、帖子、排行榜:展示其他用户生成的模型、图片。不同模型有 checkpoint 和 lora 两种标签,部分还有 SDXL 标签。点击可查看模型详情,下方有返图区。 基础模型(checkpoint):生图必需,任何生图操作都要先选定。 lora:低阶自适应模型,类似 checkpoint 的小插件,可控制细节,权重可调整。 ControlNet:控制图片中特定图像,如人物姿态、特定文字等,高阶技能。 VAE:编码器,类似滤镜,调整生图饱和度,可无脑选 840000。 Prompt 提示词:描述想要 AI 生成的内容。 负向提示词(Negative Prompt):描述想要 AI 避免产生的内容。 图生图:上传图片后,SD 会根据图片、所选模型、输入的 prompt 等信息重绘,重绘幅度越大,输出图与输入图差别越大。 简明操作流程(文生图): 定主题:确定生成图片的主题、风格和表达信息。 选择基础模型(checkpoint):按主题找贴近的模型,如麦橘、墨幽的系列模型。 选择 lora:寻找与生成内容重叠的 lora 控制图片效果和质量。 ControlNet:高阶技能,可控制特定图像。 局部重绘:下篇再教。 设置 VAE:选 840000。 Prompt 提示词:用英文写需求,单词、短语组合,用英文半角逗号隔开。 负向提示词(Negative Prompt):用英文写避免的内容,单词、短语组合,用英文半角逗号隔开。 采样算法:如选 DPM++2M Karras,留意 checkpoint 详情页作者推荐的采样器。 采样次数:根据采样器特征,选 DPM++2M Karras 时,采样次数在 30 40 之间。 尺寸:根据个人喜好和需求选择。
2025-02-04
哪些可以将CAD建筑平面图生成室内效果图的AI软件
以下是一些可以将 CAD 建筑平面图生成室内效果图的 AI 软件: 1. CADtools 12:这是一个 Adobe Illustrator 插件,为 AI 添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:是 Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能帮助用户创建复杂的几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可帮助用户创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,可根据用户输入的设计目标和约束条件自动产生多种设计方案。 同时,以下是一些能够帮助建筑设计师审核规划平面图的 AI 工具: 1. HDAidMaster:云端工具,在建筑设计、室内设计和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster。 2. Maket.ai:主要面向住宅行业,在户型设计和室内软装设计方面有 AI 技术探索,能根据输入自动生成户型图。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期阶段可引入相关标准和规范约束设计结果。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,能将建筑全寿命周期内的信息集成,实现数据汇总与管理。 每个工具都有其特定的应用场景和功能,建议根据具体需求选择合适的工具。
2025-01-29
图生视频哪个网站最好,免费的
以下是一些免费的图生视频网站,各有其特点和优势: Runway:https://runwayml.com/ ,有网页和 APP ,使用方便。 PixVerse:https://pixverse.ai/ ,人少不怎么排队,还有换脸功能。 GigaStudio:https://studio.gigaai.cc/ ,创作者可申请免费会员,文生视频效果好,有 10 个免费极光。 Neverends:https://neverends.life/create ,有 2 次免费体验,操作傻瓜。 DynamiCrafter:https://huggingface.co/spaces/Doubiiu/DynamiCrafter ,2 秒图生视频,还可以做短视频拼长视频。 需要注意的是,不同网站的功能和使用体验可能会有所不同,您可以根据自己的需求进行选择和尝试。
2025-01-26
图生视频
图生视频是指将一张图片通过输入相应的提示词或利用特定模型转变为视频画面的过程。以下是一些关于图生视频的知识和技巧: 工具方面:清影大模型可以实现图生视频。输入一张图片和提示词,模型会将图片转变为视频画面,也可以只输入图片,让模型自行发挥想象力生成有故事的视频。 技巧要点: 选用尽可能清晰的图片,上传图片比例最好为 3:2(横版),支持上传 png 和 jpeg 图像。如果原图不够清晰,可使用分辨率提升工具。 提示词要简单清晰。可以选择不写 prompt,直接让模型自己操控图片动起来;或者明确想动起来的主体,并以“主体+主题运动+背景+背景运动”的方式撰写提示词(一定要有主体,不然可能会出现 AI 狂乱景象)。若不明确大模型如何理解图片,可将照片发送到清言对话框进行识图,明确主体的描述。 案例展示: 桂大羊的案例中,先确立剧本中的人物形象和场景,生成静态图片,然后使用即梦进行图生视频,上传图片至视频生成模块,用简单提示词描绘画面中的动态内容,设置运镜类型和生成速度。 离谱村的案例中,使用了多种工具如 pika、runway、Pixverse 进行图生视频的尝试,还找了技术指导用 SVD1.1 生成精美的视频。
2025-01-24
优化ppt的ai 工具
以下是一些优化 PPT 的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ AI 生成 PPT 的主要思路: 以爱设计为例,将大纲导入工具生成 PPT,其他工具操作方式大同小异,都是基于 Markdown 语法的内容来完成 PPT 的生成。具体步骤可移步到 MindShow、闪击、爱设计等章节。生成后可按照公司要求优化整体结构,如自行优化字体、图片等元素,针对下载后的 PPT 删改内容以达到预期。 此外,还可以使用 WPS 插件 chatPPT 为 PPT 添加动画等效果。同时,还有其他生成 PPT 的 AI 工具,如 gamma、百度文库、mindshow 等。
2025-02-06
推荐可以生成3D模型的ai软件
以下是一些可以生成 3D 模型的 AI 软件: 1. CADtools 12:这是 Adobe Illustrator 的插件,为其添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:Autodesk 开发的云端 3D CAD/CAM 软件,集成了 AI 功能,能创建复杂几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 主流 CAD 软件中的生成设计工具:如 Autodesk 系列、SolidWorks 等,提供基于 AI 的生成设计工具,可根据输入的设计目标和约束条件自动产生多种设计方案。 对于图片生成 3D 建模的工具: 1. Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型。 2. Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成。 3. CSM AI:支持从视频和图像创建 3D 模型,适用于游戏领域的模型生成。 4. Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域。 5. VoxCraft:免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供多种功能。 此外,还有一些从文本生成 3D 的工具: 1. CSM_ai:能将文本、图像或草图转换为 3D 素材,可直接应用于游戏中,无需后期处理。体验地址:https://cube.csm.ai 2. Move AI 推出的 Move API:从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。网址:https://move.ai/api 3. ComfyUI 3D Pack:快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。网址:https://github.com/MrForExample/ComfyUI3DPack/tree/main 4. Medivis 的 SurgicalAR 手术应用:将 2D 医疗图像转化为 3D 互动视觉,提高手术精度,支持 3D 模型的放大、缩小、旋转,精确手术计划。网址:https://t.co/3tUvxB0L4I
2025-02-06
AI做出爆款APP
以下是关于 AI 做出爆款 APP 的相关内容: 短期内,AGI 并未迅速催生大量“明星 APP”和“变现机器”。只有 ChatGPT、Charactor.ai 等少数 App 实现了用户突破。大量上层应用 APP 如昙花一现,迅速被 OpenAI 官方取代,且无法做到成本打平,导致投资人极端谨慎,公众对 AI 渐趋麻木。 长期来看,技术稳定且加速迭代。23 年 3 月预测的众多技术,如视频生成、音频生成、代理 Agent、记忆能力、模型小型化等,虽距离商用存在问题,但突破只是时间问题。 生成式 AI 已成为一种现象,每个开发者都在研究其应用,每个企业买家都在需求它。ChatGPT 是最快达到 1 亿 MAU 的应用程序,且第一批杀手级应用已出现,如 Character AI 的参与深度、Github Copilot 的生产力益处、Midjourney 的商业化路径等。开发者是关键,他们创造了各种意想不到的使用案例,AI 应用的形态也在不断发展。 Sequoia Capital 指出,生成式 AI 的第一年推出的应用多为新技术的轻量级演示,未达预期,用户留存率糟糕。但尽管市场存在问题,生成式 AI 开局仍比 SaaS 好,OpenAI 在 2023 年实现了二十亿美元的年化收入,增长迅速。
2025-02-06
如何从小白开始学习掌握AI工具
以下是从小白开始学习掌握 AI 工具的建议: 1. 缘起:普通人和 AI 之间存在一堵墙,对于行业外、没有梯子、不愿初期付费以及长辈等人群,AI 看似遥远。例如作者的父亲虽与计算机和网络紧密相关,且作者已提供相关帮助,但仍对 AI 存在疑问。 2. 开搞:百闻不如一试 对于普通人来说,对 AI 最好的直观初接触有聊天工具、绘画工具、视频工具、音乐工具等方面。 绘画工具: 最低成本的开始:扣子+ByteArtist 网址:https://www.coze.cn/home 优点:不需要梯子,无收费,可以直接生成。 注册:手机号或抖音号或飞书号。 操作步骤:需要在 coze 的 bot 里面添加绘图插件,时间约 5 分钟。 先锋的:Midjourney 网址:https://www.midjourney.com/explore?tab=random 优点:图片和描述相关性更大,风格更加显著。 限制:需要梯子,需要 gmail 注册,不免费,在 discord 上代理使用,价格为 8 美元一个月/200 张图,时间约 30 60 分钟。 尝试后:需要学习 Midjourney 专属提示词,以更精准地生成想象中的图画。 3. 总之,虽然底层都是大模型,但 AI 工具各有侧重和优化。关于每一种工具的详细入门、讲解和应用,WayToAIG 已分好类目。
2025-02-06
我想让AI辅助我学习AE,有哪些课程可以让我学习
以下是一些可以辅助您学习 AE 的课程和学习路径: 1. 在 B 站可以找到丰富的 AE 软件入门课程,您可以自学。 2. 从包图网下载工程文件进行学习。 AE 软件的功能及学习方法包括: 1. AE 可通过图层软件抠元素加插件做特效,如利用 auto field 自动填充工具,轨道遮罩功能让图层按特定形状变化等。 2. 用内容识别填充功能处理视频画面,如抹掉入镜的人;从素材网站获取粒子素材为画面添加氛围感。 3. 学习方法上,可以通过拆解视频、留意路边广告特效、按层级逻辑思考画面运动来学习 AE,还可参考模板。 AE 与 AI 结合运用方面: 1. 如用 runway 生成烟花爆炸素材,结合 AE 的图层混合模式、遮罩等功能实现特效可控的画面。 此外,还有一些关于 AE 的应用和相关分享: 1. 在短剧中,AE 在火焰、文字、光线等方面有少量应用。 2. 未来可能会分享短剧工作流等内容。 同时,在学习 AE 时,您还可以了解购买导比软件正版的优势,台湾节点学习 AE 插件,AE 插件合集购买,AE 模板运用,如通过转场、抠图等制作效果,以及 AE 图钉动画等实用技巧。
2025-02-06
假设你是经验丰富的AI工程师,现在需要搭建能够自行识别电商直播平台中客户提出的问题并给出不死板且AI痕迹弱的回答,同时直播的主播是我们虚拟的数字人,请问需要怎么做,请给出具体步骤
以下是搭建能够自行识别电商直播平台中客户提出的问题并给出自然回答,且直播主播为虚拟数字人的具体步骤: 1. 选择数字人工具软件: 考虑实时驱动和非实时驱动两类。实时驱动能在直播时更改音频话术,真人可接管,标准零售价一年 4 6 万往上;非实时驱动一个月 600 元,但效果差,类似放视频的伪直播,市场价格混乱。 2. 确定数字人运营服务模式: 按直播间成交额抽佣。 3. 明确适用品类和场景: 适用于不需要强展示的商品,如品牌食品饮料;适用于虚拟商品,如门票、优惠券等;店播效果较好,数据能保持跟真人一样;不适用于促销场景和服装品类。 4. 了解 AI 直播的壁垒和未来市场格局: 目前有技术门槛,如更真实的对口型、更低的响应延迟等,但长期看技术上无壁垒。 市场不会一家独大,可能 4 5 家一线效果公司,大多为二三线效果公司。 能把客户服务好、规模化扩张的公司更有价值,疯狂扩代理割韭菜的公司售后问题多。 有资源、有业务的大平台下场可能带来降维打击,如剪映若不仅提供数字人,还提供货品供应链、数据复盘分析等全环节服务,会对其他公司形成竞争压力。
2025-02-06
前沿ai学习网站
以下是一些前沿的 AI 学习网站: 1. WaytoAGI:这是一个致力于人工智能(AI)学习的中文知识库和社区平台。为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。它汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。平台提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。此外,社区还定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 2. 在没有任何推广的情况下,WaytoAGI 一年时间已有超过 100 万用户和超千万次的访问量。其目标是让每个人的学习过程少走弯路,让更多的人因 AI 而强大。目前合作过的公司/产品包括阿里云,通义千问,淘宝,智谱,支付宝,豆包,火山引擎,marscode,coze,堆友,即梦,可灵,MiniMax 海螺 AI,阶跃星辰,百度,Kimi,吐司,liblib,华硕,美团,美的,360,伊利,魔搭,央视频,Civitai,Openart,Tripo3D,青椒云等。 3. 「通往 AGI 之路」的品牌 VI 融合了独特的设计元素,以彩虹色彰显多元性和创新,以鹿的形象象征智慧与优雅,通过非衬线字体展现现代感和清晰性,共同构建了一个充满活力和前瞻性的品牌形象。
2025-01-23
目前最前沿的ai服装模特app
目前较为前沿的 AI 服装模特相关的应用有: Stitch Fix 是一家服装公司,已使用 AI 向客户推荐特定服装,并正在尝试使用 DALLE 2 根据客户对颜色、面料和款式的偏好创建服装可视化。 InterAlia 可以帮助搭配服装。 在小红书上,有通过 AI 制作服装如 AI 小绿裙实现变现的案例,新手可用 mewxai 或幻火来制作,熟练者可用 sd 或 mj 制作。 此外,还有用 AI 定制萌娃头像等相关应用。
2025-01-06
AL最新前沿
以下是 AI 领域的一些最新前沿信息: 2024 年 2 月第一周: Maimo:能从任何内容中提取要点。 Jellypod:可将订阅内容变成播客。 ARTU:能汇总和总结内容。 Lepton Search:用 500 行代码构建的 AI 搜索工具。 VectorShift:AI 自动化应用构建平台。 Findr:AI 搜索您所有软件中的内容。 Recraft:AI 帮助创建平面内容和矢量标志。相关链接:,日期:2024/02/01。 2024 年 1 月第四周: 扎克伯格宣布 Meta 致力于实现 AGI,将两大 AI 研究团队 FAIR 和 GenAI 合并,并投入超 90 亿美元向英伟达采购超 34000 张 H100 显卡,预计 24 年底 Meta 的 GPU 算力达 60 万个 H100。 今年英伟达总的 H100 出货量将有 15 万张,Meta 采购量占 1/5。 Meta 正在开发名为 Llama 3 的大语言模型,以提升代码生成和逻辑推理能力。 扎克伯格推动开源的通用人工智能开发方式,这也是大家关注其进展和 Llama3 的原因。相关链接:,日期:2024/01/23。
2025-01-01
前沿AI硬件
以下是关于前沿 AI 硬件的相关信息: 由郎瀚威 Will 发起的 GenAI 硬件榜单: 定义:利用 GenAI 技术(主要是 LLM),与音频生成、翻译、视觉采集并解读相结合,以可穿戴为主逐步渗透的新品类硬件,以 Meta 雷朋眼镜为代表。 本期情况:未收录较大的 GenAI 硬件如 AI PC、AI 手机,以可穿戴、AI 助理相关硬件为起点。 榜单受众:GenAI 硬件创始人、投资人、从业者等。 榜单标的:以北美市场的视角,销量、影响力为主。 榜单初心:随着 Meta 眼镜的成功,GenAI 硬件爆发在即,每月从多角度围观这一现象,旨在给创业者提供参考。 本次更新(9.19): 更新亚马逊销量、独立站流量、新品发布、融资信息,排序标准从媒体综合指数改为 Tiktok 热度。 完善挂件、戒指、眼镜等分类榜数据。 榜单目录:包括 GenAI 硬件北美公开销量榜、GenAI 硬件亚马逊销量榜等共 15 个重要榜单。更多榜单可文末点击“阅读原文”免费访问或直接访问飞书:https://zw73xyquvv.feishu.cn/wiki/IqcqwTDiYiKttNktBg3cg8HgnLh 。数据来源:google、tiktok、twitter、亚马逊。对于榜单内容有疑问想交流的 GenAI 硬件创始人,或者想合作转载内容的公众号博主,请加微信,或者在本文末留言。 今年很火的几款 AI native 硬件: Rewind Pendant:可穿戴设备,能捕捉现实中所说和听到的内容,进行录音转录、数据加密和本地存储,保障安全性和隐私保护。https://www.rewind.ai/pendant Rabbit R1:新型人工智能驱动的移动设备,通过高级语音命令简化应用程序使用,售价 199 美元,配备 360 度摄像头、触摸屏和 4G 连接。Rabbit OS 基于 Large Action Model(LAM 大动作模型),能处理自然语言并转化为可执行任务,与常见应用交互,支持语音命令执行复杂任务,未来用户可教会其执行特定任务。https://www.rabbit.tech/
2024-12-27
ai视频前沿
以下是关于 AI 视频前沿的相关信息: AI 视频学社: 简介:为方便大家测试学习 AI 视频相关知识和内容而建立,可通过参与每周比赛、观看高手直播分享来快速学习,涵盖 AI 视频和影视创作领域最前沿的知识。 目标: 不定期直播,AI 视频方向高手直播分享。 每周固定 1 次 video battle 视频挑战赛,周一发布主题,周日 18 点前交稿,有奖品。 不定期组织线上或者线下活动。 一起学习 AI 视频最新软件和最新知识,学习图生视频、视频生视频等技巧。 软件教程: 每周一赛: 2024 人工智能报告: 2024 年是 AI 图像视频迅速发展的一年,赛道竞争激烈。 国内:中国开源项目赢得全球粉丝,成为积极开源贡献者。几个模型在个别子领域表现出色,如 DeepSeek 在编码任务中受青睐,阿里巴巴的 Qwen2 系列视觉能力印象深刻,清华大学的 OpenBMB 项目催生了 MiniCPM 项目。 国外:Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,还推出了 Stable Video 3D。OpenAI 的 Sora 能生成长达一分钟的视频,保持三维一致性等。Google DeepMind 的 Veo 将文本和图像提示与视频输入结合生成高分辨率视频。 AI 视频生成产品推荐及实践教学: Runway:年初在互联网爆火,由总部位于旧金山的 AI 创业公司制作,2023 年初推出的 Gen2 代表当前 AI 视频领域前沿模型,能通过文字、图片等生成 4s 左右视频,致力于专业视频剪辑领域的 AI 体验,同时扩展图片 AI 领域能力。目前支持网页、iOS 访问,网页端有 125 积分免费试用额度(可生成约 105s 视频),iOS 有 200 多,两端额度不同步。官方网站:https://runwayml.com/ Gen1 和 Gen2 的区别和使用方法:Gen1 的主要能力有视频生视频、视频风格化、故事版、遮罩等,仅支持视频生视频是与 Gen2 的最大差异。Gen1 使用流程: Gen1 能力介绍:https://research.runwayml.com/gen1 Gen1 参数设置:https://help.runwayml.com/hc/enus/articles/15161225169171 学习视频:https://youtu.be/I4OeYcYf0Sc
2024-12-26
目前最前沿的应用在游戏领域的AI技术点是什么,包括游戏开发过程中的成本降低、效率提升,包括游戏内容生成,包括游戏后期运营推广。介绍技术点的技术逻辑以及技术细节。
目前在游戏领域应用的前沿 AI 技术点主要包括以下几个方面: 1. 利用 AIGC 技术实现游戏产业的生产力革命: 降低开发成本:借助人工智能的内容创作工具,如生成新的游戏内容(地图、角色和场景)、驱动游戏中的非玩家角色(NPC)、改进游戏的图像和声音效果等,能够缩减游戏开发的成本。 缩短制作周期:例如通过程序化内容生成,包括利用人工智能生成文字、图像、音频、视频等来创作游戏剧本、人物、道具、场景、用户界面、配音、音效、配乐、动画和特效等,从而减少游戏开发时间。 提升游戏质量和带来新交互体验:AIGC 技术为游戏带来不同以往的新体验,甚至创造出新的游戏类型以及新的交互方式。 2. 游戏内容辅助生成: 生成文、生成图、生成 3D 以及生成音乐。应用场景包括游戏策划人和制作人、美术设计师等。 对于工业化的游戏公司,基于 Stable Difussion 的生成能够通过 2D 美术素材的辅助生成提高创业效率 50%,降低 20%80%的成本。 文生图:通过提示词加参数就可以形成 2D 的参考图,适配度高。 图生图:原画师或美术可以使用,用一个线稿或原画,在原画基础上加一些 Prompt 和参数,就可以形成一个效果图和二级的素材。 动画辅助渲染:用 Lora 对角色背景、关键帧进行风格渲染,例如将真人视频渲染成二次元风。 3. 游戏的智能运营: 智能 NPC 互动:保持长期记忆,保持人物个性和对话表现形式,同时满足成本平衡。 客服、攻略的问答、代码和脚本的生成。主要针对游戏的产品经理、运营经理和社区的运营经理。 游戏社区运营:如海外的 Discord,国内的 Fanbook,让更多玩家在游戏之外,在社群里面很好地互动,基于游戏的美术素材进行二创、查询攻略和使用智能客服。 这些技术的技术逻辑和技术细节如下: 1. AIGC 技术:基于大语言模型和扩散模型,通过机器学习、强化学习等先进技术进行训练,能够理解和生成各种游戏相关的内容。 2. 游戏内容辅助生成:利用深度学习算法对大量的游戏相关数据进行学习和分析,从而能够根据给定的提示或参数生成相应的游戏内容。 3. 智能运营方面:通过构建智能模型,对玩家的行为和需求进行分析和预测,从而提供个性化的服务和互动。
2024-12-22
ai绘画与视频
以下是关于 AI 绘画与视频的相关信息: AI 绘画: SD 开源 SD3 medium 模型:提供更高质量的 AI 绘画模型。 Midjourney 更新自定义 zoom 和全新个性化指令p:增强了图像缩放和个性化指令的使用。 leonardo.ai 发布新模型 Phoenix:新的基础模型 Phoenix 提供了预览版。 AI 视频: Luma 发布视频生成模型 Dream Machine:强大的视频生成模型,能创造高质量的视频内容。 此外,还有以下相关教学及资料: AI 绘画关键词学社: 1.4 AI 绘画: MJ 官方手册:https://docs.midjourney.com/ Prompt 魔法书:https://aituts.ck.page/promptsbook AIGCTalk Midjourney 学习手册(内部课程资料): eSheep: 如何在 MJ 中保持角色一致性: 工具教程:Dreamina:[https://waytoagi.feishu.cn/wiki/AxZuwUQmEipTUEkonVScdWxKnWd) 同时,还有一些其他的相关资讯: DisPose:开源的跳舞视频生成增强技术,由清华大学与北京大学等组织联合发布的一种可控的人体图像动画方法,输入动作视频参考和人物图像,可以形成新的角色舞蹈视频。 InvSR:开源图像超分辨率模型,提升图像分辨率的开源新工具,只需一个采样步骤(支持 1 5 的材料步骤)即可增强图像,可以高清修复图像。
2025-02-06
哪一款免费的文生视频工具最好用
以下是一些免费的文生视频工具推荐: 1. Pika:是一款出色的文本生成视频AI工具,擅长动画制作,并支持视频编辑。 网址:https://pika.art/ https://discord.gg/pika 教程: 2. SVD:如果熟悉Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由Stability AI开源的video model。 3. Kaiber:这是一款视频转视频AI,能够将原视频转换成各种风格的视频。 网址:https://kaiber.ai/ 4. Hidreamai(国内,有免费额度): 网址:https://hidreamai.com//AiVideo 特点:支持文生视频、图生视频,提示词使用中文、英文都可以,文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成5s和15s的视频 5. ETNA(国内): 网址:https://etna.7volcanoes.com/ 特点:是一款由七火山科技开发的文生视频AI模型,可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在8~15秒,画质可达到4K,最高38402160,画面细腻逼真,帧率60fps。支持中文,时空理解 更多的文生视频的网站可以查看这里: 需要注意的是,这些工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。内容由AI大模型生成,请仔细甄别。
2025-02-06
哪一款文生视频的工具最好用
以下是一些好用的文生视频工具: 1. Pika:非常出色,擅长动画制作,支持视频编辑。 2. SVD:如果熟悉Stable Diffusion,可安装此最新插件,在图片基础上生成视频,由Stability AI开源。 3. Runway:老牌AI视频生成工具,提供实时涂抹修改视频功能,但收费。 4. Kaiber:视频转视频AI,能将原视频转换成各种风格的视频。 5. Sora:由OpenAI开发,可生成长达1分钟以上的视频。 此外,还有以下工具可供选择: 1. PixVerse:人少不怎么排队,还有换脸功能,网址:https://pixverse.ai/ 。 2. GigaStudio:创作者可申请免费会员,文生视频效果好,网址:https://studio.gigaai.cc/ 。 3. Heygen:最近不好注册使用,网址:https://www.heygen.com/ 。 4. Krea:12 月 13 日免费公测,网址:https://www.krea.ai/ 。 5. Moonvalley:网址:https://moonvalley.ai/ 。 6. Mootion:3d 人物动作转视频,网址:https://discord.gg/AapmuVJqxx 。 7. 美图旗下:网址:https://www.miraclevision.com/ 。 8. Neverends:有 2 次免费体验,操作傻瓜,网址:https://neverends.life/create 。 9. SD:Animatediff SVD deforum 。 10. Morph Studio:还在内测,网址:https://app.morphstudio.com/ 。 11. Dreamina:剪映旗下,动作幅度有很大升级,网址:https://dreamina.jianying.com/ 。 12. 七火山:网址:https://etna.7volcanoes.com/?ref=pidoutv.com 。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。 需要注意的是,这些工具均适合于不同的使用场景和需求,您可以根据自己的具体情况进行选择。内容由AI大模型生成,请仔细甄别。
2025-02-06
短视频生成
以下是关于短视频生成的相关信息: 使用video参数创建短视频: 适用范围:仅适用于图像网格,不适用于图像放大。 可搭配的模型版本:版本为 1、2、3、test 和 testp。 示例:Vibrant California Poppies、Botanical Sketch of Fanciful Ferns。 获取视频链接的方法: 1. 添加video 到提示词结尾。 2. 等任务结束后点击表情符号。 3. 选择✉️emoji。 4. 会在私信中收到视频链接。 5. 单击链接在浏览器中查看视频,右键单击或长按下载视频。需注意视频处理时间和存储空间。 使用方法:添加video 到提示词结尾。 腾讯运营利用 ChatGPT 生成短视频:通过 ChatGPT 生成文案,将文案复制到支持 AI 文字转视频的工具内,如腾讯智影的数字人播报功能、手机版剪映的图文成片功能。这类工具让视频制作更轻松上手。 根据视频脚本生成短视频的工具: 1. ChatGPT + 剪映:ChatGPT 生成视频小说脚本,剪映根据脚本自动分析并生成素材和文本框架。 2. PixVerse AI:在线 AI 视频生成工具,支持多模态输入转化为视频。 3. Pictory:AI 视频生成器,用户提供文本描述即可生成相应视频内容。 4. VEED.IO:提供 AI 图像和脚本生成器,帮助从图像制作视频并规划内容。 5. Runway:将文本转化为风格化视频内容,适用于多种场景。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务。 这些工具各有特点,适用于不同场景和需求,能帮助不同人群快速生成吸引人的视频内容。但内容由 AI 大模型生成,请仔细甄别。
2025-02-06
可以生成五分钟以上视频的AI
以下是一些可以生成五分钟以上视频的 AI 工具: 1. GoogleAI 视频 Veo2: 功能点: 能够生成具有高度真实感和物理规律的视频。 对拍摄风格、角度、运动等的语义理解极佳。 能够对运动物体进行超级稳定的多轮材质变化。 能够直接输出 4K 视频。 优势: 高真实质感,让人难以区分真实拍摄和 AI 生成。 遵循视频中的物理规律和现实世界一致。 在特效变换中表现出极高的稳定性。 在 Google 的评测中,多数情况下取得了最优结果。 体验无需长时间排队等待。 2. Sora(由 OpenAI 开发):能够生成长达 1 分钟以上的视频,能根据文字指令创造出逼真且充满想象力的场景,视频中的人物和背景具有较高的一致性和稳定性。 3. 其他工具: Pika:非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-05
可以生成五分钟以上视频的AI
以下是一些可以生成五分钟以上视频的 AI 工具: 1. GoogleAI 视频 Veo2: 能够生成具有高度真实感和物理规律的视频,对拍摄风格、角度、运动等的语义理解极佳。 可以对运动物体进行超级稳定的多轮材质变化,能够直接输出 4K 视频。 具有高真实质感,遵循物理规律,稳定性强,在评测中多数情况下取得最优结果,且体验无需长时间排队等待。 2. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 3. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,由 Stability AI 开源。 4. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 5. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 6. Sora(OpenAI):能够根据文字指令创造出逼真且充满想象力的场景,生成长达 1 分钟的超长视频,一镜到底,视频中的人物和场景具有较高的一致性和稳定性。 更多的文生视频的网站可以查看: 需注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-05