以下是一些关于 AI 视频模型的排名信息:
此外,国内如混元、阶跃等模型开源,通义万象即将开源,开源有利于形成更好更强的生态。测评活动会联合多位小伙伴对 AI 模型进行测评,并根据结果了解模型的偏好和能力,榜单会在微信公众号发布且定期更新。
腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。今天,人又在腾讯混元发布会的现场。上个月5号,他们宣布开源大语言模型混元Large和3D大模型Hunyuan3D-1.0。仅仅一个月时间,他们又从深圳奔赴北京,邀请了一些老朋友,又开了一次私密的闭门会。而这一次的项目,就是被N多人期待了很久的,腾讯混元视频生成模型。同样,现场宣布,直接,开源。腾讯也活成了,马斯克心中,那个OpenAI的模样。聊聊这个腾讯混元的AI视频模型,我已经先行测试了一周,跑了几百个case。先说结论:偏科战神,强的部分强到没边,弱的地方也急需优化,但是瑕不掩瑜,综合来看,闭源模型中排在T1附近,开源AI视频中,无可争议的T0。开源地址:https://github.com/Tencent/HunyuanVideo普通用户也可以去腾讯元宝APP,进入AI应用,就能看到这个AI视频了。可能普通用户需要资格申请,但是以腾讯的速度,应该非常快,看了群友的反馈,有的申请了不到一会就拿到了体验资格。我先放几个我跑的Case,再来细说。很有意思,很特别的模型。如果让我来总结混元的3个特点,那就是:超强的真实质感,很强的语义理解,可以切换镜头。一个一个来说。
AI视觉模型的测评与分享模型测评方式:利用工具对市场上主流的文生图、文生视频和图生视频模型,基于同一提示词生成的效果进行对比打分,生成榜单。视频生成逻辑:AI视频生成逻辑是多张图片快速播放,首尾帧是给定第一张和最后一张图片让AI倒推中间情况,单帧则是从首帧或尾帧开始倒推。测评团队支持:测评团队提供了很多支持,上线模型效率高,能及时跟进新模型。红包与交流群:建立飞书群,群满500人和1000人分别发666和888红包,群内可进行模型交流。全新AI整合计划第八期模型测评活动活动流程介绍:活动链接置于知识库首页,邀请20位创作者测评和发布,通过上下左右键进行模型两两随机PK,先由创作者分享模型特性及代表作。创作者模型排行:二金老师分享了自己对市面上10个主流生成模型的排行,前三名在其看来不分伯仲,不同模型在不同场景各有优缺点,如IMAGEN 3真实感好、midjourney风格化和美学出色但指令遵从稍差等。现场互动测评:通过准备的三组提示词进行现场测试,让大家猜测不同模型生成的图的效果,如丘比特雕像场景中,2和4呼声较高,2是midjourney,4是可图。
AI模型的评测与分析豆包模型表现出色:豆包在图生图方面效果良好,其美感度较高,在中文模型中遥遥领先。Request模型受青睐:Request模型自某种风格出圈后很火,在国外模型中表现出色,甚至超过了Midjourney。Luma模型表现意外:Luma在图生图方面表现不错,曾是第一个有出色转场效果的模型,在本次评测中是一匹黑马。Pixverse文生视频领先:在文生视频的评测中,Pixverse获胜率达70%,表现出乎意料。Midjourney表现未达预期:尽管Midjourney常用,但在本次评测中图生图的排行未居前列。AI模型的测评与分享模型性能各异:不同AI模型在文生视频和图生视频方面表现不同,如VEO前半段效果真实但易切换镜头,可林效果好但价格贵等。榜单更新发布:对多种AI模型的表现进行测评,形成榜单并在微信公众号发布,且会定期更新。开源模型情况:国内如混元、阶跃等模型开源,通义万象即将开源,开源有利于形成更好更强的生态。测评活动开展:联合20位小伙伴对AI模型进行测评,根据测评结果了解模型的偏好和能力,后续还将经常举办类似测评。