Chat with Wiki - 文生图模型打分的排行榜

Answer

以下是文生图模型的打分排行榜（从高到低）：

文生图模型：
- Imagen 3：真实感满分，指令遵从强。
- Recraft：真实感强，风格泛化很好，指令遵从较好（会受风格影响）。
- Midjourney：风格化强，艺术感在线，但会失真，指令遵从较差。
- 快手可图：影视场景能用，风格化较差。
- Flux.1.1[Pro]：真实感强，需要搭配 Lora 使用。
- 文生图大模型 V2.1L（美感版）：影视感强，但会有点油腻，细节不够，容易糊脸。
- Luma：影视感强，但风格单一，糊。
- 美图奇想 5.0：AI 油腻感重。
- 腾讯混元：AI 油腻感重，影视感弱，空间结构不准。
- SD 3.5 Large：崩。
文生视频模型：
- 海螺：语意遵循不错，模型解析有待提高，自带电影滤镜，但有些用力过猛，得益于海量的影视数据。
- 可灵 1.5：颜色失真，缺少质感，偏科严重，物理规律和提示词遵循较强。
- 智谱：语意遵循，质感较差，画质一言难尽。
- mochi：动态丰富，想象力丰富，美学质感较好。
- pd 2.0 pro：PPT 效果，训练数据较少，但是联想启发性很好。
- runway：空间感强，语意遵循较差，流体效果一绝。
- Seaweed 2.0 pro：质感略弱于可灵 1.5，整体感觉师出同门。
- sora：运镜丰富，物理逻辑混乱。
- Pixverse v3：动态稳，丝滑，整体美学强于可灵 1.5。
- luma 1.6：语意遵循差，提示词随便，动起来算我输。

Content generated by AI large model, please carefully verify (powered by aily)

References

|排序（从高到低）|模型|特点（优缺）||-|-|-||1|Imagen 3|真实感满分，指令遵从强||2|Recraft|真实感强，风格泛化很好，指令遵从较好（会受风格影响）||3|Midjourney|风格化强，艺术感在线，但会失真，指令遵从较差||4|快手可图|影视场景能用，风格化较差||5|Flux.1.1[Pro]|真实感强，需要搭配Lora使用||6|文生图大模型V2.1L（美感版）|影视感强，但会有点油腻，细节不够，容易糊脸||7|Luma|影视感强，但风格单一，糊||8|美图奇想5.0|AI油腻感重||9|腾讯混元|AI油腻感重，影视感弱，空间结构不准||10|SD 3.5 Large|崩|

文生视频

|排序（从高到低）|模型|特点（优缺）||-|-|-||1|海螺|语意遵循不错，模型解析有待提高，自带电影滤镜，但有些用力过猛，得益于海量的影视数据||2|可灵1.5|颜色失真，缺少质感，偏科严重，物理规律和提示词遵循较强||3|智谱|语意遵循，质感较差，画质一言难尽||4|mochi|动态丰富，想象力丰富，美学质感较好||5|pd 2.0 pro|PPT效果，训练数据较少，但是联想启发性很好||6|runway|空间感强，语意遵循较差，流体效果一绝||7|Seaweed 2.0 pro|质感略弱于可灵1.5，整体感觉师出同门||8|sora|运镜丰富，物理逻辑混乱||9|Pixverse v3|动态稳，丝滑，整体美学强于可灵1.5||10|luma 1.6|语意遵循差，提示词随便，动起来算我输|

智能纪要：02-24 | AI视觉模型测评排行榜 2025年2月24日

[25:57](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1557000)文生图模型测评相关分享及互动准备本章节二金先介绍Flux 1.1真实感强，配Lora效果不错可进T1，提到文生图大模型V2.1L即吉梦2.1。接着准备与大家互动，展示三套提示词猜效果最佳的图，还说明以10个模型为主，之后要先看海外的request和IMAGEN 3，并给出第一组提示词内容。[28:36](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1716000)分享十张图并探讨2和4的优缺点，邀猜对应模型本章节二金展示10张类似21世纪初摄影风格的图，每张展示约5秒，让大家在评论区扣数字表达喜好。最终呼声集中在2和4。二金分析两张图优缺点，认为4雕像材质更准但眼睛处理欠佳，2动效和场景好但丘比特像真人，理想形象是把2的人物换成雕像。最后让大家猜2和4分别出自哪个模型。[31:41](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1901000)二金分享图像生成工具对比及IP风格测试感受本章节二金先介绍二指midjourney，4指可图。接着进入第二个场景，展示十张测试对IP响应及二次元动漫风格表现的图，询问大家喜好。多数人喜欢第四张，二金个人最喜欢第十张，因其准确还原IP形象，响应提示词好，散景等效果佳。二金排出第一名是10，第二名是4，并解释了原因。