文生图大模型排名

Answer

以下是文生图大模型的排名（从高到低）：

Imagen 3：真实感满分，指令遵从强。
Recraft：真实感强，风格泛化很好，指令遵从较好（会受风格影响）。
Midjourney：风格化强，艺术感在线，但会失真，指令遵从较差。
快手可图：影视场景能用，风格化较差。
Flux.1.1[Pro]：真实感强，需要搭配 Lora 使用。
文生图大模型 V2.1L（美感版）：影视感强，但会有点油腻，细节不够，容易糊脸。
Luma：影视感强，但风格单一，糊。
美图奇想 5.0：AI 油腻感重。
腾讯混元：AI 油腻感重，影视感弱，空间结构不准。
SD 3.5 Large：崩。

Content generated by AI large model, please carefully verify (powered by aily)

References

|排序（从高到低）|模型|特点（优缺）||-|-|-||1|Imagen 3|真实感满分，指令遵从强||2|Recraft|真实感强，风格泛化很好，指令遵从较好（会受风格影响）||3|Midjourney|风格化强，艺术感在线，但会失真，指令遵从较差||4|快手可图|影视场景能用，风格化较差||5|Flux.1.1[Pro]|真实感强，需要搭配Lora使用||6|文生图大模型V2.1L（美感版）|影视感强，但会有点油腻，细节不够，容易糊脸||7|Luma|影视感强，但风格单一，糊||8|美图奇想5.0|AI油腻感重||9|腾讯混元|AI油腻感重，影视感弱，空间结构不准||10|SD 3.5 Large|崩|

智能纪要：02-24 | AI视觉模型测评排行榜 2025年2月24日

[25:57](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1557000)文生图模型测评相关分享及互动准备本章节二金先介绍Flux 1.1真实感强，配Lora效果不错可进T1，提到文生图大模型V2.1L即吉梦2.1。接着准备与大家互动，展示三套提示词猜效果最佳的图，还说明以10个模型为主，之后要先看海外的request和IMAGEN 3，并给出第一组提示词内容。[28:36](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1716000)分享十张图并探讨2和4的优缺点，邀猜对应模型本章节二金展示10张类似21世纪初摄影风格的图，每张展示约5秒，让大家在评论区扣数字表达喜好。最终呼声集中在2和4。二金分析两张图优缺点，认为4雕像材质更准但眼睛处理欠佳，2动效和场景好但丘比特像真人，理想形象是把2的人物换成雕像。最后让大家猜2和4分别出自哪个模型。[31:41](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1901000)二金分享图像生成工具对比及IP风格测试感受本章节二金先介绍二指midjourney，4指可图。接着进入第二个场景，展示十张测试对IP响应及二次元动漫风格表现的图，询问大家喜好。多数人喜欢第四张，二金个人最喜欢第十张，因其准确还原IP形象，响应提示词好，散景等效果佳。二金排出第一名是10，第二名是4，并解释了原因。

文生图

一幅令人惊叹的鱼眼视角画面，孙悟空高高悬于上海现代天际线之上，双臂伸展，仿佛在拥抱下方的城市。画面捕捉到上海标志性摩天大楼的宏伟气势，其中包括东方明珠塔和上海中心大厦，整体笼罩在充满动感与超现实的单色色调之中。孙悟空身着传统的天兵战甲，在广阔多云的天空映衬下，其轮廓显得豪迈而有力。画面的光影营造出强烈的对比，展现出神话般的宏大感。创作手法：运用鱼眼镜头效果、电影级构图、黑白色调、动态视角、高度精细的纹理、史诗般的氛围、超现实写实风格以及叙事性取景。腾讯混元lumaRecraft文生图大模型V2.1L（美感版）美图奇想5.0midjourney快手可图Flux.1.1[pro]Stable Diffusion 3.5 LargeImagen 3网页版