以下是文生图模型的打分排行榜(从高到低):
|排序(从高到低)|模型|特点(优缺)||-|-|-||1|Imagen 3|真实感满分,指令遵从强||2|Recraft|真实感强,风格泛化很好,指令遵从较好(会受风格影响)||3|Midjourney|风格化强,艺术感在线,但会失真,指令遵从较差||4|快手可图|影视场景能用,风格化较差||5|Flux.1.1[Pro]|真实感强,需要搭配Lora使用||6|文生图大模型V2.1L(美感版)|影视感强,但会有点油腻,细节不够,容易糊脸||7|Luma|影视感强,但风格单一,糊||8|美图奇想5.0|AI油腻感重||9|腾讯混元|AI油腻感重,影视感弱,空间结构不准||10|SD 3.5 Large|崩|
|排序(从高到低)|模型|特点(优缺)||-|-|-||1|海螺|语意遵循不错,模型解析有待提高,自带电影滤镜,但有些用力过猛,得益于海量的影视数据||2|可灵1.5|颜色失真,缺少质感,偏科严重,物理规律和提示词遵循较强||3|智谱|语意遵循,质感较差,画质一言难尽||4|mochi|动态丰富,想象力丰富,美学质感较好||5|pd 2.0 pro|PPT效果,训练数据较少,但是联想启发性很好||6|runway|空间感强,语意遵循较差,流体效果一绝||7|Seaweed 2.0 pro|质感略弱于可灵1.5,整体感觉师出同门||8|sora|运镜丰富,物理逻辑混乱||9|Pixverse v3|动态稳,丝滑,整体美学强于可灵1.5||10|luma 1.6|语意遵循差,提示词随便,动起来算我输|
[25:57](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1557000)文生图模型测评相关分享及互动准备本章节二金先介绍Flux 1.1真实感强,配Lora效果不错可进T1,提到文生图大模型V2.1L即吉梦2.1。接着准备与大家互动,展示三套提示词猜效果最佳的图,还说明以10个模型为主,之后要先看海外的request和IMAGEN 3,并给出第一组提示词内容。[28:36](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1716000)分享十张图并探讨2和4的优缺点,邀猜对应模型本章节二金展示10张类似21世纪初摄影风格的图,每张展示约5秒,让大家在评论区扣数字表达喜好。最终呼声集中在2和4。二金分析两张图优缺点,认为4雕像材质更准但眼睛处理欠佳,2动效和场景好但丘比特像真人,理想形象是把2的人物换成雕像。最后让大家猜2和4分别出自哪个模型。[31:41](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1901000)二金分享图像生成工具对比及IP风格测试感受本章节二金先介绍二指midjourney,4指可图。接着进入第二个场景,展示十张测试对IP响应及二次元动漫风格表现的图,询问大家喜好。多数人喜欢第四张,二金个人最喜欢第十张,因其准确还原IP形象,响应提示词好,散景等效果佳。二金排出第一名是10,第二名是4,并解释了原因。