Home/Question List/Question Detail

AI生图模型排名

Answer

以下是一些常见的 AI 生图模型排名（从高到低）：

Imagen 3：真实感满分，指令遵从强。
Recraft：真实感强，风格泛化很好，指令遵从较好（会受风格影响）。
Midjourney：风格化强，艺术感在线，但会失真，指令遵从较差。
快手可图：影视场景能用，风格化较差。
Flux.1.1[Pro]：真实感强，需要搭配 Lora 使用。
文生图大模型 V2.1L（美感版）：影视感强，但会有点油腻，细节不够，容易糊脸。
Luma：影视感强，但风格单一，糊。
美图奇想 5.0：AI 油腻感重。
腾讯混元：AI 油腻感重，影视感弱，空间结构不准。
SD 3.5 Large：崩。

此外，在相关的测评中：

豆包模型在图生图方面效果良好，美感度较高，在中文模型中遥遥领先。
Request 模型自某种风格出圈后很火，在国外模型中表现出色，甚至超过了 Midjourney。
Luma 在图生图方面表现不错，曾是第一个有出色转场效果的模型，在本次评测中是一匹黑马。
Pixverse 在文生视频的评测中获胜率达 70%，表现出乎意料。
Midjourney 常用，但在本次评测中图生图的排行未居前列。

Content generated by AI large model, please carefully verify (powered by aily)

References

智能纪要：02-24 | AI视觉模型测评排行榜 2025年2月24日

[25:57](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1557000)文生图模型测评相关分享及互动准备本章节二金先介绍Flux 1.1真实感强，配Lora效果不错可进T1，提到文生图大模型V2.1L即吉梦2.1。接着准备与大家互动，展示三套提示词猜效果最佳的图，还说明以10个模型为主，之后要先看海外的request和IMAGEN 3，并给出第一组提示词内容。[28:36](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1716000)分享十张图并探讨2和4的优缺点，邀猜对应模型本章节二金展示10张类似21世纪初摄影风格的图，每张展示约5秒，让大家在评论区扣数字表达喜好。最终呼声集中在2和4。二金分析两张图优缺点，认为4雕像材质更准但眼睛处理欠佳，2动效和场景好但丘比特像真人，理想形象是把2的人物换成雕像。最后让大家猜2和4分别出自哪个模型。[31:41](https://waytoagi.feishu.cn/minutes/obcnwxo711l95327iu85g6xn?t=1901000)二金分享图像生成工具对比及IP风格测试感受本章节二金先介绍二指midjourney，4指可图。接着进入第二个场景，展示十张测试对IP响应及二次元动漫风格表现的图，询问大家喜好。多数人喜欢第四张，二金个人最喜欢第十张，因其准确还原IP形象，响应提示词好，散景等效果佳。二金排出第一名是10，第二名是4，并解释了原因。

文生图

|排序（从高到低）|模型|特点（优缺）||-|-|-||1|Imagen 3|真实感满分，指令遵从强||2|Recraft|真实感强，风格泛化很好，指令遵从较好（会受风格影响）||3|Midjourney|风格化强，艺术感在线，但会失真，指令遵从较差||4|快手可图|影视场景能用，风格化较差||5|Flux.1.1[Pro]|真实感强，需要搭配Lora使用||6|文生图大模型V2.1L（美感版）|影视感强，但会有点油腻，细节不够，容易糊脸||7|Luma|影视感强，但风格单一，糊||8|美图奇想5.0|AI油腻感重||9|腾讯混元|AI油腻感重，影视感弱，空间结构不准||10|SD 3.5 Large|崩|

智能纪要：02-24 | AI视觉模型测评排行榜 2025年2月24日

AI模型的评测与分析豆包模型表现出色：豆包在图生图方面效果良好，其美感度较高，在中文模型中遥遥领先。Request模型受青睐：Request模型自某种风格出圈后很火，在国外模型中表现出色，甚至超过了Midjourney。Luma模型表现意外：Luma在图生图方面表现不错，曾是第一个有出色转场效果的模型，在本次评测中是一匹黑马。Pixverse文生视频领先：在文生视频的评测中，Pixverse获胜率达70%，表现出乎意料。Midjourney表现未达预期：尽管Midjourney常用，但在本次评测中图生图的排行未居前列。AI模型的测评与分享模型性能各异：不同AI模型在文生视频和图生视频方面表现不同，如VEO前半段效果真实但易切换镜头，可林效果好但价格贵等。榜单更新发布：对多种AI模型的表现进行测评，形成榜单并在微信公众号发布，且会定期更新。开源模型情况：国内如混元、阶跃等模型开源，通义万象即将开源，开源有利于形成更好更强的生态。测评活动开展：联合20位小伙伴对AI模型进行测评，根据测评结果了解模型的偏好和能力，后续还将经常举办类似测评。

Others are asking

AI文生视频

2025-04-20

Ai在设备风控场景的落地

AI 在设备风控场景的落地可以从以下几个方面考虑：法律法规方面：《促进创新的人工智能监管方法》指出，AI 的发展带来了一系列新的安全风险，如对个人、组织和关键基础设施的风险。在设备风控中，需要关注法律框架是否能充分应对 AI 带来的风险，如数据隐私、公平性等问题。趋势研究方面：在制造业中，AI Agent 可用于生产决策、设备维护、供应链协调等。例如，在工业设备监控与预防性维护中，Agent 能通过监测传感器数据识别异常模式，提前通知检修，减少停机损失和维修成本。在生产计划、供应链管理、质量控制、协作机器人、仓储物流、产品设计、建筑工程和能源管理等方面，AI Agent 也能发挥重要作用，实现生产的无人化、决策的数据化和响应的实时化。

2025-04-20

ai视频

以下是 4 月 11 日、4 月 9 日和 4 月 14 日的 AI 视频相关资讯汇总： 4 月 11 日： Pika 上线 Pika Twists 能力，可控制修改原视频中的任何角色或物体。 Higgsfield Mix 在图生视频中，结合多种镜头运动预设与视觉特效生成视频。 FantasyTalking 是阿里技术，可制作角色口型同步视频并具有逼真的面部和全身动作。 LAM 开源技术，实现从单张图片快速生成超逼真的 3D 头像，在任何设备上快速渲染实现实时互动聊天。 Krea 演示新工具 Krea Stage，通过图片生成可自由拼装 3D 场景，再实现风格化渲染。 Veo 2 现已通过 Gemini API 向开发者开放。 Freepik 发布视频编辑器。 Pusa 视频生成模型，无缝支持各种视频生成任务（文本/图像/视频到视频）。 4 月 9 日： ACTalker 是多模态驱动的人物说话视频生成。 Viggle 升级 Mic 2.0 能力。 TestTime Training在英伟达协助研究下，可生成完整的 1 分钟视频。 4 月 14 日：字节发布一款经济高效的视频生成基础模型 Seaweed7B。可灵的 AI 视频模型可灵 2.0 大师版及 AI 绘图模型可图 2.0 即将上线。