以下几种 AI 工具可以绘画出如同真人照片的美女:
需要注意的是,使用 AI 绘画工具时可能会遇到一些问题,比如在独立游戏开发中使用 AI 绘画可能会出现风格不合适、缺乏叙事性、素材有限、泛化性差等情况。但通过不断尝试和优化,如更换 Embedding、CKPT、Lora 等方式,以及进行一些特殊处理,如为引导前景后景区分明显的画专门绘制引导图、对人物朝向做镜像处理等,也能获得较为理想的效果。
[title]2023年历史更新(归档)[heading3]12月14日《[谷歌文生图巅峰之作Imagen 2登场,实测暴打DALL·E 3和Midjourney!](https://waytoagi.feishu.cn/record/Ba32rS8ZkeSuyecnKq9cIJYCnKs)》谷歌刚刚放出了文生图AI模型的巅峰之作[Imagen 2](https://cloud.google.com/blog/products/ai-machine-learning/imagen-2-on-vertex-ai-is-now-generally-available),实测效果逼真细腻,生成的美女图仿佛真人照片,对于提示的还原程度已经打败了DALL·E 3和Midjourney!最强文生图大模型这是要易主了?更新了[辅助工具:放大](https://waytoagi.feishu.cn/wiki/NwHOwbvXzinsrIkTZHvc5uy1naf)[辅助工具:换脸](https://waytoagi.feishu.cn/wiki/XOajwuUWEimuOlk54smcTT6qnzh)[Visual Electric:不需要操心技术的AI绘画网站,只需要发挥创意就行](https://waytoagi.feishu.cn/wiki/IJQLwUEb6in2FjkFtqbcuF6Qnxf)[0.从这里启程](https://waytoagi.feishu.cn/wiki/PFXnwBTsEiGwGGk2QQFcdTWrnlb?table=tblyh76bHrCi4PXq)增加了A16z的趋势图:顶级人工智能网络产品:每月数十亿次访问
我们在鉴别过程中发现,如果只是单纯聚焦于把列宾真正描绘过的「纤夫」们从乌泱泱地挤在伏尔加河边上的「海盗、商人和帮工」的人堆里翻出来,又或是辨明穆夏到底亲自画过哪几位丰腴动人的美女,那得出结论的难度并不高。有的人根据对名画本身风格的了解,做出了选择;有的人能看懂画质与笔触的表现力,一眼识破。尤其对稍稍涉猎过艺术史与设计史论的朋友们来说,这完全是一种调用基础知识储备的操作。[heading2]细节决定成败[content]但当我们把鉴别和名家分开之后,只是单纯判断这幅作品是出自「人类」之手,还是出自AI算法。那鉴别的手段,就从名画知识储备和了解程度,变成了对画面内容的单纯判断。这时候,往往是「细节决定成败」。比如,在「伏尔加河上的帮工」这幅AI列宾中,人物主体的肢体明显存在异常。又比如,穆夏组中,只有真迹才能表现出穆夏所创作的商业招贴画中严谨连续的背景花纹和顺次排列的底纹文字信息。
[title]AI辅助在独立游戏开发中的“踩坑”经验——《玩具帝国》[heading2]二、AI绘画游戏里的科技树图标实在太多了,根本画不过来……在没有AI画画之前,我都不敢想啥时候能把这些玩意填完。AI画画出来之后,我抱着满腔热情去试,结果发现三个严重的问题:•全TM在画二次元,没有适合的风格,想用到游戏里必须自己炼丹。•画出来的画好多都是美少女看镜头,没有叙事性,没法当icon用。•已有素材几乎全是中世纪大胡子男人呆呆站着,图生图不可行,训练出来的泛化性也很差。一开始的规划是:•画出卡通简笔画风格。•资产条件:有98张人像和8张UI,且人像全是男人。•需要能产出带有该画风的具有一定叙事内容的图像,内容形式一定要多元。我尝试了最开始的Embedding:后来换成CKPT(画和训练集里接近的小人已经不错了,但泛化性还是不理想):然后是Lora(好!很接近了!):现在这个版本画人画物画事都很完美了,甚至能从全是大胡子男人的训练集里学会画女人:从中世纪里摘出摩托车:为了引导AI画出前景后景区分明显的画,还专门画了一组引导图。分别是只保留前景、只保留背景、全图共三张图,在Caption里打组:由于训练集中人物朝向太固定,此处额外做了镜像处理。