目前,一些 AI 模型已经能够实现图片生成文字的功能。
例如,MidJourney 已经具备了这一能力。
在 Stable Diffusion(SD)模型中,SDXL 可以直接生成带有文字的图片,能更好地识别自然语言,支持使用类似“XXX with the words 'XXX' written on it”这样的句式生成带有文字的图片,不过中文表现仍有待提升。
对于 Midjourney(MJ),使用英文文本输入,在提示词中将需要生成的文本使用双引号“text”包裹,输出的图片中便能出现所要求的文字。但在当前测试中,带文字的图片生成并非百分百优质,其效果会受到文本量、文字在画面中的占比、其他提示词数量以及画面复杂程度等因素的影响。
需要注意的是,这些系统可能存在一些问题,比如围绕具有内置偏见的模型构建,可能在法律和道德方面存在一定争议,法律规则也尚不明确。
提示词:“受梵高启发的运动鞋时尚摄影”-每个模型创建的第一张图像一些需要担心的事情:这些系统是围绕基于互联网数据训练而具有内置偏见的模型构建的(例如,如果您要求它创建企业家的图片,您可能会看到更多以男性而不是女性为特色的图片,除非您指定“女性企业家”),您可以使用[此浏览器](https://huggingface.co/spaces/society-ethics/DiffusionBiasExplorer)在工作中看到这些偏见。这些系统还以不透明的方式对互联网上的现有艺术进行了学习,并且可能在法律和道德上存在问题。虽然从技术上讲,你拥有所创建图像的版权,但法律规则仍然模糊不清。此外,目前为止,它们还不能创建文本,只是一堆看起来像文本的东西。但MidJourney已经搞定了。
[title]【SD】向未来而生,关于SDXL你要知道事儿[heading1]#SDXL模型的优势[heading2]2.更智能的文字和语言识别 在之前的模型中,SD生成的文字全是乱码,无论是中文还是英文都不太行。[content]而现在,sdxl可以直接生成带有文字的图片。你可以使用XXX with the words"XXX” written on it这样的句式来生成带有文字的图片,虽然中文还是不行,但是英文表现还不错。比如,在头盔上写“future”的单词。比如,在广告牌上写“SDXL”。能进行文字书写,这绝对是AI领域的一次史诗级的更新。并且,SDXL能更好地识别自然语言,不再需要加太多的质量关键词了,它支持只用很少的语句就能生成质量很高的图片,以后我们可以更专注在内容创作上,而不必烦恼那些琐碎的废话了。比如,描述一个在太空漫步的宇航员。
MJ使用英文文本输入,其对英语提示词的识别效果进一步变好,在提示词中将需要生成的文本使用双引号“text”包裹,输出的图片中便能出现所要求的文字!当然,在当前测试的一些案例中,带文字的图片生成仍然不能百分百优质,这也取决于文本量的多少、文字在画面中的占比以及其他提示词数量、画面复杂程度等等。为了进一步探究V6的文字生成能力,开展了进一步的实践测试: