识别手写字体通常会涉及到神经网络的应用。对于印刷体图片的识别,可能会先将图片变为黑白、调整大小为固定尺寸,然后与数据库中的内容进行对比得出结论。但这种方法在面对多种字体、不同拍摄角度等复杂情况时存在局限性,因为它本质上是通过不断增加和完善规则来解决问题,这在处理未知规则时是不可行的。
神经网络专门处理未知规则的情况,例如手写体识别。其发展得益于生物学研究的支持,并在数学上提供了方向。
在字体测试方面,会使用多组提示词来测试不同类型字体的识别及输出能力,比如分别测试衬线体、非衬线体、手写体的“Hello”文本,或者在不同的文本载体(如打印纸、名片、贺卡)上用不同特色字体书写内容,以及在不同场景中用不同形容词形容特定字体(如活跃海报、赛博朋克、复古风)。
在一些相关设置中,如果文字识别度低,可以提高 ControlNet 权重,若想让文字和背景融合更好则降低权重。
如果识别一个印刷体图片,我可能会怎么做神经网络解决的是未知规则的处理。先把图片都变成黑白大小变成固定尺寸和数据库的东西对比得出结论然而,这种情况过于理想化。不仅存在多种字体,即使对于印刷体,不同的拍摄角度也引入了多种例外情况。虽然存在图形算法进行矫正,但整体方法仍然是基于不断添加规则。这种方法本质上是试图通过不断增加和完善规则来解决问题,这显然是不可行的。虽然这种方法可以解决象棋的问题,但对围棋来说就非常困难了。围棋的每个节点有三种可能状态:白、黑或空,加上不同节点间状态的组合,现有的资源无法应对。神经网络专门处理未知规则的情况。将图片转换为黑白,调整图片至固定尺寸,与数据库中的内容进行对比,最终得出结论。神经网络的发展得益于生物学研究的支持,并且在数学上提供了一种方向,使其能够处理未知的情况,如手写体识别。关于这部分内容,非常建议看《这就是ChatGPT》这本书,它的作者是被称为”在世的最聪明的人”,研究神经网络几十年,创作了Mathematica、Wolfram等备受推崇的软件,这本书最特别之处还在于,导读序是美团技术学院院长刘江老师回顾了整个AI技术发展的历史,对于了解AI,大语言模型计算路线的发展,起到提纲挈领的作用,非常值得一读。本文写作过程中得到了[byzer-llm](https://github.com/allwefantasy/byzer-llm)作者祝威廉的大力支持,在此感谢。byzer-llm选择了一个非常特别的技术路线,在大模型时代显得尤为重要。
使用三组提示词,分别测试不同类型字体的识别及输出能力。要求在一张纸上画出【手写体(花体)、印刷衬线体、印刷无衬线体】的相应文字"Hello";给定文本载体【打印纸、名片、贺卡】,要求用不同的特色字体书写内容;给定不同场景,要求在场景里出现"AICan"字样,并用不同形容词来形容字体【活跃海报、赛博朋克、复古风】第一组测试衬线体、非衬线体、手写体的"Hello"文本(图1)A piece of paper on the table.A black word on paper,written in typographic serif"Hello!"--ar 16:9--v 6.0(图2)A piece of paper on the table.A black word on paper,written in typographic sans serif"Hello!"--ar 16:9--v 6.0(图3)A piece of paper on the table.A black word on paper,written in cursive"Hello!"--ar 16:9--v 6.0第二组测试打印纸和Good Morning;名片与AICan;贺卡与Happy Birthday(图1)There is paper and printer on the table.Print out the words"Good morning"in black,office environment.--ar 16:9--v 6.0(图2)There is a business card on the table.The business card has a black word"AICan"written on it,which is full of design.--ar 16:9--v 6.0(图3)There is a white greeting card on the table.The words"Happy Birthday"were written on the card in black pen.Simple and warm.--ar 16:9--v 6.0
(如果文字识别度低,提高cn权重,想让文字和背景融合的更好降低权重)自己可以试试其他的cn模型预处理器:invert(from white bg&black line)模型:control_v11f1p_sd15_depth权重:0.85手写黑白字体设计:(左边2张:ཉི叶承欢)(最右边:Zoefoxxxy🦊)[heading2]作业帖在下面的评论区❤️,[content]有问题也可以在评论区回复,看见会回复的。