AI 降重可以从以下几个方面理解:
所以,AI在运作过程中,是先进行了展开——升维,然后进行了收敛——降维。那么我们就有了一个看上去颇具哲学意味的描述——AI通过一种充满不确定性的操作,实现了一种符合人类预期的确定性的生成,并通过对语言的升维操作,完成了对世界级知识的降维导出。
[heading3]运用辩证法的核心原理,获得与AI互动的“原生方法”在信息论中,升维通常指的是增加数据集中的变量或特征的数量。这种增加可以提高对系统或现象的描述能力,从而进行更细致和全面的分析。通过引入更多相关和有信息价值的特征,升维可能有助于提高对系统行为的理解和预测的准确性。但同时,升维也可能增加数据的复杂性并占用更多处理数据所需的计算资源。降维通常涉及减少数据集中的变量或特征数量,以简化对系统的描述。这种简化有助于减少数据的复杂性并降低处理难度,同时可能提高数据处理的效率。降维的目标是在尽可能保留关键信息的同时,减少不必要或冗余的信息。但不恰当的降维却可能导致重要信息的丢失,从而弱化系统对行为的理解。这是需要权衡的。一般来说,通过探索和理解更多的维度——升维的过程,我们可以更好地实现从特殊到一般的转化——降维的过程。这个过程体现了哲学、科学和认知过程中的一种普遍方法,即通过深入探索和理解事物的各个方面来找到那些真正重要或本质的特征,从而实现对事物的简化和概括。而AI的核心工作之一则是理解人类语言和现实世界的问题,并将其“转移”成计算机所擅长的计算问题。如果我们从转移、升维和降维的角度来看ChatGPT这类AI的运作过程,可以得到以下结论。转移体现在AI将文本分类、语义理解、实体抽取、代码生成、文本翻译、文本摘要等诸多自然语言处理(NLP)领域中的问题转变成了文本生成问题。
[heading3]运用辩证法的核心原理,获得与AI互动的“原生方法”升维体现在ChatGPT这类AI具体运作的过程中,从词嵌入开始到深层的神经网络处理,实际上都是从非常多的维度对所输入的字、词、句子进行“展开概念”的操作。实际上,在词嵌入的操作里,一个字(token)实际上被放到了几千个维度里进行定义。在后续的神经网络处理中,在每一层都会反复探索它用于表达各种语义的可能性。降维体现在文本生成阶段,大语言模型需要将其对文本的高维理解转化成实际的文本输出。大语言模型在其内部的高维空间中,通过学习到的概率分布,评估上下文和先前生成的文本,然后从可能的字词池中选择最合适的字词来继续生成文本。随着大语言模型逐步构建出句子,这一高维的数据和理解被“压缩”成用户可以理解的清晰且连贯的文本输出。因此,降维过程实际上是一个从潜在的高维复杂性表达中提取出精准、明确表达的过程,这一过程体现了大语言模型如何将其深度理解并转换成人类语言。