通用人工智能素养是一个较为宽泛的概念,涵盖多个方面。
从相关报告来看,通用人工智能的能力包括推理、规划、解决问题、抽象思维、理解复杂思想、快速学习和从经验中学习等。例如,GPT-4 的主要优势在于其出色的自然语言能力,能生成流畅连贯的文本,进行多种文本操作,还能理解复杂思想。在编程和数学能力方面,这是理性思考和抽象思维能力的体现。
在法律和医学等专业领域,GPT-4 也展现出一定的普遍推理能力。同时,通用人工智能素养的提升还包括促进对从事人工智能开发、操作和使用人员的素养提升,促进人工智能系统设计的包容性和多样性,评估并最大限度减少人工智能系统的影响,以及预防其对弱势人员或群体的负面影响等。
Mathematical abilities在本节中,我们评估了GPT-4在表达数学概念、解决数学问题以及面对需要数学思维和模型构建的问题时的能力。我们展示了相对于以前的LLMs,甚至是专门针对数学进行了优化的模型(如Minerva)而言,GPT-4在这个领域也有了一个飞跃。然而,GPT-4仍然远远不及专家的水平,没有进行数学研究所需的能力。读者应当谨慎看待本节中的结果——正如我们将看到的,GPT-4可以回答困难的(实际上是具有竞争性的)高中数学问题,并且有时可以就高级数学话题进行有意义的对话。然而,它也可能犯非常基本的错误,有时产生不连贯的输出,这可能被解释为缺乏真正的理解,它的数学知识和能力可能以看似随机的方式依赖于上下文。虽然使用与评估人类能力相同的标准(例如解决标准考试问题)来评估GPT-4的数学能力很有诱惑力,但考虑到上述情况,这将无法完全描绘模型的能力。为了真正理解模型的能力,我们需要将「数学能力」分解为各种子组件,并评估GPT-4在每个领域的表现。在本节中,我们将使用具体的示例和讨论来说明模型的优点和缺点,并试图找出这些差距可能的根本原因。为了给读者一个对GPT-4在解决数学问题方面的表现的第一印象,请参考下图中的例子。根据上述问题,需要首先想出正确的年度人口变化表达式,使用它得出一个递推关系式,然后解决这个由两个方程组成的方程组。GPT-4成功地得出了解决方案并提出了一个(大多数情况下)正确的论证。相比之下,经过多次独立尝试,ChatGPT始终未能实现上述任何步骤,产生了一个荒谬的论证,结果得出了错误的答案。
我们在几个选定的主题上执行上述方法,这些主题大致涵盖了1994年智能定义中给出的不同能力,这是一种非常通用的心理能力,其中包括推理、规划、解决问题、抽象思维、理解复杂思想、快速学习和从经验中学习的能力。1.GPT-4的主要优势在于其掌握了无与伦比的自然语言能力。它不仅能够生成流畅、连贯的文本,还能以多种方式理解和操作文本,例如总结、翻译或回答非常广泛的问题。此外,我们所说的翻译不仅涉及不同自然语言之间的翻译,还涉及到语调和风格的翻译,以及跨领域(如医学、法律、会计、计算机编程、音乐等)的翻译,参见下图中的柏拉图对话——这些技能清楚地表明,GPT-4能够理解复杂的思想。我们在第二部分进一步探讨了GPT-4在多模态和跨学科方面的组合技能,还在第7部分给出了一些关于语言的实验。2.编程和数学能力,这是理性思考和抽象思维能力的象征。我们分别在第3部分和第4部分探讨了GPT-4在这些领域的能力。然而,与本文的所有其他部分一样,我们只是对这些主题进行了浅尝辄止,而对于GPT-4在这些领域的表现,可以(也将会)撰写整篇论文。此外,我们还选择了几个其他专业领域来展示GPT-4的普遍推理能力,例如医学或法律。我们对美国医学执照考试步骤1、2和3的多项选择部分进行了初步测试(请参见[Ope23]),每个部分的准确率约为80%。类似的初步测试显示,GPT-4在多州律师考试中的能力高于70%。我们注意到,最新一代LLM(例如Google的PaLM[LAD+22、SAT+22]、GPT-3.5在法律方面的表现[BIK22])已经表现出了这些领域的人类水平能力的出现。我们的研究方法与这些工作不同,正如我们之前所解释的。
通用人工智能模型经济经营者的程序性权利2019/1020号条例第18条通过类推而适用于通用人工智能模型的提供者,但不影响本条例中规定的更具体的程序性权利。(a)欧洲可信人工智能伦理准则中所预见的适用的要件;(b)评估并最大限度地减少人工智能系统的影响,包括节能编程和高效设计、训练和使用人工智能的技术;(c)促进对人工智能素养,特别是对从事人工智能开发、操作和使用的人员的素养提升;(d)促进人工智能系统设计的包容性和多样性,包括建立包容性和多样性的开发团队,促进利益相关方参与这一进程;(e)评估和预防人工智能系统对弱势人员或群体的负面影响,包括对残疾人的无障碍性以及对性别平等的负面影响。3.行为守则可由人工智能系统的个体提供者或部署者,或由为其代表的组织,或由两者共同拟订,包括在部署者和任何有关的利益相关方及其代表组织,包括公民社会组织和学术界的参与下拟订。考虑到相关系统的预期目的的相似性,行为守则可涵盖一个或多个人工智能系统。4.在鼓励和促进制定行为守则时,人工智能办公室和成员国应考虑到包括初创企业在内的小微型企业的具体利益和需要。第96条