专门训练 AI 专属模型的人员通常被称为“AI 工程师”或“机器学习工程师”。他们负责设计、开发和优化 AI 模型,以满足特定的应用需求。AI 工程师需要具备深厚的数学和计算机科学知识,以及丰富的机器学习和深度学习经验。他们通常使用各种工具和技术,如 Python、TensorFlow、PyTorch 等,来训练和部署 AI 模型。此外,AI 工程师还需要与其他团队成员合作,如数据科学家、产品经理和开发人员,以确保 AI 模型能够与其他系统和应用程序集成,并为用户提供价值。
Radford和他的合作者给他们创建的模型起的名字是“generatively pretrained transformer”——GPT-1的缩写。最终,这个模型被通称为“生成式AI”。为了建立这个模型,他们收集了7000本未出版的书籍,其中很多都是浪漫、奇幻和冒险类型的书籍,并在Quora问答以及初中和高中考试的数千段文章中对其进行了完善。总之,该模型包含1.17亿个参数或变量。该模型在理解语言和生成答案方面的表现优于之前的所有模型。但最引人注目的结果是,在处理如此大量的数据后,模型能够提供超出其训练的结果,在全新的领域提供专业知识。这些计划外的机器人能力被称为“零样本”。它们仍然令研究人员感到困惑——这也是该领域许多人对这些所谓的大型语言模型感到不安的原因。Radford还记得在OpenAI办公室的一个深夜。“我只是一遍又一遍地说:‘嗯,这很酷,但我很确定它做不了X。’然后我会快速编写一个评估代码,果然,它可以做到X。”
那我们下面会给一个实践的例子,用百亿参数的这种垂直场景大模型,如果训的好,我注意我这个话比较狡猾,在一个专垂直场景上,他的专业能力可以超越GPT 4,我没有说全面能力,是让我们训的这种叫专业大模型,不具备全面能力。他可能写,有的时候写,比如说写某些文章不行,写诗不行的,解奥数题不行、算脑筋急转弯的问题不行,但是他就能够解决你的单项,它要成为一个单项冠军。
那我们下面会给一个实践的例子,用百亿参数的这种垂直场景大模型,如果训的好,我注意我这个话比较狡猾,在一个专垂直场景上,他的专业能力可以超越GPT 4,我没有说全面能力,是让我们训的这种叫专业大模型,不具备全面能力。他可能写,有的时候写,比如说写某些文章不行,写诗不行的,解奥数题不行、算脑筋急转弯的问题不行,但是他就能够解决你的单项,它要成为一个单项冠军。