目前,很难明确指出哪一个是最强大的 AI。在大语言模型方面,OpenAI 的 GPT-4.0 功能强大,GPT-3.5 也引发了当前的 AI 热潮。微软的 Bing 混合使用 GPT-4 和 3.5,常率先推出新功能且连接到互联网。谷歌的 Bard 由 PaLM 2 等基础模型驱动,虽有改进但仍有待提升。Anthropic 发布的 Claude 2 具有较大的上下文窗口,且不太可能恶意行事。此外,Open AI 发布的 Code Interpreter 也是非常强大的 ChatGPT 版本。但不同的 AI 在不同的应用场景和任务中可能表现出不同的优势,其强大程度也会因评估标准和具体需求的不同而有所差异。
作者:Ethan Mollick发表时间:2023年7月15日原始链接:https://www.oneusefulthing.org/p/how-to-use-ai-to-do-stuff-an-opinionated越来越强大的人工智能系统正在以越来越快的速度发布。本周,Claude 2首次亮相,这可能是公众可以使用的第二个最强大的AI系统。前一周,Open AI发布了Code Interpreter,这是迄今为止可用的最复杂的AI模式。在那之前的一周,一些人工智能[获得了查看图像的能力](https://www.oneusefulthing.org/p/on-giving-ai-eyes-and-ears)。然而,似乎没有一个人工智能实验室提供任何用户文档。相反,唯一的用户指南似乎是通过Twitter影响者获得的。对于声称关心正确使用其技术的组织来说,谣言文档是一个奇怪的选择,但我们目前就是这样。我不能声称这将是一个完整的用户指南,但它将作为人工智能当前状态的一点方向。我每隔几个月为我的学生(和感兴趣的读者)准备一份人工智能入门指南,每次都需要进行重大修改。过去的几个月特别疯狂。这份指南基于我的经验,侧重于如何选择正确的工具来做事情。我单独写过关于[您可能希望人工智能完成的任务类型](https://www.oneusefulthing.org/p/on-boarding-your-ai-intern),提前阅读下这些任务可能对你有帮助。
近年来,AI社区取得了很大的进展。在硬件、模型架构和数据的进步下,我们有可能训练出巨大的模型,因此我们持续看到更大的能力。我相信我们正走在通往AGI之路的正确道路,但扩展行不是唯一的方案。在我看来,目前最紧迫的挑战是对齐和安全性。在某种程度上,它们可能是关于可控性或可操纵性的同一个问题。首先,即使我们已经掌握了一个非常强大的AI系统,如果我们不能有效地传达我们的目标,并确保模型与我们的需求保持一致,那么我们不可能创造出我们所需的价值。目前最强大的模型是通过大量的数据进行学习的,这些数据集不可避免地捕获了真实世界中的不完美、缺陷和偏见。在这方面,不对齐的模型带来了安全问题,因为它们并不知道什么是应该避免的。[heading3]我相信我们正走在通往AGI之路的正确道路,但扩展性不是唯一的解决方案。[heading3]目前最紧迫的挑战是对齐和安全性。[heading2]在OpenAI的职业生涯中,你收到的最佳建议是什么?[content]这并不是某个特定人给我的建议,而是基于我在OpenAI的经验。那就是要拥有远大的目标(think big)。我们正在创造一些新的东西,因此我们应该充满雄心壮志、勇敢并保持足够的坚持,继续努力下去。[heading2]你从哪里找到灵感?[content]书籍。我通常会阅读深度学习领域以外的书籍,并从各个领域中获得灵感;例如,对于一个作家来说,持续50年的坚持有多么关键,对于一个外科医生来说,完美地注重细节有多么重要,对于一个企业家来说,拥有“疯狂的想法”有多么重要。我身边的人。我很荣幸能与OpenAI的一大群极其有才华的同事一起工作。每个人都有自己独特的闪光点、鼓舞人心或值得尊敬之处,我喜欢从他们身上学习。Lilian Weng博客链接[lilianweng.github.io](https://lilianweng.github.io/)
前四个(包括Bing)都是OpenAI系统。今天有两大主要的OpenAI AI:3.5和4。3.5模型在11月启动了当前的AI热潮,4.0模型在春季首次发布,功能更强大。一个新的变种使用插件连接到互联网和其他应用程序。有很多插件,其中大部分不是很有用,但你应该随需要自由探索它们。Code Interpreter是一个非常强大的ChatGPT版本,可以运行Python程序。如果您从未为OpenAI付费,那么您只能使用3.5。除了插件变种和一个暂时停用的带有浏览功能的GPT-4版本之外,这些模型都没有连接到互联网。微软的Bing使用4和3.5的混合,通常是GPT-4家族中首个推出新功能的模型。例如,它既可以创建也可以查看图像,而且它可以在网页浏览器中阅读文档。它连接到互联网。[Bing使用有点奇怪,但功能强大。](https://oneusefulthing.substack.com/p/power-and-weirdness-how-to-use-bing)谷歌一直在测试自己的人工智能供消费者使用,他们称之为Bard,但是由各种基础模型驱动,最近是一个名叫PaLM 2的模型。对于开发出LLM技术的公司来说,他们非常令人失望,尽管昨天宣布的改进表明他们仍在研究基础技术,所以有希望。它已经获得了运行有限代码和解释图像的能力,但我目前通常会避免它。最后一家公司Anthropic发布了Claude 2。Claude最值得注意的是有一个非常大的上下文窗口-本质上是LLM的记忆。Claude几乎可以保存一整本书或许多PDF。与其他大型语言模型相比,它不太可能恶意行事,这意味着,在实际上,它倾向于对你做一些事情进行责骂。现在,来看看一些用途: