普通人是可以获取到 ChatGPT 的。ChatGPT 自发布以来引起了轰动,任何人只需输入提示信息,就能利用其似乎无穷无尽的知识源进行交流。
在 OpenAI 内部,对于是否发布这样强大的工具曾有争论,但最终支持发布,旨在让公众适应 AI 改变日常生活的现实。
ChatGPT 能够生成回答是基于对大量文本的学习和概率估计。通过处理单词和单词序列的概率,不断改进生成的内容。
与过去的聊天机器人不同,大型语言模型改变了局面,使得像 ChatGPT 这样的产品能够进行自由流畅的对话,听起来和人类难以区分,成为最快达到 1 亿用户规模的消费产品。它具有娱乐性,始终可用且能讨论任何话题,使得人工智能伴侣成为生成式人工智能在日常消费者中的首批杀手级应用之一。
[title]OpenAI真正想要什么| WIRED去年11月之前,人们对OpenAI的了解主要局限于技术和软件开发领域。但现在全世界都知道,OpenAI在当月晚些时候发布了一款基于GPT-3.5最新版本的消费级产品。几个月来,公司内部一直在使用带有对话界面的GPT版本。这对于该公司所谓的“寻求真相”尤为重要。这意味着,通过对话,用户可以哄骗模型提供更可信、更完整的回答。为大众而优化的ChatGPT可以让任何人只需输入提示信息,就能立即利用似乎无穷无尽的知识源,然后继续对话,就像与一个碰巧无所不知的人类同伴闲聊一样,尽管他也有捏造事实的嗜好。在OpenAI内部,对于是否应该发布这样一款功能空前强大的工具,人们争论不休。但Altman对此表示支持。他解释说,这次发布是一项战略的一部分,旨在让公众适应AI注定会改变他们日常生活的现实,而且可能是为了更好地生活。在公司内部,这被称为“迭代部署假设”。当然,ChatGPT会引起轰动。毕竟,这是一个任何人都能使用的东西,它足够聪明,能在SAT考试中获得大学水平的分数,能写出B-minus的作文,还能在几秒钟内总结出一本书的内容。你可以让它为你撰写融资提案或会议摘要,然后要求它用立陶宛语、莎士比亚十四行诗或痴迷玩具火车的人的口吻进行改写。几秒钟后,大型语言模型就会满足你的要求。太疯狂了。不过,OpenAI将其视为其更新、更连贯、能力更强、更可怕的后继者GPT-4的台标,据说GPT-4是用1.7万亿个参数训练出来的。(OpenAI不会证实这个数字,也不会透露数据集)。
[title]ChatGPT是在做什么,为什么它有效?[heading2]那么这些概率从何而来呢?通过足够多的英文文本,我们不仅可以获得单个字母或字母对(2-grams)的概率的相当准确的估计,还可以获得更长字母序列的概率估计。如果我们使用逐渐更长的n-gram概率【注:即第n个字母的概率分布取决于之前的n-1个字母】生成“随机单词”,我们会发现它们变得越来越“真实”:但是现在假设——与ChatGPT的做法差不多——我们处理的是整个单词,而不是字母。英语中有大约40,000个常用单词。通过查看大量英文文本(例如几百亿个单词的数百万本书),我们可以估计每个单词的出现频率。使用这个,我们可以开始生成“句子”,其中每个单词都是独立地随机选择的,具有在语料库中出现的相同的概率。这是一个示例:很明显,这是胡言乱语。那么我们该如何改进?就像处理字母时一样,我们可以开始考虑不仅仅是单个单词的概率,还可以考虑一对或更长的n-gram单词概率。对于一对单词,以下是我们从“cat”单词开始得到的5个例子:看起来更加“有道理”了。我们可以想象,如果我们能使用足够长的n-gram,基本上我们将“得到一个ChatGPT”——这意味着我们将获得能够以“正确的整体文章概率”生成文章长度的单词序列的东西。但问题在于:没有足够的文本可供我们推断这些概率。在网络爬行中可能有数千亿个单词;在已数字化的书籍中可能有另外数百亿个单词。但是,对于40,000个常用单词,即使是可能的二元组也已经有16亿个,三元组的数量是60万亿。因此,我们无法从已有的文本中估计所有这些可能性的概率。而当我们到达20个单词的“文章片段”时,可能性的数量比宇宙中的粒子数量还要大,因此从某种意义上说,它们永远都无法全部写下来。
[title]它不是计算机,而是伴侣![heading2]概述与计算机聊天并不是什么新鲜事。第一个聊天机器人ELIZA在20世纪60年代诞生于麻省理工学院,此后我们见证了Clippy、SmarterChild、Alicebot和Kuki等产品的出现。尽管这些产品都曾一度走红,但它们并没有在消费者意识中留下深刻的印象,也没有像ChatGPT这样的产品那样普及。那么为什么新一波的聊天机器人感觉如此不同呢?过去的聊天机器人采用基于规则的架构,基本上是由你的输入触发的脚本。它们没有真正的持续对话上下文,无法适应你的语气,并且只能对有限的主题作出回应或执行预设的任务。很明显,你正在与一台计算机对话,它们听起来既不智能,也不像人类。大型语言模型(LLMs)改变了这个局面。突然间,我们可以与机器人进行自由流畅的对话,而不需要预先定义的规则来控制它们的回应(即使公司试图审查它们的机器人,往往也不奏效!)。如今最好的聊天机器人听起来和人类无法区分——如果你不相信,可以玩一下“人类还是机器人?”图灵测试游戏。这就是为什么尽管产品存在明显的局限性,ChatGPT仍然成为最快达到1亿用户规模的消费产品。真正的对话型人工智能无疑是娱乐性的,现在计算机也有了个性。与人类不同,由人工智能驱动的对话伙伴始终可用,对与你交谈感兴趣,并且可以讨论任何话题。在我们看来,这使得人工智能伴侣成为了生成式人工智能在日常消费者中的首批杀手级应用之一。很容易想象出一位人工智能朋友、心理治疗师、导师、教练或者导师,但是这些人工智能与人类的关系的早期版本往往带有浪漫色彩,比如人工智能“女友”或者“男友”。为什么会出现这种情况呢?简单来说,成人娱乐行业一直处于新技术的前沿,这是一个显而易见的答案。但我们不能不提到可能推动人们探索非传统伴侣关系的社会变化。