ChatGPT 的发展历史如下:
原创陈财猫财猫AI 2024-01-27 18:39发表于北京原文:https://mp.weixin.qq.com/s/YIPmEKHsfW5xqYAUSl2_zg引子:大家好,我是陈财猫。有人在想尽心思骗取GPTs的内置Prompt,有人坑蒙拐骗让AI客服把一辆新轿车卖给他,也有人在费尽心思地让GPT教他怎么做大炸弹:这都属于大模型安全的范畴。GPT越聪明,离我们越近,在生活中越常见,也就越危险。如何预防与阻止类似的风险,便是LLM Safety的研究范畴。今天,财猫AI团队为你撰写了《从0到1了解大模型安全,看这篇就够了》,带你一篇文章了解大语言模型安全研究领域。如果你想进一步了解大语言模型安全,可以访问我们的Github awesome-llm-safety项目:https://github.com/ydyjya/Awesome-LLM-Safety下面是正文,祝你阅读愉快!在过去的一年里,我相信许多人已经主动或被动地了解了ChatGPT()。事实上,在座的各位中,有不少人可能已经使用过ChatGPT。这个工具的强大之处,在于它能在人类生活的各个方面发挥作用。下面是大型语言模型近些年的演化图,从2018年之前灰色部分的词嵌入开始发展,而后三种颜色的分支代表着不同的技术路线。
Gen AI/Generative AI是“生成式人工智能”正式称呼。Generative AI是一种能够生成新内容的人工智能技术,比如文本、图像、音乐等。而AIGC指的是由人工智能生成的内容的创作方式,实际上是Generative AI的应用结果。[heading1]问题四、ChatGPT是什么?[content]从OpenAI的官网中可以查询到,在2022年宣发时,OpenAI称ChatGPT是一种模型。但是同样是在官网中查询帮助页面,发现这里称ChatGPT是一种服务。而我们使用的ChatGPT目前是依赖GPT系列模型来运转的。不做任何怀疑论上的揣摩,从公开收集的资料中可以看出,早些年OpenAI推出了一个叫ChatGPT的模型,但目前我们所熟知的ChatGPT逐渐演变成了一种可以兼容多种GPT模型的聊天应用(服务)。
当时团队一年里的大部分时间里都在做这个项目,但后来我们减少了对浏览功能的侧重,因为模型内部的知识已经非常丰富,浏览功能并不是最吸引人的部分。我们当时把这个产品给朋友和家人用了一段时间,也在考虑要公开发布。GPT-4就是在2022年的8月完成了训练。GPT-4是OpenAI的旗舰项目,特别强调指令遵循能力,因为这些是会被实际部署到生产环境中的模型。这些模型的首次finetune使用了完整的技术栈,并且表现出色,所以大家对它们期望极高。尽管这些模型有时能产生令人惊艳的输出,它们的可靠性还是存在问题,有时会出现明显的错误或hallucination,所以GPT-4还不是最终的进化完成体,不过综合能力已经非常优秀了。在那之后,大家暂时忘记了chat这个分支。我们继续研究,把指令型数据(通常用来训练AI执行特定的任务)和聊天数据(更侧重于模拟人类间自然对话的数据)混合在一起,希望能够结合这两个东西的优点,创造出一个既可以处理具体任务又能流畅聊天的模型。但从结果看来说,显然是chat模型使用起来更简单,它能够更好地了解并处理自己的潜在局限性,这是我在开发过程中最激动的事情之一,因为这说明一些人认为的语言模型的固有缺陷,实际上可以通过一些直接的方法得到解决。指令型模型中的一些任务,比如“complete this text,but in a nice or helpful way(以友好和能有帮助的方式补全这段文本)”本身的描述是不够明确清晰的,这会让模型难以执行,也增加了数据标注者的困难。而chat模型则更加直观,人们对于一个能给我们帮助的bot该具备哪些行为特点有自然的预期,也会让chat模型在理解任务和执行上更简单和准确。因此,这类模型能够展现出更连贯的特征和更稳定的行为。Dwarkesh Pa tel:这是不是说所有人用你开源的fine-tuning API都能训练出一个像ChatGPT这样的模型?