ChatGPT 4.0.1 相较于 ChatGPT 4 具有以下新功能和先进之处:
需要注意的是,尽管 ChatGPT 4.0.1 有这些优势,但它仍存在与早期 GPT 模型类似的局限性,如对事实产生“幻觉”和出现推理错误等,在使用其输出时应谨慎。
尽管有这样的能力,GPT-4也有与早期GPT模型类似的局限性。最重要的是,它仍然不是完全可靠的(它对事实产生"幻觉",并出现推理错误)。在使用语言模型的输出时,特别是在高风险的情况下,应该非常小心,并且使用确切的协议(如人类审查,用额外的上下文托底,或完全避免高风险的使用)与具体应用的需要相匹配。详见我们的系统卡。相对于以前的GPT-3.5模型,GPT-4大大减少了幻觉(随着不断的迭代,它们本身也在不断改进)。在我们内部对抗性设计的事实性评估中,GPT-4的得分比我们最新的GPT-3.5高19个百分点(图6)。图6.GPT-4在九个内部对抗性设计的事实性评价中的表现。准确率显示在Y轴上,越高越好。准确度为1.0意味着模型的答案被判断为与人类对评价中所有问题的理想答案一致。我们将GPT-4与基于GPT-3.5的三个早期版本的ChatGPT[64]进行比较;GPT-4比最新的GPT-3.5模型提高了19个百分点,在所有题目上都有明显的提高。
图5.GPT-4在各种语言中的表现与之前的模型在MMLU上的英语表现相比。GPT-4在绝大多数测试语言中的表现都优于现有语言模型[2,3],包括低资源语言,如拉脱维亚语、威尔士语和斯瓦希里语。GPT-4在遵循用户意图的能力方面比以前的模型有很大的改进[63]。在提交给ChatGPT[64]和OpenAI API[47]的5,214个提示的数据集上,在70.2%的提示中,GPT-4产生的响应比GPT-3.5产生的响应更受欢迎。我们收集了通过ChatGPT和OpenAI API发送给我们的用户提示,从每个模型中抽出一个响应,并将这些提示和响应发送给人类标注人员。标注人员被要求判断该反应是否是用户根据提示所希望的。标注人员没有被告知哪个响应是由哪个模型产生的,而且响应呈现的顺序是随机的。我们过滤掉含有任何种类的不允许或敏感内容的提示,包括个人身份信息(PII)、性内容、仇恨言论和类似内容。我们还过滤了简短(例如"你好,ChatGPT!")和过于常见的提示。
ChatGPT 4o 5.13发布后,掀起一波热浪,想必大家都想尽快体验ChatGPT 4o了。本文将详细介绍如何注册、安装和订阅和使用ChatGPT 4o。目前ChatGPT官网有3个版本,一个是GPT3.5,一个是GPT4,一个是ChatGPT 4o,发布会上说ChatGPT 4o可以免费体验,但免费体验次数很有限。GPT3.5是免费版本,只要你拥有了GPT账号就能使用,但GPT3.5的智能程度明显没有GPT4o的高,而且也无法使用DALL.E3(AI画图功能)和GPTs商店和高级数据分析等插件。下午问了GPT知识更新时间,ChatGPT 3.5的知识是更新到2022年1月,ChatGPT 4o的知识是更新到2023年10月。而ChatGPT 4更新到2023年12月数据更新,这就是付费版本的差异。想要用更多功能更智能的GPT4o需要你升级到PLUS套餐,PLUS的收费标准是20美金一个月,GPT4还有团队版企业版,费用也更贵,一般推荐使用PLUS套餐即可。三、安装ChatGPT