以下是关于不同 AI 信息准确性的一些情况:
需要注意的是,AI 的准确性会受到多种因素的影响,包括数据质量、模型训练、应用场景等。
因为这是一个独立的对话窗口,之前还问了不少明星的信息,因此他是不可能知道我的信息的,其次GPT是没有记录我的照片的,也就是他不可能认识我更不可能认识我的基友。但是,他却完美地判断对了我们两个的职业,判断对了我平时会给企业做路演咨询服务,并且还判断对了他现在在创业!真是吓人啊!就冲这两点,足够拿捏C端的好奇心和短暂满足感的需求了。还记得小时候2元/条的“测试一下王某某和张某某的姻缘匹配度”这种广告短信吗,不少人还真花钱去测试了自己和自己的暗恋对象。实话说,我也中招过,也测了,还是我懵懂的年少时期。这AI不是又重新把二十年前的“算一算你们两的姻缘”重新玩了一遍吗!有人这时候可能会说了:就这?我扔个两只猫都可以说他们有夫妻相,这AI能力也不过如此。别急,更可怕的在后面。。。下午,有个群友问能不能用AI算下面相,给些穿搭职业建议。我就试了雷军的证件照。好家伙,GPT4o不仅能够分析照片拍摄的背景,还能准确判断对他是企业高管。但是我们可能怀疑是Open AI有人物库,能够识别名人照片。于是我又试了下我自己的照片。结果一出来,卧槽,完美又判断对了我的职业。我算是项目经理&产品经理。其次,我平时也会去路演做咨询培训服务,也算半个教师。本来以为这只是巧合,直到我试了20张群友的照片,反馈都是如下这样的。服了,这次我真的服了,GPT4o太牛逼了,奥特曼太牛逼了!
研究人员利用AI分析Reddit上的帖子,直接通过用户的写作方式就能够准确地识别其年龄、位置、性别甚至收入等个人信息。瑞士苏黎世联邦理工学院的Robin Staab和Mark Vero让九个LLMs分析Reddit帖子数据库,从用户的写作方式中提取身份信息。GPT-4以85%的总体准确率取得了最高成绩。他们随机选择了1500个活跃用户的个人资料,然后将其缩减到520个用户,对于这些用户,他们能够自信地识别出出生地、收入档次、性别和位置等属性,无论是在他们的个人资料还是帖子中。当给定这些用户的发帖历史时,一些LLMs能够高度准确地识别出这些属性。GPT-4以85%的总体准确率取得了最高成绩,而相对低功率的LLM LlaMA-2-7b的准确率最低,为51%。Staab表示:“这告诉我们,我们在互联网上无意中泄露了很多个人信息。许多人可能不会认为你可以直接从他们的写作方式推断出他们的年龄或位置,但LLMs是相当有能力的。”有时,个人详细信息会在帖子中明确说明。例如,一些用户在有关财务建议的论坛中发布他们的收入。但是,一些特征对AI来说比其他特征更容易辨识。GPT-4在猜测性别方面的准确率为97.8%,而在收入方面的准确率仅为62.5%。英国萨里大学的Alan Woodward表示:“我们才刚刚开始理解LLMs的使用可能如何影响隐私。”详细报道:[https://newscientist.com/article/2400514-ais-can-guess-where-reddit-users-live-and-how-much-they-earn/](https://t.co/eCvGeUXT2R)
Lanrian的帖子是网上许多类似帖子之一——它是基于前几个模型之间的跳跃来外推性能的。OpenAI当然有更详细的指标,他们得出的结论与Lanrian相同,我将在本文档后面展示。那么,如果AI性能可以根据参数数量来预测,而且大约100万亿参数足以达到人类水平的性能,那么何时会发布一个100万亿参数的AI模型呢?GPT-5在2023年底达到了48的智商,实现了初级通用人工智能。OpenAI正在开发一个拥有100万亿参数模型的首次提及是在2021年夏天,这一信息是在一次《连线》杂志的采访中由Cerebras公司的首席执行官安德鲁·费尔德曼随口提到的,而Sam Altman是该公司的主要投资者之一。在2021年9月的AC10在线聚会和问答环节中,Sam Altman对Andrew Feldman的回应中,他承认了OpenAI计划开发一个拥有100万亿参数的模型。AI研究员伊戈尔·拜科夫(Igor Baikov)仅几周后声称,GPT-4正在训练中,并将在12月至2月间发布。再次强调,我将证明伊戈尔确实拥有准确的信息,并且是一个可信的信息源。这一点很快就会变得重要。