目前主流大厂在 AGI 方面的进展情况如下:
从业内人的角度,ChatGPT和GPT4的出现时最令人惊讶的,不是它的能力,而是保密工作做的太好。2023之前国内AI行业还处在沾沾自喜,自认为和美国只有个把月差距,而且还有人口数据优势;这种论调一下子被GPT4打回了原形。OpenAI在国内完全没有预警的情况下,直接拉开2年技术差距。具体原因,可能是国内的骄傲自大,可能是被之前Google主推的T5技术路线带偏,也可能是因为AGI实在是影响过于巨大,FBI、美国国防部这些国家机关不可能没和OpenAI打过招呼。OpenAI的成功是大力出奇迹,所以23年上半年国内也笃信只要有卡有钱就可以“大炼钢铁”。那时不论是纷纷囤卡招人,研究类GPT架构的大厂们,还是讲着中国OpenAI的故事,拿着巨额融资的创业公司们,都想要第一个创造国产AGI。而到了下半年,在试验了一番发现不容易之后,又纷纷转向要做“垂直应用”、“商业化”;反而不提AGI了。这个转向是短视的,甚至是致命的。2023年,中美在AGI技术的差距并没有缩小。现在,国内最领先的模型水平大概在准ChatGPT3.5的水平,和GPT4还有不小差距;甚至还不如临时拼凑的Mistral团队的水平。大厂。大厂们无论是人才、GPU、数据,还是资金储备都是可以冲击AGI的,不过从实际效果上来看还并没有明确亮点。但与此同时,受内部短期考核压力的裹挟,大多数力量应该都放在卷新产品圈地盘和向上汇报工作上了。从另一个角度,这些模型虽然能力一般,但和业务的结合都是比较充分的。最后,大厂们同时背负了太多其他业务和政治考量:对于是否做大模型的出头鸟,很多公司都是要三思的。具体来讲,百度和阿里是大厂里比较高调:百度的“文心4.0”是当前国内能力最好的模型之一,即将发布的阿里的“通义千问
原文链接:https://www.sequoiacap.com/article/ai-50-2024/发表时间:2024-4-11作者:Konstantine Buhler编译:Z Potentials去年,生成式AI从不引人注意的地方走到了AI 50强榜单的前列。今年,随着我们看到企业用户和消费者的AI生产力开始大幅提高,它成为前沿和中心。尽管2023年美国的大部分AI风投都流向了基础设施领域——其中60%流向了最大的大语言模型(LLM)提供商,但应用公司仍在AI 50强榜单中占据主导地位。与此同时,我们开始看到AI如何为公司赋能。如今,许多公司正将AI融入其工作流程,以此来快速达成KPI。我们看到大公司正通过将AI融入其产品的方式而获益。工作流程自动化平台ServiceNow通过AI驱动的Now Assist,实现了近20%的事件避免率。Palo Alto Networks利用AI降低了处理费用的成本。Hubspot利用AI扩大了能够支持的用户规模。瑞典金融科技公司Klarna最近宣布,通过将AI融入用户支持,他们在运行率方面节省了4000多万美元。现在,成千上万的公司正在将AI整合到他们的工作流程中,以扩张规模和降低成本。AI 50强企业正在快速进化。不远的将来,我们有望看到UX和UI围绕AI的功能进行重新设计。在更好、更廉价地复制现有功能之后,我们将开发全新的用户界面,以提供有价值的新体验。
在AI上发力的还有手机和PC厂商:华为、荣耀、小米、OPPO、VIVO、三星、联想等都已宣布会在手机/PC端侧搭载大模型。这个可能性来自于:2023年下半年“模型小型化”的众多进展(详情见“上篇”)。不过,仔细看来,除了很弱的Nvidia Chat with RTX,目前并没有真正全离线版的大模型产品,端上智能暂时还是噱头。手机和电脑厂商们的打法基本都是大模型还是放在线上,手机和电脑来调用,然后搭配一个小AI做总结等服务。“端”确实“智能”了,但"大脑"还在线上,手机上顶多有个"脑干"。纯粹的端上智能有几个问题:1)离线小模型永远都会和在线大模型有一个代际的能力差距,于是为什么消费者要用一个更傻的模型而不是用线上的模型服务?2)即使是小模型,它目前的耗能和生热仍然难以达到手机要求。3)目前的AI还不是刚需,猎奇成分比较多。4)技术上还不能确认小型化的模型是“真AGI”还是“聊天机器”。所以说,短期内的端上智能仍然会停留在一些个别小市场里。