Siri 目前并非使用大模型技术。苹果公司的 Siri 概念虽好,但由于技术限制,其表现未达到人工智能的水平,常被称为“人工智障”。不过,随着技术发展,未来可能会用大模型重新改造 Siri,将手机上的所有功能控制起来,使其成为真正的智能助理。例如,苹果公司在手机算力的芯片发展到能够支撑大模型上手机的情况下,可能会推出大模型的小数据量、专业的版本来替代 Siri。同时,苹果公司若 All in 手机,其大模型可能会是本地化的,以重视个人数据保护和隐私。
随着大模型上下文窗口长度不断增加,各个厂商对于文本生成模型呈现出“军备竞赛”的态势。目前,主流的文本生成模型是聊天模型,比如GPT、Claude 3等,也有少部分Base模型,例如Yi-34开源模型。两位技术研究人员分享了他们对于大模型的看法:用户使用最多的是GPT,但对外开放的版本性能较差,用户交互端无法传输大文件,只能通过API接口上传。月之暗面的Kimi模型大海捞针测试分数很高,但实际使用效果没有达到理想状态。百川192K的闭源模型,对于6万字的长文本,其表现的推理能力和回答效果很优秀。各种长文本的跑分数据,最高的是Claude 3模型。
今天的智能手机已经从苹果iPhone第一代发布到现在多少年了,到现在十五年了。实际上十五年来,虽然叫智能手机,其实手机并不智能,它是软件定义了手机,手机变成了一个电脑。但是,三星最近在展柜展出了AI手机。手机算力的芯片发展到现在已经能够支撑大模型上手机了。这两天有一个新闻,有个叫Mobile LLaMa的开源软件只有几亿参数进行了优化,已经能在手机上跑起来。对苹果来说,苹果发布了M3 CPU之后,它的M3 CPU有个特别的架构,显存跟内存是打通的,苹果的CPU架构特别适合做大模型的推理。所以,苹果All in AI的思路一定不是再跟OpenAI对标做一个类似的大模型,这可能是他的长线战略,短期内他一定会做出一个大模型的小数据量的版本,一个专业的版本,替代Siri的版本。因为Siri对苹果来说,起了大早,赶了个晚集。Siri概念很好,但技术不支持,所以Siri成为了不是人工智能的代表,在很多场合被我嘲笑成叫“人工智障”。所以,苹果公司无论怎么推实际也没推起来。当然,如果用大模型重新改造Siri,再把手机上的所有东西都控制起来,手机就真正变成了你的智能助理,你用什么东西来指挥手机,可能APP变成底层插件了。如果各位有钱,雇一个小秘书,给你订餐,帮你叫车,给你处理日程,你还需要自己操作手机吗?小秘书非常可信,尤其本地大模型,不上传到云端,苹果又号称特别重视个人数据保护和隐私,它的大模型一定是本地化的。所以,我觉得苹果及把在汽车战场上的人力抽回来All in手机我认为是非常正确的,不All in手机会进入新的智能手机2.0时代,就不再是软件定义手机,或者手机不再是电脑,而是大模型重新定义手机,或者AGI重新定义手机。
所以这次Sora只是小试牛刀,它展现的不仅仅是一个视频制作的能力,它展现的是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。第五,Open Al训练这个模型应该会阅读大量视频。大模型加上Diffusion技术需要对这个世界进行进一步了解,学习样本就会以视频和摄像头捕捉到的画面为主。一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube上和TikTok的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,而视频传递的信息量又远远超过一幅图,这就离AGI真的就不远了,不是10年20年的问题,可能一两年很快就可以实现。由锤子便签发送via Smartisan Notes