2023 年大模型发展的重要技术包括以下方面:
SuperCLUE:AI大模型2023年关键进展•百川智能发布Baichuan2—Turbo字节云雀大模型闭源通用大模型百川BaichuanYi-34B开源医疗汽车教育行业大模型MindGPT部分领域岐黄问道银河大模型..................序列猴子BlueLM AndesGPT孟子云天书玉言金融工业文化/零售/交通AInno-15B妙笔大模型
2023年是大模型澎湃发展的一年:从22年11月ChatGPT的惊艳面世,到23年3月GPT4作为“与AGI(通用人工智能)的第一次接触”,到23年末多模态大模型的全面爆发,再到刚刚面世的Sora再次震惊世界。大模型给了世界太多的惊喜、惊讶、迷茫、甚至恐惧。有人问我:“AGI的出现可以和人类哪次发现/发明相比?”“大概是人类开始使用‘火’的时刻。万有引力、iPhone什么的都不值一提。”就像我在去年4月份文章中写的——在AGI和任何新事物的出现的时候:我们总是倾向于高估它的短期,但却低估它的长期。(前文[《AGI|高估的短期与低估的长期》](http://mp.weixin.qq.com/s?__biz=MzIwMTE0MDIwMA==&mid=2247484405&idx=1&sn=5e5c3104511adedad247d23149b14a80&chksm=96f33172a184b8647e786bf57685eb8e085e0f3f1e91aa3be797b49708b82135f41088959e2b&scene=21#wechat_redirect))目前正是这个大趋势的真实写照:
优点:适应性极好,通过提示词工程,方便「适应各种奇葩需求」。对算法的要求降低了不少,大部分功能由大模型提供,特别是非结构化信息的处理。大模型的API访问方式简化了边缘设备的要求,无论在Android、iOS、HarmonyOS()或各种嵌入式设备上都能方便适配。「AGI终将到来,拥抱未来,虽然路途艰难但相信方向是正确的。」缺点:大模型的推理时长目前仍是最大的障碍,传统目标检测或人脸识别优化后能达到100~300ms,而大模型动则需要10秒的延时,限制了许多场景。模型的幻象和错误率仍然较高,导致上述推理时长问题,在多链路的复杂应用中迅速变得不可行。在大多数生产模式下,仍然需要使用云服务数据中心,提交的画面不可避免地涉及到隐私问题。商业私有化部署是刚需,当下的开源模型离GPT4代差在半年以上,技术人员任重道远的。[heading2]未来展望[content]大模型三要素,算法,算力和数据,巧妇难为无米之炊。车载支架已就位,待我出门逛一圈,将后端采集的prompt和源图存入数据集,然后进一步展开工作。人生就是一趟单向旅途,你能所做的只是「尽量不错过沿途的风景」。2024年了,先提前给大家拜个早年。在大型语言模型面前,技术已经平权,要卷的只剩下「创意和工程化落地能力」了。