大模型在金融领域的量化投研领域有以下应用和特点:
作者:黄文灏 源地址:https://zhuanlan.zhihu.com/p/646909899 最近和朋友讨论发现大模型预训练和金融量化有很多相似之处,作者恰好同时具有两者背景,做了对比。
大多数量化算法的核心数据是公开的量价数据,大模型预训练的数据中最重要的也是公开数据,当然各家都会有一些自己独有的数据来源,但占比都不太大。量化的整体算法逻辑各家其实也都差不多,类比预训练模型结构方面,大家也基本类似,不会有翻天覆地的差别。所以,决定模型能力好坏的其实是大型系统工程能力。首先,作为大型系统工程,量化和大模型都需要大型的计算集群。上万张卡的互联是对Infra的极致挑战,国内在ChatGPT之前实现上万张卡互联的可能只有幻方的萤火平台,幻方的Infra人才基本上也是国内最顶尖的,里面各种NOI金牌选手。量化不仅需要大型的计算集群,对性能和效率也有极致的追求,大家的算法捕捉的交易机会其实很类似,这种情况下,交易指令的速度变得尤为关键,有使用网卡编程来追求最大化效率的。大模型虽然没有这么夸张,但是在infra层面的每一点提升,都可以带来不少的训练效率优化,也能更快的得到实验反馈,并得到持续提升。其次,细节在大型系统工程中十分关键。量化交易系统中只有算法是完全不够的,整个系统包含交易执行、风控多个方面,任何一个环节的问题都会导致整个交易系统功败垂成。大模型预训练中,从数据到评估,也包含了大量的细节。除了已经形成普遍共识是谁的数据清洗地好,谁的模型效果就好,数据配比、数据顺序、训练策略等等小细节都对模型最后的结果起着重要的作用。
很多Global的量化基金到了中国都会水土不服。同时,国家政策也规定了很多Global的量化基金没法在中国大规模开展业务。这就给了国内的很多量化基金崛起的机会,即使交易系统比国外顶尖机构有一些差距,但是只要在中国能保持领先,整体就会有不错的收益。大模型也是如此,OpenAI、Google、Meta的模型一方面中文能力比较一般,远没有英文能力强大,二没有对中国国情进行优化,不符合政策要求。这给了国内的大模型公司做大模型预训练的机会,只要做到国内第一,即使和世界领先的模型有一个代际差,也是不小的市场。当然,这样的情况,不止在中国,在世界很多国家都会存在。所以,面向各国政府做基础大模型本土化预训练是个不小的市场。由此引申的另一个相似之处就是受政策影响极大。国内量化基金的几个大起大落基本都和政策有关,大模型的发展也和国家的相关办法息息相关。同时,两者都需要收到有效监管才能健康发展。[heading2]其他[content]除了上面几个感受比较深刻的,大模型预训练和金融量化还有不少相似之处,就不一一展开了少数精英的人赚大量的钱。做大模型不用很多人,但每个人都必须绝顶聪明。核心问题一样。下一个token预测和下一个股价预测其实是一个问题。都需要大量数据。都追求可解释性。。。。。。。最后,希望大模型能和量化金融一样,市场足够大到几家头部机构是不能完全吃下的,能给多个大模型公司机会。现在国内有上百家量化基金,规模有大有小,大模型公司也能百花齐放。
作者:[黄文灏](https://www.zhihu.com/people/huang-xian-sheng-84-62-45)源地址:https://zhuanlan.zhihu.com/p/646909899最近,和朋友讨论到一个有趣的观点:大模型预训练(主要指成本最大的from scratch预训练)和金融量化有很多相似之处。联想到之前幻方提到的做金融量化的人天然具备做预训练大模型的基础。恰好自己同时具有预训练大模型和金融量化的背景,仔细思考一下,发现的确可以做个对比。