Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

大模型在金融领域的量化投研领域的应用

Answer

大模型在金融领域的量化投研领域有以下应用和特点:

  1. 大型系统工程:
    • 量化和大模型都需要大型计算集群,上万张卡的互联是对基础设施的极致挑战。量化对性能和效率有极致追求,交易指令速度至关重要;大模型在基础设施层面的每一点提升都能优化训练效率。
    • 细节在大型系统工程中十分关键。量化交易系统包含多个方面,任何环节出问题都会导致交易系统失败;大模型预训练从数据到评估包含大量细节,如数据配比、顺序、训练策略等。
  2. 本土化机会:
    • 很多 Global 的量化基金到中国会水土不服,国家政策也限制其大规模开展业务,给国内量化基金崛起机会。
    • OpenAI、Google、Meta 等的模型中文能力一般,未对中国国情优化,不符合政策要求,给国内大模型公司本土化预训练机会。
    • 两者都受政策影响极大,需要有效监管才能健康发展。
  3. 其他相似之处:
    • 少数精英的人赚大量的钱,做大模型和金融量化都不用很多人,但每个人都要绝顶聪明。
    • 核心问题一样,下一个 token 预测和下一个股价预测类似。
    • 都需要大量数据,都追求可解释性。

作者:黄文灏 源地址:https://zhuanlan.zhihu.com/p/646909899 最近和朋友讨论发现大模型预训练和金融量化有很多相似之处,作者恰好同时具有两者背景,做了对比。

Content generated by AI large model, please carefully verify (powered by aily)

References

预训练大模型与金融量化

大多数量化算法的核心数据是公开的量价数据,大模型预训练的数据中最重要的也是公开数据,当然各家都会有一些自己独有的数据来源,但占比都不太大。量化的整体算法逻辑各家其实也都差不多,类比预训练模型结构方面,大家也基本类似,不会有翻天覆地的差别。所以,决定模型能力好坏的其实是大型系统工程能力。首先,作为大型系统工程,量化和大模型都需要大型的计算集群。上万张卡的互联是对Infra的极致挑战,国内在ChatGPT之前实现上万张卡互联的可能只有幻方的萤火平台,幻方的Infra人才基本上也是国内最顶尖的,里面各种NOI金牌选手。量化不仅需要大型的计算集群,对性能和效率也有极致的追求,大家的算法捕捉的交易机会其实很类似,这种情况下,交易指令的速度变得尤为关键,有使用网卡编程来追求最大化效率的。大模型虽然没有这么夸张,但是在infra层面的每一点提升,都可以带来不少的训练效率优化,也能更快的得到实验反馈,并得到持续提升。其次,细节在大型系统工程中十分关键。量化交易系统中只有算法是完全不够的,整个系统包含交易执行、风控多个方面,任何一个环节的问题都会导致整个交易系统功败垂成。大模型预训练中,从数据到评估,也包含了大量的细节。除了已经形成普遍共识是谁的数据清洗地好,谁的模型效果就好,数据配比、数据顺序、训练策略等等小细节都对模型最后的结果起着重要的作用。

预训练大模型与金融量化

很多Global的量化基金到了中国都会水土不服。同时,国家政策也规定了很多Global的量化基金没法在中国大规模开展业务。这就给了国内的很多量化基金崛起的机会,即使交易系统比国外顶尖机构有一些差距,但是只要在中国能保持领先,整体就会有不错的收益。大模型也是如此,OpenAI、Google、Meta的模型一方面中文能力比较一般,远没有英文能力强大,二没有对中国国情进行优化,不符合政策要求。这给了国内的大模型公司做大模型预训练的机会,只要做到国内第一,即使和世界领先的模型有一个代际差,也是不小的市场。当然,这样的情况,不止在中国,在世界很多国家都会存在。所以,面向各国政府做基础大模型本土化预训练是个不小的市场。由此引申的另一个相似之处就是受政策影响极大。国内量化基金的几个大起大落基本都和政策有关,大模型的发展也和国家的相关办法息息相关。同时,两者都需要收到有效监管才能健康发展。[heading2]其他[content]除了上面几个感受比较深刻的,大模型预训练和金融量化还有不少相似之处,就不一一展开了少数精英的人赚大量的钱。做大模型不用很多人,但每个人都必须绝顶聪明。核心问题一样。下一个token预测和下一个股价预测其实是一个问题。都需要大量数据。都追求可解释性。。。。。。。最后,希望大模型能和量化金融一样,市场足够大到几家头部机构是不能完全吃下的,能给多个大模型公司机会。现在国内有上百家量化基金,规模有大有小,大模型公司也能百花齐放。

预训练大模型与金融量化

作者:[黄文灏](https://www.zhihu.com/people/huang-xian-sheng-84-62-45)源地址:https://zhuanlan.zhihu.com/p/646909899最近,和朋友讨论到一个有趣的观点:大模型预训练(主要指成本最大的from scratch预训练)和金融量化有很多相似之处。联想到之前幻方提到的做金融量化的人天然具备做预训练大模型的基础。恰好自己同时具有预训练大模型和金融量化的背景,仔细思考一下,发现的确可以做个对比。

Others are asking
企业财经领域落地AI怎么落地
企业财经领域落地 AI 可以考虑以下几个方面: 1. 采用创新和迭代的监管方法: 考虑如何利用可信 AI 的工具,如保证技术和技术标准,来支持监管合规。 积极主动地与政府对框架的监测和评估进行合作。 2. 关注行业发展趋势: 例如,生成式 AI 在金融服务业有巨大潜力,能催生个性化客户解决方案、更高效的运营、更好的合规和风险管理,以及更动态的预测和报告。 3. 应对挑战: 使用金融数据训练大型语言模型(LLMs):新进入者可先使用公开金融数据微调模型,现有参与者可利用专有数据,但现有金融服务公司可能过于保守,这给新进入者带来竞争优势。 确保模型输出准确性:金融问题答案影响重大,新的 AI 模型需尽可能准确,初期人类常作为最终验证环节。 同时,随着技术的发展,如大型语言模型的进步,为企业财经领域带来了更多的机遇,但也需要注意当前生成式 AI 输出的局限性,特别是在需要判断或精确答案的领域,不能完全依赖其准确性,至少需要人工审查。随着模型的改进、额外训练数据的加入和与数学模块的整合,其应用将有新的可能。
2025-01-27
我是一个AI小白,想系统学习AI,实现的目标是成为AI领域小能手,如果能用于变现则更好,我需要从什么开始学习,周期大概是多少?适合做哪些变现的项目呢
对于您这样的 AI 小白,想要系统学习 AI 并实现成为领域小能手甚至变现的目标,以下是一些建议: 1. 学习模式:可以采用输入→模仿→自发创造的模式。先广泛输入知识,然后进行模仿,最后尝试自发创造。 2. 学习内容:去 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新的内容。但要注意,一些旧的学习材料可能已经不适用。 3. 时间安排:学习时间不必每天依次进行,可以在有空的时候学习。 4. 学习状态:保持良好的学习状态,有意愿和动力去学。 5. 费用方面:学习资源大多是免费开源的。 新手学习 AI 可以这样做: 1. 了解 AI 基本概念:阅读「」部分,熟悉术语和基础概念,浏览入门文章了解其历史、应用和发展趋势。 2. 开始学习之旅:在「」中找到为初学者设计的课程,推荐李宏毅老师的课程,也可通过在线教育平台按自己节奏学习并获取证书。 3. 选择感兴趣模块深入:AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习,掌握提示词技巧。 4. 实践和尝试:理论学习后进行实践,巩固知识,尝试使用各种产品做出作品,在知识库分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。 学习周期因人而异,取决于您的学习时间投入、学习效率和理解能力等因素。 关于变现项目,比如可以尝试用 GPT 和 SD 制作图文故事绘本、小说推文等,但要注意项目可能存在的不确定性。
2025-01-23
AI在土木工程领域的应用
AI 在土木工程领域有以下应用: 1. 绘图方面:存在一些 AI 工具和插件可以辅助或自动生成 CAD 图,例如 CADtools 12(Adobe Illustrator 插件,添加 92 个绘图和编辑工具)、Autodesk Fusion 360(集成 AI 功能的云端 3D CAD/CAM 软件)、nTopology(基于 AI 的设计软件,帮助创建复杂 CAD 模型)、ParaMatters CogniCAD(基于 AI 的 CAD 软件,根据输入自动生成 3D 模型),一些主流 CAD 软件如 Autodesk 系列、SolidWorks 等也提供基于 AI 的生成设计工具。但使用这些工具通常需要一定的 CAD 知识和技能,初学者建议先学习基本建模技巧。 2. 交通方面:可用于交通管理,优化交通信号灯和交通流量,缓解交通拥堵。 3. 物流配送方面:能够优化物流路线和配送计划,降低运输成本。 4. 教育方面:用于个性化学习,为学生提供定制化学习体验。 5. 农业方面:分析农田数据,提高农作物产量和质量。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-23
ai快速发展在教育领域的应用
AI 在教育领域的应用十分广泛,主要包括以下几个方面: 1. 个性化学习平台:通过集成算法和大数据分析,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源。例如 Knewton 平台,通过对数百万学生行为模式分析,精准预测学习难点并提前给出解决方案,大幅提升学习效率。 2. 自动评估:利用自然语言处理技术(NLP)自动批改学生作文和开放性答案题。如 Pearson 的 Intelligent Essay Assessor,能够分析和理解写作内容,给出准确评分和反馈,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学工具:使课堂教学更丰富和互动,如 AI 教师引导学生通过对话学习、解答疑问并提供即时反馈。Google 的 AI 教育工具 AutoML 用于创建定制学习内容,提高学习动机,加深知识掌握。 4. 虚拟现实(VR)和增强现实(AR):学生可通过 VR 头盔进入虚拟实验室,安全进行实验操作并得到 AI 系统反馈。例如 Labster 的虚拟实验室平台,提供高科技实验室场景,让学生尝试复杂实验流程,无需昂贵设备或专业环境。 然而,AI 技术在教育领域的广泛应用也对传统教育体系带来冲击,教育体系内部的惯性、教师技能更新、课程内容调整、评估和认证机制改革等问题成为 AI 教育创新面临的重要挑战。
2025-01-22
ai在教育领域的应用
AI 在教育领域有以下应用: 1. 个性化学习平台:通过集成算法和大数据分析,实时跟踪学生学习进度,诊断学习难点,提供个性化学习建议和资源。例如 Knewton 平台,通过对数百万学生行为模式分析,精准预测学习难点并提前给出解决方案,大幅提升学习效率。 2. 自动评估:利用自然语言处理技术(NLP)自动批改学生作文和开放性答案题。如 Pearson 的 Intelligent Essay Assessor,能够分析和理解写作内容,给出准确评分和反馈,减轻教师批改负担,提高评估效率和一致性。 3. 智能辅助教学工具:使课堂教学更丰富和互动,如 AI 教师引导学生通过对话学习、解答疑问并提供即时反馈。Google 的 AI 教育工具 AutoML 用于创建定制学习内容,提高学习动机,加深知识掌握。 4. 虚拟现实(VR)和增强现实(AR):学生可通过 VR 头盔进入虚拟实验室,安全进行实验操作并得到 AI 系统反馈。例如 Labster 的虚拟实验室平台,提供高科技实验室场景,让学生尝试复杂实验流程,无需昂贵设备或专业环境。 然而,AI 技术在教育领域的广泛应用也带来了一些挑战,如教育体系内部的惯性、教师技能更新、课程内容适时调整、评估和认证机制改革等。
2025-01-21
推荐几张ai领域图片
以下为您推荐几张 AI 领域的图片: 1. 节目单: 图片主题:风景,祖国河山 描述:AI 还原的中国自然景观,一些前所未有的角度,带来视觉震撼。 图片主题:AI 与画手的对话 描述:展示 AI 作为艺术创作工具,表明 AI 不是只会抄袭,而是画手的好工具。 图片主题:搞笑图/扩图轮播 描述:全网搞笑图片的二创。 图片主题:诗与远方 描述:诗词与 AI 结合的视觉艺术,呈现唯美画面。 图片主题:AI 红包 描述:直播制作红包封面并分发,炒热气氛。 2. 摊位信息: 摊位主题:乐易科学院 描述:通过 AI 技术,结合量子、暗物质、天体运行规律等能量形式,从科学、物理学、天文学、心理学等方面讲解国学和传统文化,可进行批八字、调风水、性格色彩分析。 摊位主题:AIGC 策划程序美术(3AI 简称 3A 游戏)应用独立游戏开发 摊位主题:AI 人像摄影绘画 摊位主题:B2B AI 营销与 AI 落地项目快速落地 描述:涵盖 AI 训练 to b 出应用、智能体 agent、文生图生视频等,以及美国独立站搭建、Google seo 与 AI 结合等,展示相关技术尝试和工具。 3. 他山之石|如何防止 AI 取代人类思考一切: 原文主要探讨了手写笔记和手绘对于学习和思考的重要性,认为在学习新技能时应先依靠人类自身,不应过早使用 AI,还提到了与朋友 Trevor Muir 关于此问题的交流。
2025-01-21
ai量化交易
以下是关于 AI 量化交易的相关信息: 11 月 9 日至 10 日在文三路数字生活街区举办的“AI 切磋大会”中,现场有 106 个摊位,其中包括 AI 量化交易相关的摊位。 摊位信息: 摊位主题:AI+交易:来定制专属于你的私人高级交易顾问吧! 摊位区域:D 摊位编号:22 摊位类型:量化交易 预训练大模型与金融量化: 大多数量化算法的核心数据和大模型预训练的数据中最重要的部分都是公开数据,各家也会有一些独有数据来源,但占比不大,整体算法逻辑类似,决定模型能力好坏的是大型系统工程能力。 作为大型系统工程,量化和大模型都需要大型计算集群,量化对性能和效率有极致追求,大模型在 infra 层面的提升能带来训练效率优化。 细节在大型系统工程中十分关键,量化交易系统包含交易执行、风控等多个方面,任何一个环节出问题都会导致交易系统失败;大模型预训练从数据到评估包含大量细节,如数据配比、顺序、训练策略等都对模型结果有重要作用。
2025-01-25
数据如何向量化
数据向量化是为了实现高效的文档检索,将原始的文本数据转化为数值向量的过程。其目的是将文本数据映射到低维向量空间,使语义相似的文本距离较近,不相似的较远。但这一过程会导致一定程度的信息损失,因为文本的复杂性和多样性难以用有限向量完全表达,可能忽略细节和特征,影响文档检索准确性。 在语义搜索中,根据用户问题从文档集合中检索语义最相关的文档,主流方法是基于数据向量化结果,利用向量空间中的距离或相似度度量语义相似度,但存在局限性,如不能完全反映真实语义相似度,向量空间中的噪声和异常值会干扰结果,导致准确率无法 100%保证。 在计算机科学和数据分析中,向量常被用作表示数据点的方式,是一个数值列表或数组,每个数值代表数据点的一个特征。多维数据运算常以矩阵形式进行,矩阵乘法是基本操作。归一化是数据预处理的关键技术,用于调整数值数据范围,常用方法有最小最大缩放和 Z 得分标准化。 在向量数据库中,当用户输入查询时,如“激动人心的科幻冒险”,会转换成一个向量,例如,表示对不同元素的偏好程度。向量数据库存放的是词在不同维度上的相对位置,数据的存储和检索与传统 Excel 和关系数据库有很大不同。关于文字如何转换成向量,实际的向量结构会很复杂。
2024-10-12
以图片为主的PDF文件向量化的本地大模型推荐
以下是关于以图片为主的 PDF 文件向量化的本地大模型的相关信息: RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。大模型训练数据有截止日期,当需要依靠不在训练集中的数据时,可通过检索增强生成 RAG 技术实现。RAG 应用包括 5 个过程: 1. 文档加载:从多种来源加载文档,如包括 PDF 在内的非结构化数据、SQL 在内的结构化数据以及代码等。 2. 文本分割:把文档切分为指定大小的块。 3. 存储:包括将切分好的文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。 4. 检索:通过检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,生成更合理的答案。 PDF 翻译的 AI 产品: 1. DeepL(网站):,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件。 2. 沉浸式翻译(浏览器插件):,安装插件后,点击插件底部「更多」按钮,选择相关翻译选项。 3. Calibre(电子书管理应用):,下载安装并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮上传 Word 文档。 5. 百度翻译(网页):,点击导航栏「文件翻译」,上传多种格式文件,支持选择领域和导出格式。 6. 彩云小译(App):下载后点击「文档翻译」,可导入多种格式文档,但有免费次数限制且进阶功能需付费。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-10-06
你好,你是什么模型?
您好,我是一名 AI 知识专家,能够为您提供全面的 AI 知识指导和解答相关问题。 关于模型方面的知识: LoRA 和 LyCORIS 都属于微调模型,常用于控制画风、生成的角色、角色姿势等。它们的后缀均为.safetensors,体积较主模型小,一般在 4M 300M 之间,使用 LoRA 模型较多,LyCORIS 可调节范围更大,现在 SD 已内置。在 WebUl 中使用时,可在 LoRA 菜单中点击使用,也可直接使用 Prompt 调用。 在 Tusiart 中,首页有模型、帖子、排行榜,展示了大手子炼成的模型和图片。生图必需基础模型(Checkpoint),任何生图操作必须选定一个 Checkpoint 模型才能开始,lora 是低阶自适应模型,可有可无,但对细节控制有价值。ControlNet 可控制图片中特定图像,VAE 类似于滤镜调整生图饱和度,选择 840000 即可。Prompt 提示词是想要 AI 生成的内容,负向提示词是想要 AI 避免产生的内容。还有图生图,即上传图片后 SD 会根据相关信息重绘。 如果您想搭建类似的群问答机器人,可以参考以下内容:
2025-01-28
为什么要布置大模型到本地
布置大模型到本地主要有以下原因: 1. 无需科学上网,也无需支付高昂的 ChatGPT 会员费用。 2. 可以通过 Web UI 实现和大模型进行对话的功能,如 Open WebUI 一般有两种使用方式,包括聊天对话和 RAG 能力(让模型根据文档内容回答问题),这也是构建知识库的基础之一。 3. 能够更加灵活地掌握个人知识库。 但需要注意的是,运行大模型需要很高的机器配置: 1. 生成文字大模型,最低配置为 8G RAM + 4G VRAM,建议配置为 16G RAM + 8G VRAM,理想配置为 32G RAM + 24G VRAM(如果要跑 GPT3.5 差不多性能的大模型)。 2. 生成图片大模型(比如跑 SD),最低配置为 16G RAM + 4G VRAM,建议配置为 32G RAM + 12G VRAM。 3. 生成音频大模型,最低配置为 8G VRAM,建议配置为 24G VRAM。 个人玩家的大多数机器可能负担不起,最低配置运行速度非常慢。但亲自实操一遍可以加深对大模型构建的知识库底层原理的了解。
2025-01-27
Coze + 飞书 + 飞书多维表格:通过飞书机器人与 Coze 搭建的智能体进行对话,在聊天窗口中完成链接输入和阅读计划输出。由 Coze 调用大模型、插件完成内容的整理、推荐,利用飞书多维表格存储和管理稍后读数据,无需开发任何插件、APP,能实现跨平台的稍后读收集与智能阅读计划的推荐。其设计思路包括简化“收集”,实现跨平台收集和通过输入 URL 完成收集;自动化“整理入库”,自动整理关键信息并支持跨平台查看;智能“选择”推荐,根据收藏记录和用户兴趣生成阅读计划——这个方法具体如何操作?
以下是关于通过飞书机器人与 Coze 搭建的智能体进行对话,并利用飞书多维表格存储和管理稍后读数据,实现跨平台的稍后读收集与智能阅读计划推荐的具体操作方法: 前期准备: 1. 简化“收集”: 实现跨平台收集功能,支持电脑(web 端)、安卓、iOS 多端操作。 输入一个 URL 即可完成收集,借鉴微信文件传输助手的方式,通过聊天窗口完成收集输入。 2. 自动化“整理入库”: 系统在入库时自动整理每条内容的关键信息,包括标题、摘要、作者、发布平台、发布日期、收集时间和阅读状态。 阅读清单支持跨平台查看。 3. 智能“选择”推荐: 根据当前收藏记录和用户阅读兴趣进行相关性匹配,生成阅读计划。 使用飞书·稍后读助手: 1. 设置稍后读存储地址: 首次使用,访问。 点击「更多创建副本」,复制新表格的分享链接。 将新链接发送到智能体对话中。 还可以发送“查询存储位置”、“修改存储位置”来更换飞书多维表格链接,调整稍后读存储位置。 2. 收藏待阅读的页面链接: 在对话中输入需要收藏的页面链接,第一次使用会要求授权共享数据,授权通过后再次输入即可完成收藏。但目前部分页面链接可能小概率保存失败。 3. 智能推荐想看的内容: 在对话中发送“我想看 xx”、“xx 内容”,即可按个人兴趣推荐阅读计划。 至此,专属 AI 稍后读智能体大功告成,您可以尽情享受相关服务。
2025-01-27
大语言模型
大语言模型相关知识如下: Encoder:在大型语言模型中,Encoder 是模型的编码器部分,负责对输入的文本序列进行编码,获取其对应的语义表示。具有词嵌入、位置编码、注意力机制、层叠编码、上下文建模等关键作用。其输出是输入序列对应的上下文化语义表示,会被模型的 Decoder 部分利用。 介绍:大型语言模型是深度学习的一个子集,可以预训练并进行特定目的的微调。能解决诸如文本分类、问题回答、文档摘要、跨行业的文本生成等常见语言问题,还可利用相对较小的领域数据集进行定制以解决不同领域的特定问题。其三个主要特征是大型(训练数据集规模和参数数量大)、通用性(能解决常见问题)、预训练微调(用大型数据集预训练,用较小数据集微调)。使用大型语言模型的好处包括一种模型可用于不同任务、微调所需领域训练数据较少、性能随数据和参数增加而增长等。视频中还提到了自然语言处理中的提示设计和提示工程,以及三种类型的大型语言模型:通用语言模型、指令调整模型和对话调整模型。 性能对比:对比不同大型语言模型的性能需考虑多个维度,如理解能力、生成质量、知识广度和深度、泛化能力、鲁棒性、偏见和伦理、交互性和适应性、计算效率和资源消耗、易用性和集成性等。可采用标准基准测试、自定义任务、人类评估、A/B 测试、性能指标等方法进行有效比较。
2025-01-27
客服系统,需要写一段提示词给大模型,需求是,先跟用户表示歉意,产品问题请咨询我另外一个同事,点击同事名称即可咨询,每次回复的内容不能一样
以下是为您生成的客服系统相关的大模型提示词示例,每次回复内容不同: 1. 非常抱歉给您带来了不便,关于产品问题,您可以咨询我的同事,点击即可进行咨询。 2. 很抱歉让您遇到了困扰,产品方面的疑问请找我的同事咨询,点击就能联系到。 3. 实在不好意思呀,产品的问题您向我的同事咨询会更清楚,点击即可开启咨询。 4. 深感抱歉,对于产品的情况,建议您咨询我的同事,点击就能和他交流。 5. 抱歉给您造成了不好的体验,产品相关问题请咨询我的同事,点击就能获取帮助。
2025-01-26
当前最强AI模型有哪些?
当前最强的 AI 模型包括: 1. OpenAI 的 o3 模型:在 ARCAGI 测试中达到了 87.5%的准确率,几乎与人类水平相当。能够进行自我对话、多角度分析和自我质疑,具备一定的“思考意识”。下一代 o3mini 模型的推理能力能够媲美 o1 模型。 2. Google 的 Gemini 2.0 Flash:在重要的基准能力上直接追平甚至部分超越了 Gemini 1.5 Pro,同时模型速度有极大提升。 3. OpenAI 的 GPT4:是一个大型多模态模型,在各种专业和学术基准测试中表现出与人类相当的水平。 4. Midjourney v5:具有极高的一致性,擅长以更高分辨率解释自然语言 prompt,并支持像使用 tile 这样的重复图案等高级功能。 5. DALL·E 3:代表了生成完全符合文本的图像能力的一大飞跃。 6. Mistral 7B:在所有基准测试上超越了 Llama 2 13B,在许多基准测试上超越了 Llama 1 34B,在代码任务上接近 CodeLlama 7B 的性能,同时在英语任务上表现良好。 此外,还有智谱·AI 开源的一些模型,如 WebGLM10B、MathGLM2B 等。
2025-01-25