Chat with Wiki - 目前国内ai大模型排名

Answer

国内的大模型排名可能会随时间变化。要获取最新排名，您可以通过以下途径：

查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台。
在通往 AGI 之路的知识库里，AI 研究报告版块-企业及媒体报告会定期更新相关排名报告。

以下是部分大模型信息：

8 月正式上线的国内大模型：
- 北京：百度（文心一言）https://wenxin.baidu.com 、抖音（云雀大模型）https://www.doubao.com 、智谱 AI（GLM 大模型）https://chatglm.cn 、中科院（紫东太初大模型）https://xihe.mindspore.cn 、百川智能（百川大模型）https://www.baichuan-ai.com/
- 上海：商汤（日日新大模型）https://www.sensetime.com/ 、MiniMax（ABAB 大模型）https://api.minimax.chat 、上海人工智能实验室（书生通用大模型）https://intern-ai.org.cn
- 能生成 Markdown 格式的：智谱清言、商量 Sensechat、MiniMax
- 目前不能进行自然语言交流的：昇思（可以对文本进行是否由 AI 生成的检测，类似论文查重，准确度不错）、书生
- 受限制使用：MiniMax（无法对生成的文本进行复制输出，且只有 15 元的预充值额度进行体验，完成企业认证后可以进行充值）
- 特色功能：昇思——生图，MiniMax——语音合成
- 阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。据悉，广东地区获批公司分别为华为、腾讯，科大讯飞系其他地区获批产品。

在中文大模型基准测评 2023 年度报告的专项基准 SuperCLUE 基准 - 工具使用能力测评中：

GPT-4 Turbo 取得满分。
国内大模型中智谱清言表现不俗，取得 83.78 的高分，排名国内模型第一。
紧随其后的是文心一言 4.0(API)、通义千问 2.0、Yi-34B-Chat、AndesGPT 均有超过 70 分的表现。
超过 GPT3.5 的国内模型有 12 个。
在开源模型中，Baichuan2-13B-Chat、Xverse-13B-2-Caht 的表现可圈可点，均超过 GPT3.5 以及众多闭源模型。总体来看，在工具使用能力上，国内大模型的表现优异，与国内大模型厂商积极落地应用密不可分。

内容由 AI 大模型生成，请仔细甄别。

Content generated by AI large model, please carefully verify (powered by aily)

References

问：最新的国内大模型排名

[title]问：最新的国内大模型排名中国国内的大模型排名可能在短时间内会有变化，作为AI机器人无法提供最新的信息。要获取最新的中国国内大模型排名，你可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台，这些渠道通常会及时发布最新的排名和评价。在通往AGI之路的知识库里，在[AI研究报告版块](https://waytoagi.feishu.cn/wiki/WvhZwk16WiEnSvk8AcpcdZetnMe?table=tblzSv68AMuLhHj8&view=vewwFuhGE0)-[企业及媒体报告](https://waytoagi.feishu.cn/wiki/WvhZwk16WiEnSvk8AcpcdZetnMe?table=tblzSv68AMuLhHj8&view=vewwFuhGE0)会定期更新相关的排名报告，可以供您查阅。内容由AI大模型生成，请仔细甄别。

8月正式上线的国内大模型

[title]8月正式上线的国内大模型5⃣️五家北京企业机构：百度（文心一言）https://wenxin.baidu.com抖音（云雀大模型）https://www.doubao.com智谱AI（GLM大模型）https://chatglm.cn中科院（紫东太初大模型）https://xihe.mindspore.cn百川智能（百川大模型）https://www.baichuan-ai.com/3⃣️三家上海企业机构：商汤（日日新大模型）https://www.sensetime.com/MiniMax（ABAB大模型）https://api.minimax.chat上海人工智能实验室（书生通用大模型）https://intern-ai.org.cn今天这8个大模型，在聊天状态下——能生成Markdown格式的：智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的：昇思（可以对文本进行是否由AI生成的检测，类似论文查重，准确度不错）、书生受限制使用：MiniMax（无法对生成的文本进行复制输出，且只有15元的预充值额度进行体验，完成企业认证后可以进行充值）特色功能：昇思——生图，MiniMax——语音合成阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中，广东省2家和其他省市1家也将陆续开放据悉，广东地区获批公司分别为华为、腾讯，科大讯飞系其他地区获批产品

2023年度中文大模型基准测评报告.pdf

[title]中文大模型基准测评2023年度报告[heading1]专项基准[heading1]SuperCLUE基准-工具使用能力测评表现测评分析工具使用，考察模型的能力包括：检索API、调用API、规划API、通用工具使用。在工具使用的测评中，GPT-4 Turbo取得了满分。国内大模型中智谱清言表现不俗，取得了83.78的高分，排名国内模型第一。仅随其后的是文心一言4.0(API)、通义千问2.0、Yi-34B-Chat、AndesGPT均有超过70分的表现。其他国内模型同样有不错的表现，超过GPT3.5的模型有12个。在开源模型中，Baichuan2-13B-Chat、Xverse-13B-2-Caht的表现可圈可点，均超过GPT3.5以及众多闭源模型。总体来看，在工具使用能力上，国内大模型的表现优异，与国内大模型厂商积极落地应用密不可分。