以下是关于中文大模型的相关信息:
9.Qwen-72B-Chat阿里巴巴开源的72B的Chat版本22.讯飞星火V3.0科大讯飞官方发布的V3.0版本的API10.序列猴子出门问问官方发布的API版本23.Minimax(应事)稀宇科技官方网页版产品【应事】11.Yi-34B-Chat零一万物开源的34B的Chat版本24.ChatGLM3-6B清华&智谱AI开源的第三代6B版本12.PCI-TransGPT佳都科技小范围内测API版本25.Chinese-Alpaca2-13B yiming cui(个人开发者)个人开源的基于Llama2的汉化版中文模型13.360GPT_Pro 360 360智脑的API升级版本Pro26.Llama_2_13B_Chat Meta官方开源的2代13B的Chat版本本次测评数据选取了SuperCLUE-12月测评结果,模型选取了国内外有代表性的26个大模型在12月份的版本。SuperCLUE模型象限
测评表现测评分析专业与技能,考察模型的能力包括:计算、逻辑与推理、代码。在专业技能与知识的测评中,GPT-4 Turbo领先幅度较大,总分97分是唯一过90分且接近满分的大模型。国内大模型中文心一言4.0表现不俗,取得79.62的高分。较GPT4的API版本仅低1.53分,是国内模型中唯一接近80分的大模型。仅随其后的是通义千问2.0、Moonshot等模型。其中有11个大模型有超过GPT3.5的表现。在开源模型中,阿里云的Qwen-72B-Chat表现可圈可点,是国内开源模型中唯一超过60分的模型。总体来看,在专业与知识能力上,国内第一梯队大模型与国外最好模型依然有较大距离,但可以看到的是差距正在不断缩小。
欢迎来到Llama中文大模型:已经基于大规模中文数据,从预训练开始对Llama2模型进行中文能力的持续迭代升级。Llama中文大模型:https://github.com/LlamaFamily/Llama-Chinese在线体验:https://llama.family基于Llama2的开源中文预训练大模型Atom-7B:https://huggingface.co/FlagAlpha/Atom-7B-Chat