百川大模型在国内的表现较为出色。
百川智能于 6 月 15 日开源 Baichuan1、9 月 6 日开源 Baichuan2,10 月 31 日发布 Baichuan2192K,是中文开源模型的主导力量。
Baichuan2-13B-Chat 在逻辑推理、知识百科、生成与创作、上下文对话等基础能力上排名 200 亿参数量级国内模型第一,其中逻辑推理能力超过 34B 参数量级的大模型,生成与创作能力超过 72B 参数量级的模型。但在计算和代码能力上有一定优化空间。综合来看,在同等量级开源模型中非常有竞争力。
在中文大模型基准测评 2023 年度报告中,虽然与国外顶尖模型仍有差距,但过去 1 年国内大模型已有长足进步,百川大模型也是表现较好的模型之一。
百川大模型可应用的场景相对广泛且可以私有化部署,重点推荐在小说/广告/公文写作等内容创作场景、智能客服/语音助手以及任务拆解规划等场景。同时,它可以部署在教育、医疗、金融等垂直行业中应用,也可部署在低算力终端处理基础智能任务。
8 月正式上线的国内大模型中,百川智能的百川大模型位列其中,其网址为:https://www.baichuan-ai.com/
[title]VIRTUAL[heading1]国内大模型关键进展Baichuan2-13B-Chat是百川智能自主训练的开源大语言模型。百川智能于6月15日开源Baichuan1、9月6日开源Baichuan2,10月31日发布Baichuan2192K。是中文开源模型的主导力量。模型特点:Baichuan2-13B-Chat在逻辑推理、知识百科、生成与创作、上下文对话等基础能力上排名200亿参数量级国内模型第一,其中逻辑推理能力超过34B参数量级的大模型,生成与创作能力超过72B参数量级的模型,表现不俗。在计算和代码能力上有一定优化空间。综合来看,Baichuan2-13B-Chat在同等量级开源模型中非常有竞争力。适合应用:Baichuan2-13B-Chat可应用的场景相对广泛且可以私有化部署。重点推荐在小说/广告/公文写作等内容创作场景、智能客服/语音助手以及任务拆解规划等场景。另外,Baichuan2-13B-Chat可以部署在教育、医疗、金融等垂直行业中应用,同时可部署在低算力终端处理基础智能任务。优秀模型:智谱清言(清华&智谱AI)简介:
外大模型。其中国内最好模型文心一言[heading4]4.0(API)总分79.02分,距离GPT4-Turbo有[content]11.61分,距离GPT4(网页)有4.9分的差距。必须看到的是,过去1年国内大模型已经有了长足的进步。综合能力超过G P T 3.5和Gemini-Pro的模型有11个,比如百度的文心一言4.0、阿里云的通义千问2.0和Qw e n 72B-Chat、OPPO的AndesGPT、清华&智谱AI的智谱清言、字节跳动的云雀大模型等都有比较好的表现。•在SuperCLUE测评中,国外模型的平均成绩为69.42分,国内模型平均成绩为65.95分,差距在4分左右。另外国内开源模型在中文上表现要好于国外开源模型,如百川智能的Baichuan2-13B-Chat、•可以看出,国内外的平均水平差距在缩小,11月差距在10分左右。阿里云的Qwen-72B、Yi -34B-Cha t均优于Llama2-13B-Chat。
5⃣️五家北京企业机构:百度(文心一言)https://wenxin.baidu.com抖音(云雀大模型)https://www.doubao.com智谱AI(GLM大模型)https://chatglm.cn中科院(紫东太初大模型)https://xihe.mindspore.cn百川智能(百川大模型)https://www.baichuan-ai.com/3⃣️三家上海企业机构:商汤(日日新大模型)https://www.sensetime.com/MiniMax(ABAB大模型)https://api.minimax.chat上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn今天这8个大模型,在聊天状态下——能生成Markdown格式的:智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的:昇思(可以对文本进行是否由AI生成的检测,类似论文查重,准确度不错)、书生受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有15元的预充值额度进行体验,完成企业认证后可以进行充值)特色功能:昇思——生图,MiniMax——语音合成