以下是一些常见的大模型及其版本:
此外,还有:
[title]VIRTUAL中文大模型基准测评2023年度报告[heading2]测评模型列表[heading3]12.PCI-TransGPT佳都科技小范围内测API版本25.Chinese-Alpaca2-13B yiming cui(个人开发者)个人开源的基于Llama2的汉化版中文模型13.360GPT_Pro 360 360智脑的API升级版本Pro26.Llama_2_13B_Chat Meta官方开源的2代13B的Chat版本本次测评数据选取了SuperCLUE-12月测评结果,模型选取了国内外有代表性的26个大模型在12月份的版本。SuperCLUE模型象限
这里我们选用Baichuan2-7B-Chat的版本(预训练模型也可在文末网盘中下载),使用LLaMA-Efficient-Tuning训练框架,根据自己的cuda版本安装pytorch,安装bitsandbytes做量化服务
360作为国内唯一又懂大模型又懂安全的双料厂商,我们要解决大模型的安全问题,必须亲自躬身入局。我的想法是以“模法”打败魔法,因为大模型越来越智能,它的安全问题肯定不是用传统安全的路子来解决,所以我们提出了以模制模的理念。我们打造一个专业的聪明的大模型,它没有别的能力,就用来盯着其他大模型,如果发现有不安全的因素输出,或者不轨的行为,对其他大模型的行为进行分析和监控。目前这个大模型是个初级版本,只发展到3.0。我们只依赖大模型本身的能力,就是说不依赖外部工具,不依赖微调,也就是没有作弊。现在有些大模型测试很容易作弊,你提前把考题头天晚上做一遍,第二天去考试怎么也能考个七八十分。我们就在恶意流量分析和恶意邮件检测效果方面,全面超越GPT 4。再跟360积累了很多年的工具做结合,你让这个大模型写诗写不出来,奥数题也回答不了,它只干一件事——攻击事件的检测和发现。