以下是国内大模型领域的关键人物、关键院校及相关信息:
5⃣️五家北京企业机构:百度(文心一言)https://wenxin.baidu.com抖音(云雀大模型)https://www.doubao.com智谱AI(GLM大模型)https://chatglm.cn中科院(紫东太初大模型)https://xihe.mindspore.cn百川智能(百川大模型)https://www.baichuan-ai.com/3⃣️三家上海企业机构:商汤(日日新大模型)https://www.sensetime.com/MiniMax(ABAB大模型)https://api.minimax.chat上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn今天这8个大模型,在聊天状态下——能生成Markdown格式的:智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的:昇思(可以对文本进行是否由AI生成的检测,类似论文查重,准确度不错)、书生受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有15元的预充值额度进行体验,完成企业认证后可以进行充值)特色功能:昇思——生图,MiniMax——语音合成阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中,广东省2家和其他省市1家也将陆续开放据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品
https://www.guotaixia.com/post/5124.html[heading2]GAOKAO-Bench[content]地址:https://github.com/OpenLMLab/GAOKAO-BenchGAOKAO-bench是一个以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架[heading2]清华安全大模型测评[content]地址:http://115.182.62.166:18000清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的40余个二级安全类别[heading2]JioNLP个人测评[content]评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM评测数据集考察LLM模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。题型介绍:选择题来源于中国大陆国内各种专业性考试,重点在于考察模型对客观知识的覆盖面,占比32%;主观题来源于日常总结,主要考察用户对LLM常用功能的效果。给了一些标准[heading2]EduTEP[content]华东师范大学计算机科学与技术学院EduNLP团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP对比多种大模型在教育领域中的综合性能,针对K12教育发布首个CALM-EDU评测框架与CALM-EDU001评测报告[heading2]娱乐资本论[content]我们的测试并非旨在提供学术上的严谨标准,我们的目标是:从实用的角度出发,分析这些大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现
OpenAI的反应迅速而坚决。他们立即暂停了相关账号,并表示将进行进一步调查。如果指控属实,OpenAI可能会要求字节跳动更改其做法,甚至可能终止其账户。这种严厉的态度,展现了OpenAI对其技术和知识产权的坚决保护。面对这一指控,字节跳动的回应颇具策略性。他们承认在2023年初,技术团队在大模型探索的初期确实有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。然而,他们强调这个模型仅用于测试,从未计划上线或对外使用。更重要的是,字节跳动表示,自2023年4月公司引入GPT API调用规范检查后,这种做法就已经停止了。其实,不光是这些在23年披露出来的国内事件,在24年也有更多被指“套壳”国内大模型的事件,比如说斯坦福大学AI团队主导的Llama3-V开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。这些现象其实背后都指向了大模型的建设方式。在这里,我们粗浅地将大模型的建设方式分为三类: