Chat with Wiki - 国内大模型领域关键人物、关键院校

Answer

以下是国内大模型领域的关键人物、关键院校及相关信息：

8 月正式上线的国内大模型：
- 北京：
  - 百度（文心一言）：https://wenxin.baidu.com
  - 抖音（云雀大模型）：https://www.doubao.com
  - 智谱 AI（GLM 大模型）：https://chatglm.cn
  - 中科院（紫东太初大模型）：https://xihe.mindspore.cn
  - 百川智能（百川大模型）：https://www.baichuan-ai.com/
- 上海：
  - 商汤（日日新大模型）：https://www.sensetime.com/
  - MiniMax（ABAB 大模型）：https://api.minimax.chat
  - 上海人工智能实验室（书生通用大模型）：https://intern-ai.org.cn
- 聊天状态下能生成 Markdown 格式的：智谱清言、商量 Sensechat、MiniMax
- 目前不能进行自然语言交流的：昇思、书生
- 受限制使用：MiniMax（无法对生成的文本进行复制输出，且只有 15 元的预充值额度进行体验，完成企业认证后可以进行充值）
- 特色功能：昇思——生图，MiniMax——语音合成
- 阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。据悉，广东地区获批公司分别为华为、腾讯，科大讯飞系其他地区获批产品。
中文大模型评测收集与调研：
- InfoQ + 极客帮：https://www.guotaixia.com/post/5124.html
- GAOKAO-Bench：地址:https://github.com/OpenLMLab/GAOKAO-Bench ，是一个以中国高考题目为数据集，测评大模型语言理解能力、逻辑推理能力的测评框架
- 清华安全大模型测评：地址：http://115.182.62.166:18000 ，清华收集的一个评测集，涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别，包括细粒度划分的 40 余个二级安全类别
- JioNLP 个人测评：评测数据集：https://github.com/dongrixinyu/JioNLP/wiki/LLM 评测数据集，考察 LLM 模型对人类用户的帮助效果、辅助能力，可否达到一个【智能助手】的水平。题型介绍：选择题来源于中国大陆国内各种专业性考试，重点在于考察模型对客观知识的覆盖面，占比 32%；主观题来源于日常总结，主要考察用户对 LLM 常用功能的效果。
- EduTEP：华东师范大学计算机科学与技术学院 EduNLP 团队组建智能教育算法测评小组，开发智能教育可信评测平台（EduTEP）。EduTEP 对比多种大模型在教育领域中的综合性能，针对 K12 教育发布首个 CALM-EDU 评测框架与 CALM-EDU001 评测报告
- 娱乐资本论：我们的测试并非旨在提供学术上的严谨标准，我们的目标是：从实用的角度出发，分析这些大模型在各种文本应用场景，如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现
中国大模型面临的真实问题：
- OpenAI 对字节跳动可能存在的违规使用其技术和知识产权的指控，字节跳动回应在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中，但强调该模型仅用于测试，从未计划上线或对外使用，且自 2023 年 4 月公司引入 GPT API 调用规范检查后已停止这种做法。
- 2024 年也有更多被指“套壳”国内大模型的事件，比如斯坦福大学 AI 团队主导的 Llama3-V 开源模型，被证实套壳抄袭国内清华与面壁智能的开源模型。大模型的建设方式粗浅地分为三类。

Content generated by AI large model, please carefully verify (powered by aily)

References

5⃣️五家北京企业机构：百度（文心一言）https://wenxin.baidu.com抖音（云雀大模型）https://www.doubao.com智谱AI（GLM大模型）https://chatglm.cn中科院（紫东太初大模型）https://xihe.mindspore.cn百川智能（百川大模型）https://www.baichuan-ai.com/3⃣️三家上海企业机构：商汤（日日新大模型）https://www.sensetime.com/MiniMax（ABAB大模型）https://api.minimax.chat上海人工智能实验室（书生通用大模型）https://intern-ai.org.cn今天这8个大模型，在聊天状态下——能生成Markdown格式的：智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的：昇思（可以对文本进行是否由AI生成的检测，类似论文查重，准确度不错）、书生受限制使用：MiniMax（无法对生成的文本进行复制输出，且只有15元的预充值额度进行体验，完成企业认证后可以进行充值）特色功能：昇思——生图，MiniMax——语音合成阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中，广东省2家和其他省市1家也将陆续开放据悉，广东地区获批公司分别为华为、腾讯，科大讯飞系其他地区获批产品

附：中文大模型评测收集与调研

https://www.guotaixia.com/post/5124.html[heading2]GAOKAO-Bench[content]地址:https://github.com/OpenLMLab/GAOKAO-BenchGAOKAO-bench是一个以中国高考题目为数据集，测评大模型语言理解能力、逻辑推理能力的测评框架[heading2]清华安全大模型测评[content]地址：http://115.182.62.166:18000清华收集的一个评测集，涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别，包括细粒度划分的40余个二级安全类别[heading2]JioNLP个人测评[content]评测数据集：https://github.com/dongrixinyu/JioNLP/wiki/LLM评测数据集考察LLM模型对人类用户的帮助效果、辅助能力，可否达到一个【智能助手】的水平。题型介绍：选择题来源于中国大陆国内各种专业性考试，重点在于考察模型对客观知识的覆盖面，占比32%；主观题来源于日常总结，主要考察用户对LLM常用功能的效果。给了一些标准[heading2]EduTEP[content]华东师范大学计算机科学与技术学院EduNLP团队组建智能教育算法测评小组，开发智能教育可信评测平台（EduTEP）。EduTEP对比多种大模型在教育领域中的综合性能，针对K12教育发布首个CALM-EDU评测框架与CALM-EDU001评测报告[heading2]娱乐资本论[content]我们的测试并非旨在提供学术上的严谨标准，我们的目标是：从实用的角度出发，分析这些大模型在各种文本应用场景，如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现

中国大模型面临的真实问题：登顶路远，坠落一瞬

OpenAI的反应迅速而坚决。他们立即暂停了相关账号，并表示将进行进一步调查。如果指控属实，OpenAI可能会要求字节跳动更改其做法，甚至可能终止其账户。这种严厉的态度，展现了OpenAI对其技术和知识产权的坚决保护。面对这一指控，字节跳动的回应颇具策略性。他们承认在2023年初，技术团队在大模型探索的初期确实有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。然而，他们强调这个模型仅用于测试，从未计划上线或对外使用。更重要的是，字节跳动表示，自2023年4月公司引入GPT API调用规范检查后，这种做法就已经停止了。其实，不光是这些在23年披露出来的国内事件，在24年也有更多被指“套壳”国内大模型的事件，比如说斯坦福大学AI团队主导的Llama3-V开源模型，被证实套壳抄袭国内清华与面壁智能的开源模型。这些现象其实背后都指向了大模型的建设方式。在这里，我们粗浅地将大模型的建设方式分为三类：