直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

中国头部的大模型公司分别是哪几家?

回答

以下是中国头部的大模型公司:

  • 北京:
    • 百度(文心一言):https://wenxin.baidu.com
    • 抖音(云雀大模型):https://www.doubao.com
    • 智谱 AI(GLM 大模型):https://chatglm.cn
    • 中科院(紫东太初大模型):https://xihe.mindspore.cn
    • 百川智能(百川大模型):https://www.baichuan-ai.com/
  • 上海:
    • 商汤(日日新大模型):https://www.sensetime.com/
    • MiniMax(ABAB 大模型):https://api.minimax.chat
    • 上海人工智能实验室(书生通用大模型):https://intern-ai.org.cn

此外,字节和腾讯都有团队在和外部大模型合作。创业公司中表现出色的有:

  • 智谱:一年间推出了 4 代 GLM,一直是国内能力最好的模型之一。
  • MiniMax:推出了 MoE 架构的新模型,和“星野”这个目前国内最成功的 AI 陪聊 APP。
  • 月之暗面:专注长 Token 能力,在记忆力和长 Token 能力上可圈可点。

通过 SuperCLUE 测评结果发现,文心一言 4.0、通义千问 2.0 引领国内大模型的研发进度,部分高质量大模型也在闭源应用和开源生态中形成自己独特的优势。从国内 TOP19 大模型的数量来看,创业公司和大厂的占比几乎持平。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

8月正式上线的国内大模型

5⃣️五家北京企业机构:百度(文心一言)https://wenxin.baidu.com抖音(云雀大模型)https://www.doubao.com智谱AI(GLM大模型)https://chatglm.cn中科院(紫东太初大模型)https://xihe.mindspore.cn百川智能(百川大模型)https://www.baichuan-ai.com/3⃣️三家上海企业机构:商汤(日日新大模型)https://www.sensetime.com/MiniMax(ABAB大模型)https://api.minimax.chat上海人工智能实验室(书生通用大模型)https://intern-ai.org.cn今天这8个大模型,在聊天状态下——能生成Markdown格式的:智谱清言、商量Sensechat、MiniMax目前不能进行自然语言交流的:昇思(可以对文本进行是否由AI生成的检测,类似论文查重,准确度不错)、书生受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有15元的预充值额度进行体验,完成企业认证后可以进行充值)特色功能:昇思——生图,MiniMax——语音合成

AGI万字长文(上)| 2023回顾与反思

另外,字节和腾讯都有团队在和外部大模型合作,很多外服务和产品也不是用的自己的模型。创业公司。目前明确看到有好模型、好产品的第一梯队公司大概如下:智谱:一年间推出了4代GLM,一直是国内能力最好的模型之一MiniMax:推出了MoE架构的新模型,和”星野“这个目前国内最成功的AI陪聊APP月之暗面:专注长Token能力,在记忆力和长Token能力上可圈可点

2023年度中文大模型基准测评报告.pdf

[title]VIRTUAL中文大模型基准测评2023年度报告[heading2]国内外大模型总体表现[heading3]国内大模型竞争格局国内大模型综合表现-SuperCLUE通过SuperCLUE测评结果发现,国内大模型的第一梯队有了更多新的模型加入。头部模型如文心一言4.0、通义千问2.0引领国内大模型的研发进度,部分高质量大模型紧追不舍,分别在闭源应用和开源生态中形成自己独特的优势。创业公司(9)vs大厂(10)创业公司大厂•从国内TOP19大模型的数量来看,创业公司和大厂的占比几乎持平。大厂和创业公司平均成绩对比

其他人在问
如何构建一个专属自己的智能体,用于撰写公司新闻稿,我会长期输入公司信息 请选择几家大模型公司的产品,具体说下操作步骤
以下是一些可用于构建专属智能体以撰写公司新闻稿的平台及操作步骤: 1. Coze:这是新一代的一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot。它集成了丰富的插件工具,能极大地拓展 Bot 的能力边界。 2. Microsoft 的 Copilot Studio:其主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据自身需求打造大模型时代的产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行设计良好的工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托于钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 在实际构建和应用智能体时,您可以遵循以下准则: 1. 彻底让自己变成一个“懒人”。 2. 能动嘴的不要动手(用嘴说出您想做的事远比打字来的快)。 3. 能动手的尽量用 AI(用 AI 远比您苦哈哈的手敲要来的快)。 4. 把您手上的工作单元切割开,建设属于自己的智能体。 5. 根据结果反馈不断调整自己的智能体。 6. 定期审视自己的工作流程,看哪个部分可以更多的用上 AI。 您可以根据自己的需求选择适合的平台进行进一步探索和应用。
2024-08-09
中国头部的大模型公司有哪些?
以下是中国头部的大模型公司: 北京: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com/ 上海: 商汤(日日新大模型):https://www.sensetime.com/ MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 此外,字节和腾讯都有团队在和外部大模型合作。创业公司中表现出色的有: 智谱:一年间推出了 4 代 GLM,一直是国内能力最好的模型之一。 MiniMax:推出了 MoE 架构的新模型,和“星野”这个目前国内最成功的 AI 陪聊 APP。 月之暗面:专注长 Token 能力,在记忆力和长 Token 能力上可圈可点。 通过 SuperCLUE 测评结果发现,国内大模型的第一梯队还有文心一言 4.0、通义千问 2.0 引领研发进度。从国内 TOP19 大模型的数量来看,创业公司和大厂的占比几乎持平。
2024-09-05
头部公司为了AI话费多少钱
以下是关于头部公司为了 AI 花费情况的一些信息: OpenAI 已投入 10 亿美元(主要来自 Musk),虽然拥有王牌团队和崇高使命,但对如何实现目标曾毫无头绪。 去年,大部分企业的生成式人工智能支出来自“创新”预算和其他一次性资金池。到 2024 年,许多头部企业将这些支出重新分配到更为永久的软件预算项上。一家公司提到基于 LLM 技术的客户服务每通电话节省了约 6 美元,总体节省了约 90%的成本,这是增加八倍投资于生成式人工智能的原因之一。 在生成式 AI 领域,大部分的钱花在了三大云上:AWS、谷歌云(GCP)和微软 Azure。三大云每年花费超千亿美元的资本支出以确保拥有全面、可靠、具成本优势的云平台。迄今为止,生成式 AI 领域最大的幕后赢家可能是运行了绝大多数 AI 工作负载的英伟达(NVIDIA)。此外,甲骨文等挑战者已通过巨额资本支出和销售激励进军市场,一些初创公司也在快速发展。
2024-08-26
因此在prompt中,把query放到头部和尾部,同时根据相似度,把相似度大的文档放到context的两端,是什么意思,要如何做到
在开发产品视角的大模型 RAG 应用的 Prompt 阶段,匹配出与问句向量最相似的 top k 个 chunk 后,将匹配出的文本和问句添加到配置好的 prompt 中提交给 LLM。在这个过程中,根据论文《Lost in the Middle:How Language Models Use Long Contexts》,由于大模型对上下文中间位置的知识点提取较差,所以把 query(即问句)放到 prompt 的头部和尾部,同时按照相似度,将相似度大的文档放置在 context(上下文)的两端,这样做能够提升回答效果。要做到这一点,需要在进行 prompt 工程时,选择最合适的 prompt 模板,并按照上述原则对 query 和相似度大的文档进行合理的位置安排。
2024-08-19
大模型的头部公司都有哪些
目前,大模型的头部公司有很多,以下是一些知名的公司: 百度:其文心一言是当前国内能力较好的模型之一。 抖音:云雀大模型具有一定的影响力。 智谱 AI:推出了多代 GLM 模型,在国内表现出色。 中科院:紫东太初大模型也备受关注。 百川智能:其百川大模型具有一定的特色。 商汤:日日新大模型在市场上有一定的知名度。 MiniMax:推出了具有特色的模型和产品。 这些公司在大模型领域都有一定的技术实力和市场影响力,但随着技术的不断发展,其他公司也可能会崛起。在选择使用大模型时,用户可以根据自己的需求和应用场景进行评估和选择。
2024-07-04
国内外好用的图生视频模型
以下是一些国内外好用的图生视频模型: 可灵(国内,免费) 网址:https://klingai.kuaishou.com/ 支持文生视频、图生视频。 支持图生视频首尾帧功能。 提示词可使用中文。 文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸。 图生视频除了不可运镜控制以外,其他跟文生视频基本相同。 默认生成 5s 的视频。 ETNA(国内) 网址:https://etna.7volcanoes.com/ 由七火山科技开发的文生视频 AI 模型。 可以根据用户简短的文本描述生成相应的视频内容。 生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps。 文生视频,支持中文,时空理解。 关于可灵的文生视频效果,测试者 Austin 周安鑫进行了以下测试: 1. 场景识别:包括室内和室外,如客厅的沙发、液晶电视、漂亮的波斯猫、超现实主义的蜿蜒河流、茂密森林、灿烂花海、碧绿草坪等。 2. 物体识别:涵盖静态和动态物体,如水晶球、跳动的火焰、翱翔的飞鸟、闪烁的流星、飞溅的水珠等。 3. 人物识别:包括面部和姿态,如一个人笑容灿烂、一个人惊恐愤怒,一位芭蕾舞女孩在冰面上跳舞等。 4. 动作识别:包含基本和复杂动作,如短跑运动员快速奔跑、赛车手驾驶跑车激烈漂移等。 5. 事件检测:有简单和复杂事件,如一位帅哥在喝水、外星文明和地球进行星际大战等。 6. 环境变化:涉及光线和天气,如奇幻的极光舞动变幻、城市写字楼灯光忽明忽暗、闪电交加、乌云密布、台风、大雨等。 7. 多对象场景:包括单一和多对象场景,如 1 个飞行员驾驶战斗机翱翔太空、海军指挥航母战斗群展开激烈战斗等。 8. 特殊场景:有遮挡和非标准场景,如城市大雾遮挡摩天大楼、一边是神秘海底世界,一边是梦幻糖果屋。 9. 细节检测:包含小物体和微表情,如崭新的苹果电脑屏幕上播放电影、瞳孔收缩、脸颊泛红、嘴唇微微颤抖。
2024-09-19
你自己使用的是什么模型
以下是关于模型的相关信息: 新的 gpt3.5turbo 模型针对会话进行了优化,原始的 GPT3.5 模型针对文本补全进行了优化。 用于创建嵌入和编辑文本的端点有自己的一组专用模型。 在 AI 输入框下方有一个下拉列表,允许选择要使用的模型。默认情况下,Cursor 已准备好使用的模型包括:GPT4o、GPT4、Claude 3.5 Sonnet、cursorsmall。其中,cursorsmall 是 Cursor 的自定义模型,不如 GPT4 智能,但速度更快,用户可无限制访问。您可以在 Cursor Settings > Models > Model Names 下添加其他模型。 谷歌一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是名为 PaLM 2 的模型。 Anthropic 发布了 Claude 2,其最值得注意的是有非常大的上下文窗口,与其他大型语言模型相比,不太可能恶意行事。
2024-09-19
推荐下好用的具备图像OCR能力的大模型
目前在具备图像 OCR 能力的大模型方面,一些较为知名和好用的包括百度的文心大模型、阿里云的通义大模型等。但大模型的性能和适用场景可能会因具体需求和使用场景的不同而有所差异。您可以根据自己的具体需求进一步评估和选择。
2024-09-19
AI 大模型命名 带有-instruct的含义
AI 大模型中带有“instruct”通常与指令微调相关。在大模型的训练过程中,指令微调是其中一个重要阶段。此阶段模型被训练以理解并执行具体指令,例如翻译文本等,从而能够回答问题。指令微调阶段输入的内容通常包括三个部分,如“Instruct:请你翻译下面这段话”“Input:一段英文”“Output:一段中文”。通过指令微调,模型能够更好地按照人类的期望和具体要求进行输出。
2024-09-19
你是基于哪个AI大模型的
我是 WaytoAGI 专属问答机器人,基于 Aily 和云雀大模型。 Aily 是飞书团队旗下的企业级 AI 应用开发平台,提供了简单、安全且高效的环境,帮助企业轻松构建和发布 AI 应用,推动业务创新和效率提升。 云雀是由字节跳动研发的语言模型,通过便捷的自然语言交互,能够高效地完成互动对话、信息获取、协助创作等任务。 此外,还有一些免费的大模型接口,如阿里的通义千问大模型接口,可创建 API key。智谱 AI(ChatGLM)、科大讯飞(SparkDesk)也有免费接口,但国内的大模型大多限制一定免费额度的 Token。 谷歌的 Gemini 大模型(gemini 1.5)、海外版 Coze 的 GPT4 模型是免费且能图片识别,但需要给服务器挂梯子。想使用的话,可参考张梦飞同学写的教程。 在深入了解 AI 运作原理和众多落地产品后,重新思考 AI 大模型引发的变革。此前曾有疑问,大模型与智能语音技能的 NLU 存在差异。语音技能 NLU 是通过一系列规则、分词策略等训练而成,运作逻辑规律可观测,具有 ifelse 式逻辑性。而大模型凭借海量数据在向量空间中学习知识的关联性形成,运作逻辑难以观测,脱离了 ifelse 的层面。
2024-09-19
如果我需要一名助手帮我运营跨境电商的线上店铺,我需要一些精准的关键词就可以训练模型吗?
训练模型来协助运营跨境电商线上店铺,仅依靠一些精准的关键词通常是不够的。模型的训练需要多方面的数据和信息,包括但不限于产品的详细描述、客户的评价和反馈、市场趋势、竞争对手的情况等。精准的关键词可以作为其中的一部分输入,但不足以全面有效地训练模型以达到理想的辅助运营效果。
2024-09-19
国内的应用层的ai公司如何盈利
国内的 AI 应用层公司盈利方式主要有以下几种: 1. 创造新的价值和场景:例如在移动互联网领域,出现了移动端的 IM 工具(微信、WhatsAPP)、打车(Uber、滴滴、Grab)、外卖(美团、Doordash)、短视频(抖音、Tiktok)等新的应用,这些应用并非颠覆上一代公司的业务,而是创造了新的价值和场景。 2. 融入现有工作流程:许多公司将 AI 融入工作流程,如工作流程自动化平台 ServiceNow 通过 AI 驱动的 Now Assist 实现了近 20%的事件避免率,Palo Alto Networks 利用 AI 降低了处理费用的成本,Hubspot 利用 AI 扩大了能够支持的用户规模,瑞典金融科技公司 Klarna 通过将 AI 融入用户支持节省了运行成本。 3. 抓住技术进步机会改造和提升现有业务:现有的大公司大部分会因技术进步而获利,关键在于能否抓住机会改造或提升现有业务。 同时,关于大模型能力与利润分配的问题,需要垄断才能获得超额收益。因为在有竞争的情况下,哪怕是寡头垄断,行业内的公司也无法获得定价权。只有在垄断市场中,售货方才拥有定价权,类似于今天英伟达的状态。定价权是超额收益,即超额毛利、超额净利的来源。
2024-09-13
国内有哪些不错的AI公司,他们的主要产品是什么,他们现在面临哪些问题
国内有不少不错的 AI 公司,以下是一些常见的公司及其主要产品和可能面临的问题: 图像类 AI 产品:国内的图像 AI 产品发展迅速,已在某些方面开始引领潮流。 聊天对话类 AI 产品:例如“猫箱”“剧本戏”“名人朋友圈”等主打 AI 角色扮演赛道;“星野”“Talkie”“BubblePal”等主打 AI 陪伴类;还有做 AI 搜索工具的产品如“秘塔”“360 搜索”等;单纯做 AIGC 的产品如“可灵”“ai 写作手”“即梦”“md”等;以及 agent 产品,目前只有头部的厂商在做,比如字节的扣子,支付宝的智能助理,百度的文心智能体,腾讯的元宝。 然而,这些公司可能面临一些问题,比如: 1. 技术研发方面,需要不断投入以保持竞争力,突破技术瓶颈。 2. 市场竞争激烈,需要不断创新和优化产品以满足用户需求。 3. 数据隐私和安全问题,需要加强保护措施以符合法规要求。 4. 产品推广和用户教育成本较高,需要找到有效的营销策略。
2024-09-13
面试AI公司,需要了解的资料
以下是面试 AI 公司需要了解的资料: 一、AI 市场与 AI 产品经理 (一)AI 就业市场 1. 鱼龙混杂,求职者要做好信息甄别。即使面试通过拿到 offer,除了看 boss 直聘的招聘评价,一定要提前收集其他信息,如在脉脉上搜一下这家公司靠不靠谱。 2. 一些公司实际上没搞懂用 AI 能为自己企业带来什么价值,只是处于焦虑或跟风心态要做 AI,这部分企业可以聊,但要求求职者要有咨询和商业化的思维,能帮公司厘清业务增长机会。 3. 不同公司对 AI 产品经理的定位不同,所以招聘市场上对 AI 产品经理的岗位职责和任职要求也不同,慢慢会统一标准,这也是产品经理转型的机会。 4. 有行业沉淀和认知的产品经理转型会更有机会,类似之前的“互联网+”,目前应用层的机会在“AI+行业”,只懂 AI 或只懂行业是不够的。还有就是业务创新,找到细分的场景痛点并完成 PMF 验证,海外有很多优秀案例。 二、AI 面试官的相关产品 1. 用友大易 AI 面试产品:具有强大的技术底座、高度的场景贴合度、招聘全环节集成的解决方案、先进的防作弊技术以及严密的数据安全保障。可以帮助企业完成面试,还能借助人岗匹配模型,自主完成初筛,并对符合企业要求的候选人自动发送面试邀约。 2. 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上。同时候选人体验也得到改善、到面率比之前提升最高达 30%。 3. InterviewAI:这是一个在线平台,提供与面试职位相关的问题和由 AI 生成的推荐答案。候选人可以使用设备上的麦克风回答每个问题,每个问题最多回答三次。对于每个答案,候选人将收到评估、建议和得分。 使用这些产品时,企业需要考虑到数据安全性和隐私保护的问题。 三、Python + AI 学习 (一)Python 学习 1. 属性和方法:学习如何为类定义属性和方法,以及如何通过对象来调用它们。 2. 继承和多态:了解类之间的继承关系以及如何实现多态。 3. 异常处理 理解异常:了解什么是异常,以及它们在 Python 中是如何工作的。 异常处理:学习如何使用 try 和 except 语句来处理程序中可能发生的错误。 4. 文件操作 文件读写:学习如何打开文件、读取文件内容以及写入文件。 文件与路径操作:理解如何使用 Python 来处理文件路径,以及如何列举目录下的文件。 (二)AI 学习 1. 基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 2. 历史发展:简要回顾 AI 的发展历程和重要里程碑。 3. 数学基础 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等线性代数基本概念。 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 4. 算法和模型 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。
2024-09-13
哪个中文ai写公司文案最好用
在中文 AI 写公司文案方面,Kimi 的表现较为突出。国产大模型在本土化方面具有优势,对中文的理解和写作能力相对更强。 在写文案时,可以先利用 360 浏览器的字幕提取功能捕捉相关视频文案,然后分别让 Kimi 和 ChatGPT 进行分析和学习,理解目标写作风格并融会贯通。之后让 AI 按照此风格写作,并对比二者结果进行整合调整。 此外,OpenAI 的 GPT4 是先进且广泛使用的大型语言模型,在多种任务上性能卓越。除了 OpenAI 的 GPT 系列,还有 Anthropic 公司的 Claude 3、谷歌的 Gemini、百度的文心一言、阿里巴巴的通义大模型等,它们在特定领域和任务上也有出色表现。如果想了解国内大模型效果,可参考第三方基准评测报告: 。但需注意内容由 AI 大模型生成,请仔细甄别。
2024-09-13
现在国内有多少家研发AI的公司
目前国内研发 AI 的公司数量众多,难以给出确切的统计数字。一些知名的公司包括智谱 AI 等。智谱 AI 模型具有开创性,其产品在智能体开发和模型优化方面积累了丰富经验,在逻辑推理和处理复杂提示词方面表现出色。同时,应用公司在 AI 领域也占据主导地位,成千上万的公司正在将 AI 整合到工作流程中。
2024-09-07
字节投资的AI公司
以下是字节投资的部分 AI 公司相关信息: 近期热门融资 AI 产品中包括:You.com(多种搜索模式且重隐私的搜索引擎)、Genspark(通过 Sparkpages 来满足用户个性化的搜索需求)、Rockset(刚被 OpenAI 收购的提供实时搜索和分析数据库服务的公司)、Butterflies AI(人类与 AI 共存的社交软件)、MeetRecord(可以对销售通话进行记录和辅导的 AI 助手)。 中国 AI 生态 2023 上半年投资地图中的部分公司有:生数科技(创始人:唐家渝,是全球领先的生成式人工智能基础设施建设者,正积极打造世界领先的可控多模态通用大模型,致力于通过生成式 AI 技术提升全人类的创造力与生产力)、西湖心辰(创始人:蓝振忠,开发的西湖大模型既具备通过跨领域的知识解决问题的超高智商,也具备通过情感感知、长期记忆形成的超高情商)、影眸科技(创始人:吴迪,孵化于上海科技大学,通过与国内顶尖人工智能、计算机视觉实验室合作,积极推动尖端实验室科研成果的民用化、商业化,探索前沿人工智能、计算机视觉技术在大众娱乐市场的推广应用)。
2024-09-06