DeepSeek 是一家成立于 2023 年,总部位于中国杭州,专注于人工智能基础技术研究的科技公司。其致力于探索 AGI(通用人工智能)的实现路径,定位为聚焦大模型研发与应用,提供高效、安全、可控的 AI 技术解决方案。
将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,认为其秘方是多快好省也不全面。早在 2024 年 5 月 DeepSeek-V2 发布时,它就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,V2 的论文引发了 AI 研究界的广泛分享和讨论。当时在国内舆论场,DeepSeek 被描摹成“大模型价格战的发起者”。
如果 V-3 是 DeepSeek 的 GPT-3 时刻,接下来会怎样没人知道,但有意思的事还在后头。DeepSeek 应会为全人类的人工智能事业做出更大贡献,且已是中国最全球化的 AI 公司之一,其赢得尊重的秘方是硅谷味儿的。
使用地址:https://chat.deepseek.com/(有手机客户端) 模型下载地址:https://github.com/deepseek-ai/DeepSeek-LLM?tab=readme-ov-file API 文档地址:https://api-docs.deepseek.com/zh-cn/ DeepSeek 的提示词使用方法比较长,单独列了一篇DeepSeek-R1 提示词交互实践指南
将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。
如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。
使用地址:https://chat.deepseek.com/(有手机客户端)模型下载地址:https://github.com/deepseek-ai/DeepSeek-LLM?tab=readme-ov-fileAPI文档地址:https://api-docs.deepseek.com/zh-cn/DeepSeek的提示词使用方法比较长,单独列了一篇[DeepSeek-R1提示词交互实践指南](https://waytoagi.feishu.cn/wiki/ISVZwe05Tio9hEkFSF5cIjZ7nVf)[heading1]公司简介[content]DeepSeek(深度求索)是一家专注于人工智能基础技术研究的科技公司,致力于探索AGI(通用人工智能)的实现路径。公司背景成立时间:2023年总部:中国杭州定位:聚焦大模型研发与应用,提供高效、安全、可控的AI技术解决方案。