Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 是一家成立于 2023 年,总部位于中国杭州,专注于人工智能基础技术研究的科技公司。其致力于探索 AGI(通用人工智能)的实现路径,定位为聚焦大模型研发与应用,提供高效、安全、可控的 AI 技术解决方案。

将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,认为其秘方是多快好省也不全面。早在 2024 年 5 月 DeepSeek-V2 发布时,它就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,V2 的论文引发了 AI 研究界的广泛分享和讨论。当时在国内舆论场,DeepSeek 被描摹成“大模型价格战的发起者”。

如果 V-3 是 DeepSeek 的 GPT-3 时刻,接下来会怎样没人知道,但有意思的事还在后头。DeepSeek 应会为全人类的人工智能事业做出更大贡献,且已是中国最全球化的 AI 公司之一,其赢得尊重的秘方是硅谷味儿的。

使用地址:https://chat.deepseek.com/(有手机客户端) 模型下载地址:https://github.com/deepseek-ai/DeepSeek-LLM?tab=readme-ov-file API 文档地址:https://api-docs.deepseek.com/zh-cn/ DeepSeek 的提示词使用方法比较长,单独列了一篇DeepSeek-R1 提示词交互实践指南

Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

详解:DeepSeek深度推理+联网搜索 目前断档第一

使用地址:https://chat.deepseek.com/(有手机客户端)模型下载地址:https://github.com/deepseek-ai/DeepSeek-LLM?tab=readme-ov-fileAPI文档地址:https://api-docs.deepseek.com/zh-cn/DeepSeek的提示词使用方法比较长,单独列了一篇[DeepSeek-R1提示词交互实践指南](https://waytoagi.feishu.cn/wiki/ISVZwe05Tio9hEkFSF5cIjZ7nVf)[heading1]公司简介[content]DeepSeek(深度求索)是一家专注于人工智能基础技术研究的科技公司,致力于探索AGI(通用人工智能)的实现路径。公司背景成立时间:2023年总部:中国杭州定位:聚焦大模型研发与应用,提供高效、安全、可控的AI技术解决方案。

Others are asking
如何在DEEPSEEK里创建一个专门用于”爆款文案二创“的智能体?
在 DEEPSEEK 里创建一个专门用于“爆款文案二创”的智能体,您可以按照以下步骤进行操作: 1. 添加工作流:将已经发布的工作流添加到创建好的智能体。 2. 设定人设与回复逻辑:设定与“爆款文案二创”相关的人设和回复逻辑。 3. 测试:对设定好的智能体进行测试。 4. 发布智能体:选择右上角,填写发布信息,选择发布渠道,确认发布,等待审核完成,发布成功。发布成功之后,点击分享,复制访问链接给朋友。 需要注意的是,以上步骤仅供参考,具体操作可能因 DEEPSEEK 平台的更新而有所变化。
2025-02-06
linux 下部署deepseek
在 Linux 下部署 DeepSeek 的步骤如下: 1. 下载代码仓库。 2. 安装依赖(注意有两个依赖未放在 requirements.txt 里)。 3. 启动 webui 的 demo 程序,然后用浏览器登陆服务器的 ip:8080 就能试玩。此 demo 提供了 3 个参数: server_name:服务器的 ip 地址,默认 0.0.0.0。 servic_port:即将开启的端口号。 local_path:模型存储的本地路径。 4. 第一次启动后生成语音时,需查看控制台输出,它会下载一些模型文件,因此比较慢,且可能因网络问题失败。但第一次加载成功后,后续会顺利。 5. 基于此基础可进行拓展,比如集成到 agent 的工具中,或结合 chatgpt 做更拟人化的实时沟通。 webui 上可设置的几个参数说明: text:指需要转换成语音的文字内容。 Refine text:选择是否自动对输入的文本进行优化处理。 Audio Seed:语音种子,是一个数字参数,用于选择声音类型,默认值为 2,是很知性的女孩子的声音。 Text Seed:文本种子,是一个正整数参数,用于 refine 文本的停顿。实测文本的停顿设置会影响音色、音调。 额外提示词(可写在 input Text 里):用于添加笑声、停顿等效果。例如,可以设置为 。 使用 DeepSeek 的步骤: 1. 搜索 www.deepseek.com,点击“开始对话”。 2. 将装有提示词的代码发给 Deepseek。 3. 认真阅读开场白之后,正式开始对话。 DeepSeek 的设计思路: 1. 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻调试负担。 2. 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 3. 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 4. 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 5. 用 XML 来进行更为规范的设定,而不是用 Lisp(有难度)和 Markdown(运行不太稳定)。 关于 DeepSeek 的评论: 游戏科学创始人、黑神话悟空制作人冯骥称:年前还是认真推下 DeepSeek 吧。V3 已经用了一个月,但 R1 仅仅用了 5 天。DeepSeek 可能是个国运级别的科技成果。它具备强大的推理能力,比肩 O1;参数少,训练开销与使用费用小;开源,任何人均可自行下载与部署;免费,官方目前提供的服务完全免费;支持联网搜索,是暂时唯一支持联网搜索的推理模型;由没有海外经历甚至没有资深从业经验的本土团队开发完成。如果这都不值得欢呼,还有什么值得欢呼?看到这条微博的您应直接访问网页链接马上用起来,也有移动 APP。
2025-02-06
deepseek
DeepSeek 是一家成立于 2023 年,总部位于中国杭州,专注于人工智能基础技术研究的科技公司。其致力于探索 AGI(通用人工智能)的实现路径,定位为聚焦大模型研发与应用,提供高效、安全、可控的 AI 技术解决方案。 将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,认为其秘方是多快好省也不全面。早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,V2 的论文也在 AI 研究界引发广泛分享和讨论。当时在国内舆论场,DeepSeek 被描摹成“大模型价格战的发起者”。 如果 V3 是 DeepSeek 的 GPT3 时刻,接下来会如何发展无人知晓,但有趣的事还在后头。DeepSeek 应不会永远是“计算机系 Pro”的存在,它应为全人类的人工智能事业做更大贡献,且已成为中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方是硅谷味儿的。 使用地址:https://chat.deepseek.com/(有手机客户端) 模型下载地址:https://github.com/deepseekai/DeepSeekLLM?tab=readmeovfile API 文档地址:https://apidocs.deepseek.com/zhcn/ DeepSeek 的提示词使用方法比较长,单独列了一篇
2025-02-06
deepseek与大健康如何落地
DeepSeek 与大健康的落地可以从以下几个方面考虑: 1. 提示词应用: 可以通过搜索 www.deepseek.com 并点击“开始对话”来使用 DeepSeek。 将装有提示词的代码发给 DeepSeek,认真阅读开场白后正式开始对话。 提示词的设计思路包括将 Agent 封装成 Prompt 并存储在文件中,以实现同时使用联网和深度思考功能,优化输出质量等。 2. 联网版实现: 通过工作流 + DeepSeek R1 大模型,实现联网版的 R1 大模型。 拥有扣子专业版账号,开通 DeepSeek R1 大模型,包括访问特定地址、在火山方舟中进行开通管理等操作,添加在线推理模型。 创建智能体,点击创建完成智能体的创建。 3. 开源策略: DeepSeek 选择走全球开源社区路线,分享模型、研究方法和成果,吸引反馈并迭代优化。开源包括模型权重、数据集、预训练方法和高质量论文等。 需要注意的是,目前提供的内容中未直接提及 DeepSeek 与大健康落地的具体关联,您可以根据以上 DeepSeek 的相关特点和技术,结合大健康领域的需求和场景,进一步探索落地的可能性。
2025-02-06
low cost of Deepseek AI
关于 DeepSeek AI 的低成本相关信息如下: 在设计思路方面,将 Agent 封装成 Prompt 并储存在文件,以保证最低成本的人人可用,同时减轻调试负担。通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能,在模型默认能力基础上优化输出质量,增加可读性,并设计了阈值系统,用 XML 进行规范设定。 存在对 DeepSeek 的“低成本”AI 的批评声音,如被讽刺为空洞的营销噱头,无法与国际大作相比,甚至被用洋垃圾作比喻,被指“崇洋媚外”。
2025-02-06
deepseek适合做ai知识库检索工具吗
DeepSeek 是基于 AI 模型的产品,只是品牌名,需要搭配具体模型,如 DeepSeek V3(类 GPT4o)和 DeepSeek R1(类 OpenAI o1)。 文本嵌入可用于实现高效的知识检索,相似或相关的字符串在嵌入空间中靠得更近,利用快速向量搜索算法,一个文本语料库可以被分割成块,给定的查询被嵌入后,能进行向量搜索找到最相关的嵌入文本块。 知识库就像 AI 的“活字典”,可以随时更新,例如包含最新新闻、科技发展、法律法规等内容,AI 遇到不确定问题时可从中检索相关信息给出更准确回答,像很火的 AI 搜索就是将整个互联网实时数据作为知识库。 但仅根据上述信息,不能明确判断 DeepSeek 是否适合做 AI 知识库检索工具,还需要综合考虑其具体性能、与您需求的匹配度等多方面因素。
2025-02-06