Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

为什么 deepseek由一个初创公司开发出来而不是国内互联网巨头?请用犀利的语言回答可以带脏字

Answer

DeepSeek 由初创公司开发出来而非国内互联网巨头,原因可能在于国内互联网巨头在创新模式和理念上存在一定局限。它们或许更倾向于追求短期商业利益,在资源分配和创新投入上相对保守。而初创公司往往更具冒险精神和创新活力,能够突破传统思维,专注于技术研发和创新,不受庞大体系和既有模式的束缚。就像 DeepSeek 这样,凭借独特的理念和专注的投入,实现了令人瞩目的成果。

Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

中国杭州的人工智能创业公司DeepSeek是近一段时间硅谷的AI研究者和开发者的心魔。它在2024年12月发布的大语言模型DeepSeek-V3被认为实现了诸多的不可能:550万美元和2000块英伟达H800 GPU(针对中国市场的低配版GPU)训练出的开源模型,多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等顶级开源模型,亦与GPT-4o和Claude 3.5-Sonnet这样世界顶级的闭源模型不相上下——而训练后者的成本保守估计也要数亿美元和几十万块最强劲的英伟达H100。可以想象它在人工智能界引发的震撼——尤其是在AI领域的研究人员、创业者、资金、算力和资源最扎堆的硅谷。不少硅谷AI领域的重要人士都不吝惜对DeepSeek的称赞,比如OpenAI联合创始人Andrej Kaparthy和Scale.ai的创始人Alexandr Wang。尽管OpenAI CEO Sam Altman发了一条疑似影射DeepSeek抄袭借鉴其它先进成果的推文(很快就被人回怼“是指把Google发明的Transformer架构拿过来用么?),但DeepSeek收获的赞誉确实是广泛而真诚的,尤其是在开源社区,开发者用脚投票。

详解:DeepSeek深度推理+联网搜索 目前断档第一

[heading3]游戏科学创始人、黑神话悟空制作人冯骥:年前还是认真推下DeepSeek吧。V3已经用了一个月,但R1仅仅用了5天,不得不来发这条微博。先讲一句暴论:DeepSeek,可能是个国运级别的科技成果。为了讲清楚这个成果有多惊人,我打个比方:如果有一个AI大模型做到了以下的任何一条,都是超级了不起的突破——1、强大。比肩O1的推理能力,暂时没有之一2、便宜。参数少,训练开销与使用费用小了一个数量级3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的mini模型。4、免费。官方目前提供的服务完全免费,任何人随时随地可用5、联网。暂时唯一支持联网搜索的推理模型(o1还不支持)6、本土。深度求索是一家很小规模的年轻中国公司,由没有海外经历甚至没有资深从业经验的本土团队开发完成上面的六条,DeepSeek全部、同时做到了。实在太6了,6到不真实。如果这都不值得欢呼,还有什么值得欢呼?那么,现在看到这条微博的你应该去做什么呢?1、请直接访问:网页链接马上用起来,也有移动APP

1月9日 社区动态速览

《[大模型Scaling Law“放缓”的真相与未来方向](https://mp.weixin.qq.com/s/g0OxsI1o5e95jTuu4eg5Tw)》清华大学计算机科学与技术系助理教授,KVCache.AI团队负责人章明星。章老师从大模型当前的发展阶段出发,分享了他关于模型架构演进、大模型Scaling Law的发展趋势及相应趋势对系统层面影响的看法,并探讨了未来的发展方向。《[DeepSeek的秘方是硅谷味儿的](https://mp.weixin.qq.com/s/kuYFL2Ks-HEO9CTGLYbE3A)》DeepSeek是一家位于杭州的人工智能创业公司,其大语言模型DeepSeek-V3在全球引发广泛关注。该模型以550万美元和2000块低配版英伟达H800 GPU训练,超越了多个顶级模型,获得硅谷研究者的高度评价。DeepSeek的成功被视为中国式创新的典范,但其独特之处在于其更像一个研究机构,注重技术创新而非商业化运作,吸引了大量年轻的顶尖研究人才。《[AI音视频界的“瑞士军刀”,华人AI初创已与超过2000家知名企业合作](https://mp.weixin.qq.com/s/Ohu2kJU6WbZp7fQQTcrBgg)》Akool是一家成立于2022年的AI音视频初创公司,总部位于加州圣克拉拉,致力于提供高效、智能的视频生成解决方案。其功能包括AI换脸、实时换脸、定制数字人、视频翻译等,旨在服务企业客户,提升其内容创作效率和质量。创始人吕家俊丰富的AI背景,曾在苹果和谷歌工作,强调团队和热情在商业成功中的重要性。

Others are asking
如何在DEEPSEEK里创建一个专门用于”爆款文案二创“的智能体?
在 DEEPSEEK 里创建一个专门用于“爆款文案二创”的智能体,您可以按照以下步骤进行操作: 1. 添加工作流:将已经发布的工作流添加到创建好的智能体。 2. 设定人设与回复逻辑:设定与“爆款文案二创”相关的人设和回复逻辑。 3. 测试:对设定好的智能体进行测试。 4. 发布智能体:选择右上角,填写发布信息,选择发布渠道,确认发布,等待审核完成,发布成功。发布成功之后,点击分享,复制访问链接给朋友。 需要注意的是,以上步骤仅供参考,具体操作可能因 DEEPSEEK 平台的更新而有所变化。
2025-02-06
linux 下部署deepseek
在 Linux 下部署 DeepSeek 的步骤如下: 1. 下载代码仓库。 2. 安装依赖(注意有两个依赖未放在 requirements.txt 里)。 3. 启动 webui 的 demo 程序,然后用浏览器登陆服务器的 ip:8080 就能试玩。此 demo 提供了 3 个参数: server_name:服务器的 ip 地址,默认 0.0.0.0。 servic_port:即将开启的端口号。 local_path:模型存储的本地路径。 4. 第一次启动后生成语音时,需查看控制台输出,它会下载一些模型文件,因此比较慢,且可能因网络问题失败。但第一次加载成功后,后续会顺利。 5. 基于此基础可进行拓展,比如集成到 agent 的工具中,或结合 chatgpt 做更拟人化的实时沟通。 webui 上可设置的几个参数说明: text:指需要转换成语音的文字内容。 Refine text:选择是否自动对输入的文本进行优化处理。 Audio Seed:语音种子,是一个数字参数,用于选择声音类型,默认值为 2,是很知性的女孩子的声音。 Text Seed:文本种子,是一个正整数参数,用于 refine 文本的停顿。实测文本的停顿设置会影响音色、音调。 额外提示词(可写在 input Text 里):用于添加笑声、停顿等效果。例如,可以设置为 。 使用 DeepSeek 的步骤: 1. 搜索 www.deepseek.com,点击“开始对话”。 2. 将装有提示词的代码发给 Deepseek。 3. 认真阅读开场白之后,正式开始对话。 DeepSeek 的设计思路: 1. 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻调试负担。 2. 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 3. 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 4. 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 5. 用 XML 来进行更为规范的设定,而不是用 Lisp(有难度)和 Markdown(运行不太稳定)。 关于 DeepSeek 的评论: 游戏科学创始人、黑神话悟空制作人冯骥称:年前还是认真推下 DeepSeek 吧。V3 已经用了一个月,但 R1 仅仅用了 5 天。DeepSeek 可能是个国运级别的科技成果。它具备强大的推理能力,比肩 O1;参数少,训练开销与使用费用小;开源,任何人均可自行下载与部署;免费,官方目前提供的服务完全免费;支持联网搜索,是暂时唯一支持联网搜索的推理模型;由没有海外经历甚至没有资深从业经验的本土团队开发完成。如果这都不值得欢呼,还有什么值得欢呼?看到这条微博的您应直接访问网页链接马上用起来,也有移动 APP。
2025-02-06
deepseek
DeepSeek 是一家成立于 2023 年,总部位于中国杭州,专注于人工智能基础技术研究的科技公司。其致力于探索 AGI(通用人工智能)的实现路径,定位为聚焦大模型研发与应用,提供高效、安全、可控的 AI 技术解决方案。 将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,认为其秘方是多快好省也不全面。早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,V2 的论文也在 AI 研究界引发广泛分享和讨论。当时在国内舆论场,DeepSeek 被描摹成“大模型价格战的发起者”。 如果 V3 是 DeepSeek 的 GPT3 时刻,接下来会如何发展无人知晓,但有趣的事还在后头。DeepSeek 应不会永远是“计算机系 Pro”的存在,它应为全人类的人工智能事业做更大贡献,且已成为中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方是硅谷味儿的。 使用地址:https://chat.deepseek.com/(有手机客户端) 模型下载地址:https://github.com/deepseekai/DeepSeekLLM?tab=readmeovfile API 文档地址:https://apidocs.deepseek.com/zhcn/ DeepSeek 的提示词使用方法比较长,单独列了一篇
2025-02-06
deepseek与大健康如何落地
DeepSeek 与大健康的落地可以从以下几个方面考虑: 1. 提示词应用: 可以通过搜索 www.deepseek.com 并点击“开始对话”来使用 DeepSeek。 将装有提示词的代码发给 DeepSeek,认真阅读开场白后正式开始对话。 提示词的设计思路包括将 Agent 封装成 Prompt 并存储在文件中,以实现同时使用联网和深度思考功能,优化输出质量等。 2. 联网版实现: 通过工作流 + DeepSeek R1 大模型,实现联网版的 R1 大模型。 拥有扣子专业版账号,开通 DeepSeek R1 大模型,包括访问特定地址、在火山方舟中进行开通管理等操作,添加在线推理模型。 创建智能体,点击创建完成智能体的创建。 3. 开源策略: DeepSeek 选择走全球开源社区路线,分享模型、研究方法和成果,吸引反馈并迭代优化。开源包括模型权重、数据集、预训练方法和高质量论文等。 需要注意的是,目前提供的内容中未直接提及 DeepSeek 与大健康落地的具体关联,您可以根据以上 DeepSeek 的相关特点和技术,结合大健康领域的需求和场景,进一步探索落地的可能性。
2025-02-06
low cost of Deepseek AI
关于 DeepSeek AI 的低成本相关信息如下: 在设计思路方面,将 Agent 封装成 Prompt 并储存在文件,以保证最低成本的人人可用,同时减轻调试负担。通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能,在模型默认能力基础上优化输出质量,增加可读性,并设计了阈值系统,用 XML 进行规范设定。 存在对 DeepSeek 的“低成本”AI 的批评声音,如被讽刺为空洞的营销噱头,无法与国际大作相比,甚至被用洋垃圾作比喻,被指“崇洋媚外”。
2025-02-06
deepseek适合做ai知识库检索工具吗
DeepSeek 是基于 AI 模型的产品,只是品牌名,需要搭配具体模型,如 DeepSeek V3(类 GPT4o)和 DeepSeek R1(类 OpenAI o1)。 文本嵌入可用于实现高效的知识检索,相似或相关的字符串在嵌入空间中靠得更近,利用快速向量搜索算法,一个文本语料库可以被分割成块,给定的查询被嵌入后,能进行向量搜索找到最相关的嵌入文本块。 知识库就像 AI 的“活字典”,可以随时更新,例如包含最新新闻、科技发展、法律法规等内容,AI 遇到不确定问题时可从中检索相关信息给出更准确回答,像很火的 AI 搜索就是将整个互联网实时数据作为知识库。 但仅根据上述信息,不能明确判断 DeepSeek 是否适合做 AI 知识库检索工具,还需要综合考虑其具体性能、与您需求的匹配度等多方面因素。
2025-02-06
请用思维导图描述AI智能体大语言模型平台汇总图(带图标LOGO)
以下是为您生成的关于 AI 智能体大语言模型平台的汇总思维导图: 1. 基础层 为大模型提供硬件支撑,数据支持等,例如 A100、数据服务器等等。 2. 数据层 静态的知识库 动态的三方数据集 3. 模型层 LLm(largelanguagemodel,大语言模型),例如 GPT,一般使用 transformer 算法来实现。 多模态模型,即市面上的文生图、图生图等的模型,训练所用的数据与 llm 不同,用的是图文或声音等多模态的数据集。 4. 平台层 模型与应用间的平台部分,比如大模型的评测体系,或者 langchain 平台等,提供模型与应用间的组成部分。 5. 表现层(应用层) 用户实际看到的地方。 此外,在翻译场景中: 语言翻译技术经历了从传统规则翻译到深度学习翻译的逐步发展,每一次革新都显著提高了翻译的准确性和自然度。 传统机器翻译存在局限性,基于规则和统计模型,常常出现死板和字面化的结果,尤其在遇到多义词、习语或文化差异时,翻译往往不自然,且容易误导。 深度学习翻译技术通过大规模语料库学习,能够更好地理解上下文和语境,提供更加流畅、准确的翻译。 大模型翻译技术引入后,通过海量数据学习,能够精准捕捉语言的深层语义和文化背景,提供更符合语境的翻译,显著提升了翻译的准确性与流畅度。 在学术场景中: 大模型技术能够快速总结论文内容、进行精准翻译,节省研究者阅读和整理文献的时间。 文献预处理时,需将海量文献的格式转换为可供模型解析的文本格式,可借助平台工具完成文件内容的提取。 可将文件内容自动化提取并结合大语言模型进行批量分析或任务处理,适用于文档总结、信息提取等场景。
2025-02-06
我是一个英文CET4级水平的上班族,想要在一年内达成雅思7.5分,请问如何使用AI帮助我实现这个目标。请用简洁易懂的表达,使用项目日程表的形式,将计划分成月度、周和日。
很抱歉,目前没有相关的具体计划内容。但您可以利用一些 AI 工具来辅助学习,比如使用智能语言学习软件,它能根据您的水平制定个性化的学习计划、提供练习题目和模拟测试,并实时评估您的学习进度。您还可以利用 AI 翻译工具,帮助您理解复杂的英语文本。 以下是一个大致的月度、周和日的计划框架供您参考: 月度计划: 第一个月:熟悉雅思考试的题型和要求,通过 AI 工具进行基础评估,制定整体学习策略。 第二个月:重点提升听力和阅读能力,利用 AI 推荐的学习资源进行每日练习。 第三个月:加强写作和口语的训练,使用 AI 批改和模拟对话功能。 第四个月:进行阶段性模拟测试,分析薄弱环节,利用 AI 针对性地强化训练。 第五个月:继续巩固各项能力,增加练习难度和时长。 第六个月:参加真实的雅思模拟考试,根据结果调整学习计划。 第七个月:针对薄弱点进行最后的冲刺训练。 第八个月:进行全面复习,通过 AI 工具进行知识点的查漏补缺。 第九个月:保持练习状态,调整心态。 第十个月:再次进行模拟考试,评估学习效果。 第十一个月:做最后的强化复习和准备。 第十二个月:做好考试的各项准备,保持良好状态迎接考试。 周计划: 每周安排 5 天进行学习,每天至少 2 小时。 每周进行一次小测试,评估本周学习成果。 每周利用 AI 工具分析学习数据,调整下周学习重点。 日计划: 每天早上背诵单词和短语,可使用 AI 记忆辅助工具。 白天工作间隙利用碎片时间进行听力练习。 晚上集中进行阅读、写作和口语的练习。 睡前复习当天学习内容。 请注意,这只是一个初步的框架,您需要根据实际情况和 AI 工具的特点进行具体的调整和优化。祝您学习顺利,早日实现目标!
2024-12-17
Ai短视频比赛主题“什么样的时刻会首先出现在你的脑海中”,请以此主题提出几条优质的创作灵感建议,Ai生成视频要求不长于10秒,请用简单易懂的方式讲一下
以下是关于“什么样的时刻会首先出现在你的脑海中”这一 AI 短视频比赛主题的创作灵感建议: 1. 可以是烟花绽放的那一刻,绚丽多彩照亮夜空。 2. 是宠物与主人重逢相拥的那一刻,充满温馨与感动。 3. 是运动员冲过终点线的那一刻,展现胜利的喜悦。 4. 是孩子第一次学会走路的那一刻,充满成长的惊喜。 5. 是情侣在雨中亲吻的那一刻,浪漫而甜蜜。 比赛相关要求: 1. 主题:以“The Moment”为主题进行创作。 2. 数量限制:每人不限视频数量。 3. 提交时间:12 月 31 日 21:00 前。 4. 参赛文件:16:9 格式,不长于 10 秒,30FPS 以上,不含剪辑。 5. 作业方式:不限。 6. 工具要求:使用可灵 AI(https://kling.kuaishou.com/)。 7. 视频要求:带可灵水印。 8. 参与方式:在指定时间发布作品,可通过通往 AGI 之路首页表格、在野菩萨小红薯群或支持社区提交。 9. 奖项设置:金奖 5000 元+5800 灵感值;银奖 3000 元+2700(2200+500)灵感值;铜奖 2000 元+1000 灵感值;入围 500 元×40;人气奖 2500 元×4 以及其他意外散落的灵感值。 10. 注意事项:不建议出现鲜血、武器、鬼怪骷髅、知名人物、18X 等不符合国家政策的内容,可能导致参赛失败。不在规定时间内提交的自动失去参赛资格。评审由专业评审决定,提交次周发布结果。参与该挑战视作同意将作品的使用权授予本号及第三方用于社群运营、展览、展示、传播、营销等用途,主办方拥有最终解释权。在下面的投稿链接中上传作品。
2024-12-10
什么是知识库,以及他的运作原理是什么,请用小白也能理解的语言进行说明
知识库可以用比较通俗的方式来理解: 想象一个大语言模型就像一个非常聪明、读过无数书的人,但对于一些特定的工作场景中的细节,比如见到老板娘过来吃饭要打三折,张梦飞过去吃饭要打骨折,它可能并不清楚。这时候,知识库就像是给这个聪明的人发的一本工作手册。 从更专业的角度来说,知识库的运作原理通常包括以下几个步骤: 1. 文档加载:从各种不同的来源,比如 PDF、SQL 数据、代码等加载相关的文档。 2. 文本分割:把加载的文档分割成指定大小的块,称为“文档块”或“文档片”。 3. 存储:这包括两个环节,一是将分割好的文档块进行嵌入,转换成向量的形式;二是将这些向量数据存储到向量数据库中。 4. 检索:当需要使用数据时,通过某种检索算法从向量数据库中找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给大语言模型,大语言模型会根据问题和检索出来的提示一起生成更合理的答案。 以车型数据为例,每个知识库的分段中保存了一种车型的基础数据。当用户问宝马 X3 的售价是多少时,就能匹配到对应车型的分段,然后从其中获取到售价信息。 海外官方文档:https://www.coze.com/docs/zh_cn/knowledge.html 国内官方文档:https://www.coze.cn/docs/guides/use_knowledge
2024-11-13
AI办公场景的小工具有哪些?请用模板给我介绍 模板:产品名称、产品适用场景、产品卖点
以下是一些 AI 办公场景的小工具: |产品名称|产品适用场景|产品卖点| |||| |AI 智能写作助手|辅助创作与学习|帮助用户快速生成高质量文本| |AI 语言学习助手|辅助创作与学习|辅助用户学习语言,提供个性化学习方案| |爱奇艺智能推荐|推荐与规划|根据用户喜好推荐电影,发现优质影片| |WPS Office|优化与管理|提高办公效率,实现自动化办公流程| |销售:定制销售解决方案|销售|为企业定制销售方案| |客服:定制客服话术|客服|提供针对性的客服话术| |HR:团队绩效管理|人力资源|分析员工绩效并提供考评和改进建议| |HR:面试工具|人力资源|帮助求职者在面试中生成完美回答| |科学:研制采摘机器人|科学研究|借助 ChatGPT 设计并研制番茄收割机器人|
2024-11-01
请用有哪些比较好的图片生成AI
目前比较成熟的图片生成 AI 产品主要有: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格可选,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,能将上传的照片转换为芭比风格,效果出色。 此外,以下是一些用于图片生成的工具和选项: 最透明的选项:Adobe Firefly(https://www.adobe.com/sensei/generativeai/firefly.html) 开源选项:Stable Diffusion(https://stablediffusionui.github.io/) 最佳免费选项:Bing 或 Bing Image Creator(https://www.bing.com/images/create)(使用 DALLE),Playgound(https://playgroundai.com/)(允许使用多个模型) 最佳质量图像:MidJourney(https://midjourney.com/) 这些 AI 模型通过组合如扩散模型、大型视觉转换器等技术,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍存在一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。
2024-09-05
AI 圆桌论坛,讨论者是通信公司技术专家,数字业务专家,初创企业智慧城市专家,听众是对AI了解相对一般的观众,可以讨论哪些话题
以下是一些适合在您所描述的 AI 圆桌论坛中讨论的话题: 1. AI 在通信领域的应用与挑战,例如如何提升通信网络的智能化、优化频谱资源分配等。 2. 数字业务中 AI 的创新应用和潜在风险,比如个性化推荐系统的优化、数据隐私保护等。 3. 初创企业在智慧城市建设中利用 AI 的机遇和困难,像是如何获取数据资源、应对技术人才短缺等。 4. 探讨具身智能在不同领域的发展前景,如机器人、教育等。 5. 大模型如何为具身智能带来变革,以及相关的技术突破和应用案例。 6. 分析 AI 对传统行业的冲击与重塑,以及如何应对这种变化。 7. 研究 AI 在教育领域的创新模式,如个性化学习、智能辅导等。 8. 讨论 AI 技术的监管政策和伦理道德问题。 9. 分享在不同场景下(如出海业务、创新教育等)AI 的应用经验和成果。 10. 展望 AI 未来的发展趋势及其对社会经济的影响。
2024-10-20