以下是关于学习 DeepSeek 的一些内容:
🫧宝玉日报「1月27日」✨✨✨✨✨✨✨✨1⃣️📝拾象:DeepSeek r1闭门学习讨论|Best Ideas Vol 3讨论了DeepSeek在全球AI社区的意义,包括技术突破与资源分配策略。突出了DeepSeek长上下文能力、量化商业模式、以及其对AI生态系统的深远影响。重点分析了DeepSeek的创新路径及中国在AI追赶中的潜力与挑战。🔗[https://x.com/dotey/status/1883889358383571440](https://x.com/dotey/status/1883889358383571440)2⃣️🔍转:关于DeepSeek的研究和思考(Archerman Capital)深入解析DeepSeek在架构和工程上的创新,例如MoE、MLA、MTP和FP8混合精度训练。强调DeepSeek不是简单模仿,而是在工程和应用平衡中达成了高效优化。对开源与闭源竞争进行了深刻反思,并指出AI生态未来发展方向。🔗[https://x.com/dotey/status/1883801546934083944](https://x.com/dotey/status/1883801546934083944)3⃣️📖7B Model and 8K Examples:如何用8000个示例炼出自我反思AI?
1.AI特性定位多模态理解:支持文本/代码/数学公式混合输入动态上下文:对话式连续记忆(约4K tokens上下文窗口)任务适应性:可切换创意生成/逻辑推理/数据分析模式1.系统响应机制采用意图识别+内容生成双通道处理自动检测prompt中的:任务类型/输出格式/知识范围反馈敏感度:对位置权重(开头/结尾)、符号强调敏感[heading2]二、基础指令框架[content]如果不知道如何表达,还是可以套用框架指令[heading3]1.四要素模板[content]示例:[heading3]2.格式控制语法[content]强制结构:使用```包裹格式要求占位符标记:用{{}}标注需填充内容xq优先级符号:>表示关键要求,!表示禁止项示例:[heading2]三、进阶控制技巧[heading3]1.思维链引导[content]分步标记法:请逐步思考:1.问题分析→2.方案设计→3.风险评估苏格拉底式追问:在得出最终结论前,请先列举三个可能存在的认知偏差[heading3]2.知识库调用[content]领域限定指令:基于2023版中国药典,说明头孢类药物的配伍禁忌文献引用模式:以Nature 2022年发表的论文为参考,解释CRISPR-Cas9最新突破[heading3]3.多模态输出
用Coze做了个小测试,大家可以对比看看[e8c1a8c3012fedad10dc0dfcc8b1e263_raw.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Jz9cbKxDbocGtIxXFFEcdiHjnRc?allow_redirect=1)[heading1]如何使用?[content]Step1:搜索www.deepseek.com,点击“开始对话”Step2:将装有提示词的代码发给DeepseekStep3:认真阅读开场白之后,正式开始对话[heading1]设计思路[content]1.将Agent封装成Prompt,将Prompt储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担2.通过提示词文件,让DeepSeek实现:同时使用联网功能和深度思考功能3.在模型默认能力的基础上优化输出质量,并通过思考减轻AI味,增加可读性4.照猫画虎参考大模型的temperature设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改5.用XML来进行更为规范的设定,而不是用Lisp(对我来说有难度)和Markdown(运行下来似乎不是很稳定)[heading1]完整提示词[heading2]v 1.3[heading1]特别鸣谢[content]李继刚:【思考的七把武器】在前期为我提供了很多思考方向Thinking Claude:这个项目是我现在最喜欢使用的Claude提示词,也是我设计HiDeepSeek的灵感来源Claude 3.5 Sonnet:最得力的助手