以下是关于 DeepSeek 的学习资料:
[heading2]总结关于DP模型的使用分享DP模型的功能:能进行自然语言理解与分析、编程、绘图,如SVG、MA Max图表、react图表等。使用优势:可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容。存在问题:思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。审核方法:可以用其他大模型来解读DP模型给出的内容。使用建议:使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。使用场景:包括阅读、育儿、写作、随意交流等方面。案例展示:通过与孩子共读时制作可视化互动游戏,以及左脚踩右脚式的模型交互来展示DP模型的应用。关于音系学和与大模型互动的分享音系学研究:对音系学感兴趣,通过对比不同模型的回答来深入理解,如bug和DIFF SIG,探讨语言概念在音系学下的心理印象等。大模型取队名:与大模型进行多轮对话来取队名,通过不断约束和披露喜好,最终得到满意的队名及相关内容。关于Deepseek的介绍与活动预告Deepseek文档分享:在3群和4群分享了Deepseek的相关文档,也可在v to a gi的飞书知识库中搜索获取。Deepseek使用介绍:介绍了Deepseek的模型、收录内容、提示词使用技巧和好玩的案例等。未来活动预告:明天后天在摩纳社区提供免费算力资源带大家学习炼丹,周一晚上学习多维表格中接入Deepseek。
🫧宝玉日报「1月27日」✨✨✨✨✨✨✨✨1⃣️📝拾象:DeepSeek r1闭门学习讨论|Best Ideas Vol 3讨论了DeepSeek在全球AI社区的意义,包括技术突破与资源分配策略。突出了DeepSeek长上下文能力、量化商业模式、以及其对AI生态系统的深远影响。重点分析了DeepSeek的创新路径及中国在AI追赶中的潜力与挑战。🔗[https://x.com/dotey/status/1883889358383571440](https://x.com/dotey/status/1883889358383571440)2⃣️🔍转:关于DeepSeek的研究和思考(Archerman Capital)深入解析DeepSeek在架构和工程上的创新,例如MoE、MLA、MTP和FP8混合精度训练。强调DeepSeek不是简单模仿,而是在工程和应用平衡中达成了高效优化。对开源与闭源竞争进行了深刻反思,并指出AI生态未来发展方向。🔗[https://x.com/dotey/status/1883801546934083944](https://x.com/dotey/status/1883801546934083944)3⃣️📖7B Model and 8K Examples:如何用8000个示例炼出自我反思AI?
DeepSeek在这个春节火到没边。不仅在公众号、小红书、抖音疯狂刷屏,就连过年餐桌上七大姑八大姨都会来找我唠上两句:“你知道「滴噗系可」(DeepSeek)吗”。抛开看热闹的浮躁气,我想从一个非技术人的角度,分享近期对DeepSeek的研究总结,主要围绕以下话题:1.天才养成记:DeepSeek R1为什么如此聪明?2.“填鸭”之困:传统大模型训练的瓶颈?3.自学成才:DeepSeek R1的破局之道?4.纯强化学习:再次带来AI超越人类的希望?去除无用“高精尖”知识,讲透技术黑话,力求帮助每个不太懂技术的读者,深度理解Deepseek R1,更好开展自己的工作与生活。