Chat with Wiki - deepseek v3微调

Answer

以下是关于 Deepseek V3 微调的相关信息：

云舒文章总结卡 2.0 提示词全面支持 Deepseek V3，效果媲美 Claude3.7。V3 需要为 0324 更新的版本，DS 官网及 API 已更新，如调用其它平台 API 需要查看 DS 版本号。提示词复制链接：AI 文章总结卡提示词。横版为 1080 x 800 卡片提示词，竖版为 750 x 不限高卡片提示词。
各平台均需下载 html 文件，打开后才能查看真实效果，平台自带预览因兼容性问题无法正常展示效果。Claude 使用平台包括 Claude3.7 官网、API、Cursor，使用时需要下载为 HTML 文件打开查看效果。Deepseek 使用平台包括 Deepseek 官网、API（V3 需要为 0324 更新的版本），Deepseek 需要复制代码到 html 文件里，然后保存进行查看。
关于智能纪要，会带着大家复现模型的蒸馏和微调，并讲解相关知识。用 Deepseek RE Zero 蒸馏出带思考的数据，基于 Deepseek V3 微调，进行冷启动，再做强化学习，还从非公布模型提取微调数据，加上人类偏好，最终形成 R1。Deepseek R1 反过来蒸馏数据微调 V3，形成互相帮助的局面。
北京时间 00:30 至 08:30 期间，DeepSeek API 价格大幅下调，DeepSeek-V3 降至原价的 50%。

Content generated by AI large model, please carefully verify (powered by aily)

References

云舒：文章总结卡2.0提示词：全面支持DeepseekV3，效果媲美Claude3.7，新增竖版卡片方便手机阅读

支持Claude3.7及DeepseekV3。注：V3需要为0324更新的版本，DS官网及API已更新，如调用其它平台API需要查看DS版本号。提示词复制链接：[AI文章总结卡提示词](https://t16jzwqrzjx.feishu.cn/docx/EZtjdeaRko5fM7xKYBWcFJFsnKc?from=from_copylink)[heading2]2.1横版：1080 x 800卡片提示词[heading2]2.2竖版：750 x不限高卡片提示词[heading1]三、抽卡平台[content]各平台均需下载html文件，打开后才能查看真实效果，平台自带预览因兼容性问题无法正常展示效果。1.Claude使用平台：Claude3.7官网、API、Cursor。2.Deepseek使用平台：Deepseek官网、API（V3需要为0324更新的版本，DS官网及API已更新，如调用其它平台API需要查看DS版本号。）Claude使用时需要下载为HTML文件打开查看效果，Claude的预览暂时无法支持查看真实效果。Deepseek需要复制代码到html文件里，然后保存进行查看。[heading1]四、Cursor微调增加图片[content]将下载的html文件及图片放到同一个文件夹，让Cursor进行图片增加即可。以下为微调示例：

智能纪要：02-26 | DeepSeek部署+蒸馏 2025年2月26日

关于AI模型部署与相关知识的讲解本地部署介绍：讲解了如果拥有云服务器如何进行本地部署，以及满血版本地部署的实际情况。免费额度说明：指出在freely.aliyun.com可领取500元免费额度，但有使用限制，不能部署满血版和较大的增流模型。平台服务差异：介绍了DLC、DSW和EAS等模型部署平台服务的差别。模型蒸馏微调：会带着大家复现模型的蒸馏和微调，并讲解相关知识。Deepseek R1模型的制作及相关模型比较R1模型的强化学习：通过强化学习，在训练过程中给予模型反馈，如路线规划是否成功到达终点、输出格式是否符合期望等，对正确路线增强权重，使做对的概率变高，导致思考逻辑变长。R1模型的蒸馏与微调：用Deepseek RE Zero蒸馏出带思考的数据，基于Deepseek V3微调，进行冷启动，再做强化学习，还从非公布模型提取微调数据，加上人类偏好，最终形成R1。R1与其他模型的差别：R1是原生通过强化学习训练出的模型，蒸馏模型是基于数据微调出来的，基础模型能力强，蒸馏微调模型能力也会强。模型的相互帮助：Deepseek R1反过来蒸馏数据微调V3，形成互相帮助的局面，使两个模型都更强。

XiaoHu.AI日报

北京时间00:30至08:30期间，DeepSeek API价格大幅下调。DeepSeek-V3降至原价的50%，DeepSeek-R1低至25%。鼓励用户在夜间空闲时段调用API，以更低成本享受服务。?[https://x.com/imxiaohu/status/1894680853739139134](https://x.com/imxiaohu/status/1894680853739139134)4⃣️?ElevenLabs推出ElevenReader Publishing可免费将任意书籍转换为有声读物，并允许发布赚钱。支持EPUB、PDF、TXT等格式，自动生成自然、富有情感的音频。目前对作者和出版商完全免费，可通过听众互动赚取版税收入。?[https://www.xiaohu.ai/c/xiaohu-ai/elevenlabs-elevenreader-publishing](https://www.xiaohu.ai/c/xiaohu-ai/elevenlabs-elevenreader-publishing)?[https://x.com/imxiaohu/status/1894642507079979253](https://x.com/imxiaohu/status/1894642507079979253)5⃣️?AI代理间的特殊通信协议（GGWave）当两个AI发现彼此是AI时，它们会切换到基于声音的数据传输协议（GGWave）。该协议使用高频声波传输数据，比人类语音交互快约80%，更高效且私密。采用CPU进行声波解码，降低计算成本，不依赖GPU处理语音。?[https://www.xiaohu.ai/c/xiaohu-ai/gibberlink-ai-ai-80](https://www.xiaohu.ai/c/xiaohu-ai/gibberlink-ai-ai-80)