以下是关于 Deepseek V3 微调的相关信息:
支持Claude3.7及DeepseekV3。注:V3需要为0324更新的版本,DS官网及API已更新,如调用其它平台API需要查看DS版本号。提示词复制链接:[AI文章总结卡提示词](https://t16jzwqrzjx.feishu.cn/docx/EZtjdeaRko5fM7xKYBWcFJFsnKc?from=from_copylink)[heading2]2.1横版:1080 x 800卡片提示词[heading2]2.2竖版:750 x不限高卡片提示词[heading1]三、抽卡平台[content]各平台均需下载html文件,打开后才能查看真实效果,平台自带预览因兼容性问题无法正常展示效果。1.Claude使用平台:Claude3.7官网、API、Cursor。2.Deepseek使用平台:Deepseek官网、API(V3需要为0324更新的版本,DS官网及API已更新,如调用其它平台API需要查看DS版本号。)Claude使用时需要下载为HTML文件打开查看效果,Claude的预览暂时无法支持查看真实效果。Deepseek需要复制代码到html文件里,然后保存进行查看。[heading1]四、Cursor微调增加图片[content]将下载的html文件及图片放到同一个文件夹,让Cursor进行图片增加即可。以下为微调示例:
关于AI模型部署与相关知识的讲解本地部署介绍:讲解了如果拥有云服务器如何进行本地部署,以及满血版本地部署的实际情况。免费额度说明:指出在freely.aliyun.com可领取500元免费额度,但有使用限制,不能部署满血版和较大的增流模型。平台服务差异:介绍了DLC、DSW和EAS等模型部署平台服务的差别。模型蒸馏微调:会带着大家复现模型的蒸馏和微调,并讲解相关知识。Deepseek R1模型的制作及相关模型比较R1模型的强化学习:通过强化学习,在训练过程中给予模型反馈,如路线规划是否成功到达终点、输出格式是否符合期望等,对正确路线增强权重,使做对的概率变高,导致思考逻辑变长。R1模型的蒸馏与微调:用Deepseek RE Zero蒸馏出带思考的数据,基于Deepseek V3微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成R1。R1与其他模型的差别:R1是原生通过强化学习训练出的模型,蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。模型的相互帮助:Deepseek R1反过来蒸馏数据微调V3,形成互相帮助的局面,使两个模型都更强。
北京时间00:30至08:30期间,DeepSeek API价格大幅下调。DeepSeek-V3降至原价的50%,DeepSeek-R1低至25%。鼓励用户在夜间空闲时段调用API,以更低成本享受服务。?[https://x.com/imxiaohu/status/1894680853739139134](https://x.com/imxiaohu/status/1894680853739139134)4⃣️?ElevenLabs推出ElevenReader Publishing可免费将任意书籍转换为有声读物,并允许发布赚钱。支持EPUB、PDF、TXT等格式,自动生成自然、富有情感的音频。目前对作者和出版商完全免费,可通过听众互动赚取版税收入。?[https://www.xiaohu.ai/c/xiaohu-ai/elevenlabs-elevenreader-publishing](https://www.xiaohu.ai/c/xiaohu-ai/elevenlabs-elevenreader-publishing)?[https://x.com/imxiaohu/status/1894642507079979253](https://x.com/imxiaohu/status/1894642507079979253)5⃣️?AI代理间的特殊通信协议(GGWave)当两个AI发现彼此是AI时,它们会切换到基于声音的数据传输协议(GGWave)。该协议使用高频声波传输数据,比人类语音交互快约80%,更高效且私密。采用CPU进行声波解码,降低计算成本,不依赖GPU处理语音。?[https://www.xiaohu.ai/c/xiaohu-ai/gibberlink-ai-ai-80](https://www.xiaohu.ai/c/xiaohu-ai/gibberlink-ai-ai-80)