DeepSeek 本身可能不具备直接生成图片的能力,但可以通过以下方式结合其他软件来生成图片:
先开发一个基础版本,包括选择文字,可以自定义生成图片,图片底部包含文章标题和链接二维码。[heading3]使用AI Rules[heading3]使用Chat模式,完善产品需求(PRD)[content]Trae运行后,我们可以直接点“应用”:Trae会直接创建一个readme文档,我们可以在其中直接进行修改,包括带有章节选择,很方便:[heading3]使用Builder模式开发产品[content]刚才我们已经在AI Rules里面指定了技术方案,在readme里指定了产品需求,接下来我们可以换到Builder模式里让Trae来自动化的开发了:Trae跑完后,生成了所有代码,接下来,我们需要在Chrome浏览器内加载这个扩展程序,进行调试,保证它做出来的是我们想要的。然后会进入扩展程序的管理页面,先打开右上角的“开发者模式”,然后在左上角选择“加载已解压的扩展程序”,然后选择这个产品代码所在的文件夹。第一次报错:这个其实是没有创建浏览器插件的图标导致。照例,我们把截图发给Trae,让它来搞定。很快Trae就跑完了,然后我们重新点“加载已解压的扩展程序”,会发现这次OK了。但我们需要提醒大家,Claude 3.5模型其实并不具备直接生成图片的能力,所以事实上生成的几个icon是无法打开的,不过Chrome对图标的要求不严,所以仍旧可以加载,只是实际上图标并不能真的显示出的,如果真的希望有更美观的图标,可以用其他AI生成图片的软件来生成图标。
《[一场关于DeepSeek的高质量闭门会:“比技术更重要的是愿景”](https://mp.weixin.qq.com/s/cXafYIotJUGUmWasXrJvcw)》DeepSeek以“比技术更重要的是愿景”引发全球AI热潮,其创始人梁文锋强调团队文化与长远智能探索。讨论会上指出,DeepSeek在技术上虽有优势,但资源有限,需聚焦核心;其推理模型推动效率提升,挑战传统SFT方法,标志着新的模型训练范式。DeepSeek不仅是低成本的开源项目,更是推动AI进步的力量。正如Marc Andreessen所言:“作为开源项目,这是对世界的一份深远馈赠。”《[DeepSeek再度开源:用Janus-Pro撕开算力铁幕](https://mp.weixin.qq.com/s/Sy9zG7nL7S8eSDzxH5LqSg)》DeepSeek近日开源了多模态模型Janus-Pro,寓意古罗马双面神雅努斯,既能进行视觉理解,也能生成图像。与DALL-E 3相比,Janus-Pro在参数上领先,并具备图像识别、地标识别等多种能力。该模型通过更优化的训练策略、更海量的数据和更大规模的参数(70亿)实现了更强的智能表现。正如文章所言:“以开源筑长阶,邀世界共赴星辰。”《[DeepSeek深夜发布大一统模型Janus-Pro将图像理解和生成统一在一个模型中](https://waytoagi.feishu.cn/wiki/SneLwRmsYiUaI6kvxltcEBPPnhb)》1.统一Transformer架构,使用同一个模型就能完成图片理解,图片生成2.提供1B和7B两种规模,适配多元应用场景3.全面开源,支持商用,MIT协议,部署使用便捷4.Benchmark表现优异,能力更全面
效果如下:[6d7e0cde-c05f-4fa1-8a11-9346a9288f83.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/MfO3bdqanoPRlNxOfNncHAa3n5e?allow_redirect=1)这个过程有8步,依次看一下。[heading4]6-6-1音标转图片[content]音标在画板中不能直接展示,会出现异常符号(如下),原因是扣子的字体目前暂未适配音标。所以采用文字转图片的插件,将音标先转成图片,再放入画板。[heading4]6-6-2裁剪2:上一步图片url转图片[content]上一步图片输出是一个url,是string格式,不能直接放到画板里,需要先转成image格式输出,因此增加一个裁剪节点,将string格式转成image格式。[heading4]6-6-3图2:展示所有信息[content]复制图1画板(重要!否则导致图片错位),在画板1的基础上,将5个元素(单词、中文翻译、音标、英文句子、中文句子)加上。[heading4]6-6-4单词转语音[content]选择【语音合成】插件,将单词转为语音。[heading4]6-6-5英语句子转语音[content]选择【语音合成】插件,将英语句子转为语音。