以下为一些可以生成图片底下字幕的工具及相关方法:
该创意来自@南瓜博士具体原文可以看南瓜博士复现的文章:https://mp.weixin.qq.com/s/CEJ6ite843M4hPuyT5jB6Q在她的文章里有详细的需求描述和开发过程,大家照着做就能复现了。那今天黄叔想教会大家的,其实是另外一个技巧:[heading2]用Trae多模态复刻产品[content]核心策略是,使用截图让Trae理解后生成功能描述,修改后再让Trae完成开发和优化!开始的第一步,还是在本地新建一个文件夹,再用Trae打开该文件夹,我们在上一节已经都做过演示,这里就不再展开了,如果你忘记了,可以点击会回看:[第一步:在你的电脑上新建一个文件夹](https://waytoagi.feishu.cn/wiki/UspJwJk95iKoegkoUdWcmX7rnib#share-H75HdPiFbow8l3xdiYEcuYGnnnb)[第二步:使用Trae打开这个文件夹](https://waytoagi.feishu.cn/wiki/UspJwJk95iKoegkoUdWcmX7rnib#share-QYVodXqiTokZoKxsrMFciW1rnPf)继续,按照这个流程,我们一开始需要将上面的图片,发给Trae,并带上下面的提示词:大体是这样的:然后发送给Trae。没想到Trae直接就开始复刻了:等待一会后,开发完成,到本地文件夹打开index.html后,是这样的:这次就完成了!下载后是这样的:可以说基本是完成了,不过仔细看,底部字幕是每行之间没有分割线,另外也没有切割图片底部,我们可以继续优化:这回好了:
点击右上角应用。然后在文件夹找到它,双击浏览器打开,测试。效果不太对,生成的图片如下,重叠的部分盖住了之前的图片~~把结果贴给AI,把错误现象和期望的表现描述一下。让AI再迭代。AI第一次改把程序改得更糟糕了,可能是忘了最开始的要求是啥。于是把最初的图片也贴给它做对比。这下成功了。还有个小问题,再改。三轮对话终于搞定。接下来做保存功能。再调整细节:后面这几步,对程序员来说是宁可直接撸代码的。但测功能嘛总得测全了,看技术小白是不是也能搞定。实验下来很顺畅。是的,就这么简单。公众号回复“字幕图片”,获取源代码。保存成.html文件,在浏览器打开就能用。我是在技术和教育圈来回串的贪玩的好奇星人。欢迎点赞点收藏关注加星。也期待多多评论区交流。我曾写过的与AI编程有关的文章
在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口。并将数字人拖动到合适的位置:3.3增加字幕点击文本-智能字幕-识别字幕,点击开始识别:软件会自动将文字智能分段并形成字幕:至此,数字人视频就完成了。点击右上角的“导出”按钮,导出视频以作备用。如果你希望数字换成自己希望的面孔,比如这个:就需要用另一个工具来进行换脸了。