以下为一些常见的 AI 扒谱软件及相关资源:
以下拆解来自「来来」:每个片段可以自己点小箭头展开括号中的软件,前者是做视频的,后者是做图片的,黑色是Runway+MJ;红色是Deforum+MJ;蓝色是Runway+SD光影文字光影字在文档最下面,如需学习可以到[目录:Stable Diffusion](https://waytoagi.feishu.cn/wiki/FUQAwxfH9iXqC9k02nYcDobonkf)板块有不少案例,比如24节气[heading2]画面1~6:风景:长城等(Runway+MJ)[content][heading2]画面7~9:北京风景:永定河+门头沟+天坛(Deforum+MJ)[content][heading2]画面10:北京文字(Runway+SD光影文字)[content][heading2]画面11~12:安徽风景:徽派建筑+黄山(Runway+MJ)[content][heading2]画面13:安徽文字(Runway+SD光影文字)[content][heading2]画面14:四川人文:熊猫打麻将(Runway+MJ)[content][heading2]画面15:四川文字(Runway+SD光影文字)[content][heading2]画面16:上海人文:小笼包(Runway+MJ)[content][heading2]画面17~19:上海人文(Deforum+MJ+SD光影文字)[content][heading2]画面20:重庆美食:火锅(Runway+MJ)[content][heading2]画面21:重庆文字(Runway+SD光影文字)[content][heading2]画面22:江西人文:山水+瓷器(Runway+MJ)[content][heading2]画面23:江西文字(Runway+SD光影文字)[content]
将音乐转成MIDI五线谱,然后通过成熟的合成器重新演奏,目前看是最稳定的合成方式了。字节已经在Github发布了古典钢琴曲数据集[GiantMIDI-Piano](https://github.com/bytedance/GiantMIDI-Piano),可以拿来抄作业,用钢琴转谱技术识别音频,并转换成可编辑的MIDI格式重新演奏。知乎专栏上的大佬在这个项目上做了些改进,可以批量转谱,很方便。下面是代码包和钢琴模型包,直接下载即可链接:[https://pan.baidu.com/s/1aqnlgfFCjB0KIlPEB8RcRg](https://link.zhihu.com/?target=https%3A//pan.baidu.com/s/1aqnlgfFCjB0KIlPEB8RcRg)提取码:xubj百度要会员比较麻烦,我另外传了个wps:https://kdocs.cn/join/gezxr3f注意里面包含了训练好的模型,ffmpeg和python安装包,为了避免多个python版本冲突,建议大家自己安装python,用pip安装ffmpeg库。
暂时学到的就在这里了,有音乐背景的大佬欢迎补充指点,下面是群里整合的系统学习乐理的文档[前菜:乐理知识](https://xinzhiaigc.feishu.cn/wiki/O9GzwtrShiUDhtkwCRTcy6u7ncf)[heading1]尝试AI转谱精细化处理[content]之前我有写过一篇本地化扒谱的脚本(目前只支持钢琴,字节的模型)[吵爷:AI音乐向100分迈进,钢琴曲音质修复](https://waytoagi.feishu.cn/wiki/QuH4wPKVyiggclkMG14cNrpnnxg)同时Colab上也有挺不错的扒谱模型MT3,支持多种乐器,但用下来精确度会弱一些,可以尝试一下Github:https://github.com/magenta/mt3/tree/mainColab:https://colab.research.google.com/github/magenta/mt3/blob/main/mt3/colab/music_transcription_with_transformers.ipynb#scrollTo=s2s3JAvBAgFB