提升音乐音频音质的方法有多种。首先,可以调整超参数,如采样率、帧数等,以获得更好的细节捕捉和时间分辨率。例如,将采样率设置为 44100Hz 可提升细节捕捉,调整帧数可增加事件的捕捉效率。其次,可使用专门的音质修复工具,如团子 ai,但可能存在一些瑕疵且需要氪金。还可以自己编写提升音质的模型,支持高采样率和码率转化。此外,在发布歌曲时,可通过具体配置参数来优化音质,如设置合适的响度、Ceiling Mode、Oversampling 等。同时,可上传参考音频,让 AI 参考其特征进行处理。需注意的是,不同流媒体平台对响度有不同限制标准,应根据实际情况进行调整。
脚本文件config.pysample_rate = 16000:采样率设置为16000 Hz。这对于语音处理足够,但对于复杂的音乐转换可能会损失一些细节。一种状态可以考虑调低采样率,获得更好的主旋律(比如8000),一种是提升采样率(比如44100)获得更好的细节捕捉。classes_num = 88:这指的是钢琴的88个键。这个设置通常不需要更改。begin_note = 21:MIDI钢琴中最低音的编号,无需更改。segment_seconds = 10:指定了处理的音频片段长度为10秒。调整此长度可能会影响模型的输入,可以根据曲子的BPM做调整,尽可能整小节的处理。hop_seconds = 1:这是窗口的跳跃时间,调整这个参数可以改变生成的MIDI的时间分辨率。如果识别率不佳,可以调整到更细的时间(比如0.5)增加识别精度,但相应会提升计算量。frames_per_second = 100:每秒的帧数,影响时间上的细节。对于比较复杂的音乐,可以用更高的帧数(比如200)来提升事件的捕捉效率,但也会增加计算量。velocity_scale = 128:力度范围,通常是MIDI标准,不需要调整。
一开始试了试线上已经有的啥瓜音质修复工具,比如这个[团子ai](https://tuanziai.com/vocal-remover),六块钱一首,修复完的确能有一些降噪,但是一些粘连音还是无法解决。原始音频听起来会很糊,每个键都听不清楚。修复以后相对清晰了很多,但仍然有不少瑕疵,比如粘连音,高音会破音等问题,且要氪金。。。我自己也写了个提升音质的模型,支持44.1khz采样率,320kbps码率转化,性能还会调优,Colab免费用~https://colab.research.google.com/drive/1y0kyNoVNDbs1VNKR6kxAr2wsV-QWVu0-
请注意,并不是这里设置多少,最后响度就是多少,AI会根据音频特征进行靠拢处理,但如果只是一段钥匙撞击的声音,被处理-3的响度那就很恐怖了,具体专业知识请自行学习。另,不同的流媒体平台对响度存在不同的限制标准,比如SPOTIFY,非专业处理的音频一般都难以在平台规定的-14得到最佳响度和听感,超限的音轨会被压得很平,听感反而变差,网易云经过实测,合理范围内不会对响度进行太大处理,抖音则会将超限音轨处理到-12左右。如果要上传平台,这里建议的值是-12至-9,都可以试试。也可以根据处理完成后的数据进行二次调整。如何检测响度请自行搜索。3、Ceiling Mode不做科普,一般默认或者True Peak。4、Oversampling不做科普,选2X。5、Automatic Mastering不做科普,一般默认,也可以往上调整数值增加处理强度尝试不同区别。6、Specify Reference Audio By Myself |指定参考音频上传参考音轨,AI会参考音频特征进行处理,可以下载一些得奖的高品质原声带或者自己目标风格音乐的WAV音轨作为参考。但是请注意,并不是说AI能将你的音轨处理到目标音轨的音质,缺失的声音细节,是不可能通过母带处理还原的。不上传也没问题。