Chat with Wiki - 如何提升音乐音频的音质

Answer

提升音乐音频音质的方法有多种。首先，可以调整超参数，如采样率、帧数等，以获得更好的细节捕捉和时间分辨率。例如，将采样率设置为 44100Hz 可提升细节捕捉，调整帧数可增加事件的捕捉效率。其次，可使用专门的音质修复工具，如团子 ai，但可能存在一些瑕疵且需要氪金。还可以自己编写提升音质的模型，支持高采样率和码率转化。此外，在发布歌曲时，可通过具体配置参数来优化音质，如设置合适的响度、Ceiling Mode、Oversampling 等。同时，可上传参考音频，让 AI 参考其特征进行处理。需注意的是，不同流媒体平台对响度有不同限制标准，应根据实际情况进行调整。

Content generated by AI large model, please carefully verify (powered by aily)

References

吵爷：AI音乐向100分迈进，钢琴曲音质修复

脚本文件config.pysample_rate = 16000:采样率设置为16000 Hz。这对于语音处理足够，但对于复杂的音乐转换可能会损失一些细节。一种状态可以考虑调低采样率，获得更好的主旋律（比如8000），一种是提升采样率（比如44100）获得更好的细节捕捉。classes_num = 88:这指的是钢琴的88个键。这个设置通常不需要更改。begin_note = 21:MIDI钢琴中最低音的编号，无需更改。segment_seconds = 10:指定了处理的音频片段长度为10秒。调整此长度可能会影响模型的输入，可以根据曲子的BPM做调整，尽可能整小节的处理。hop_seconds = 1:这是窗口的跳跃时间，调整这个参数可以改变生成的MIDI的时间分辨率。如果识别率不佳，可以调整到更细的时间（比如0.5）增加识别精度，但相应会提升计算量。frames_per_second = 100:每秒的帧数，影响时间上的细节。对于比较复杂的音乐，可以用更高的帧数（比如200）来提升事件的捕捉效率，但也会增加计算量。velocity_scale = 128:力度范围，通常是MIDI标准，不需要调整。

吵爷：AI音乐向100分迈进，钢琴曲音质修复

一开始试了试线上已经有的啥瓜音质修复工具，比如这个[团子ai](https://tuanziai.com/vocal-remover)，六块钱一首，修复完的确能有一些降噪，但是一些粘连音还是无法解决。原始音频听起来会很糊，每个键都听不清楚。修复以后相对清晰了很多，但仍然有不少瑕疵，比如粘连音，高音会破音等问题，且要氪金。。。我自己也写了个提升音质的模型，支持44.1khz采样率，320kbps码率转化，性能还会调优，Colab免费用~https://colab.research.google.com/drive/1y0kyNoVNDbs1VNKR6kxAr2wsV-QWVu0-

如何让自己的歌曲发布时更“好听”

请注意，并不是这里设置多少，最后响度就是多少，AI会根据音频特征进行靠拢处理，但如果只是一段钥匙撞击的声音，被处理-3的响度那就很恐怖了，具体专业知识请自行学习。另，不同的流媒体平台对响度存在不同的限制标准，比如SPOTIFY，非专业处理的音频一般都难以在平台规定的-14得到最佳响度和听感，超限的音轨会被压得很平，听感反而变差，网易云经过实测，合理范围内不会对响度进行太大处理，抖音则会将超限音轨处理到-12左右。如果要上传平台，这里建议的值是-12至-9，都可以试试。也可以根据处理完成后的数据进行二次调整。如何检测响度请自行搜索。3、Ceiling Mode不做科普，一般默认或者True Peak。4、Oversampling不做科普，选2X。5、Automatic Mastering不做科普，一般默认，也可以往上调整数值增加处理强度尝试不同区别。6、Specify Reference Audio By Myself |指定参考音频上传参考音轨，AI会参考音频特征进行处理，可以下载一些得奖的高品质原声带或者自己目标风格音乐的WAV音轨作为参考。但是请注意，并不是说AI能将你的音轨处理到目标音轨的音质，缺失的声音细节，是不可能通过母带处理还原的。不上传也没问题。