在使用 PyTorch 与 CUDA 时,需要注意它们的对应关系。以 Windows 为例,如果您使用 GPU 来处理音频,可以用 CUDA 提速。目前 CUDA 官网最新的版本是 12.4(https://developer.nvidia.com/cuda-downloads?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_local#),对应找到配套的 PyTorch 版本,例如 CUDA 12.1 实测可以匹配 CUDA 12.4。下载完成后默认安装即可。一定要确保 PyTorch 对应 CUDA 支持的版本,否则程序无法正确运行。如果没有 N 卡,可以用 CPU 代替 CUDA 进行运算处理,但速度会慢一些,代码中可以做相应调整。
以Windows为例:Python:由于实用到了f-string,至少要python 3.6以上版本,推荐现在比较流行的python 3.10ffmpeg:需要把ffmpeg里bin文件夹设置path环境变量,让python可以正常调用在cmd界面运行ffmpeg,可以查看到版本信息,就是变量设置成功了cuda:如果使用GPU来处理音频,可以用cuda提速,我是3050显卡,一首歌半分钟就转完了pytorch:一定要对应cuda对应的支持版本,否则程序无法正确运行目前cuda官网最新的版本是[12.4](https://developer.nvidia.com/cuda-downloads?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_local#),对应找到配套的[Pytorch](https://pytorch.org/get-started/locally/)版本,cuda12.1,实测可以匹配cuda 12.4下载完以后默认安装就可以本地运行完成安装如果没有N卡,可以用cpu代替cuda进行运算处理,缺点就是速度慢一些,代码中可以做一些相应调整(后面会讲到)[heading1]生成MID文件[content]把源文件放在input文件夹(支持MP3,WAV)可以直接用vs code运行start.py,也可以右键点击文件夹空白,打开Powershell窗口输入在cmd环境运行原始的start.py代码里是默认cuda运行的如果用cpu跑,还得把里面的cuda改成cpu,有点麻烦,我做了个简单的条件语句,这样可以在判定cuda不可用时自动转为cpu模式。转谱完成后,在output文件夹找到对应的mid文件