PyTorch 是由 Facebook 的人工智能研究团队开发的深度学习库,以其灵活性和易用性而闻名,特别适合研究和快速原型开发。在一些应用场景中,如 AI 音乐处理,需要对应 CUDA 对应的支持版本才能正确运行。目前 CUDA 官网最新的版本是12.4,对应找到配套的Pytorch版本,如 cuda12.1 实测可以匹配 cuda 12.4。下载完后默认安装即可。
NLTK:自然语言处理工具包(NLTK)是Python中用于自然语言处理的库,提供了文本处理库、分类、解析、标记、语义推理等功能。spaCy:spaCy是一个高性能的自然语言处理库,专注于提供快速且实用的NLP工具。[heading3]深度学习[content]PyTorch:PyTorch是由Facebook的人工智能研究团队开发的深度学习库,以其灵活性和易用性而闻名。它特别适合研究和快速原型开发。Caffe:Caffe是一个深度学习框架,主要用于图像和视频分析。它以其快速和模块化的特点而受到欢迎。[heading3]机器学习[content]scikit-learn:scikit-learn是Python中用于机器学习的一个库,提供了许多常用的机器学习算法,如线性回归、决策树、支持向量机等。TensorFlow:TensorFlow是由Google开发的开源机器学习库,主要用于深度学习。它提供了强大的计算能力和灵活性。Keras:Keras是一个高级神经网络API,可以运行在TensorFlow、CNTK或Theano之上。它使得构建和训练深度学习模型变得简单。
当然,还有很多其它的重要成果。我认为正是以上所列举的研究给我们带来了重要的理论和算法上的突破,并改变了世界,推动了深度学习的革命。如何入门深度学习?深度学习的入门并不容易,但我会尽我所能指导你完成这一阶段。参考以下学习资源,但记住,你需要的不仅仅是观看视频和阅读论文,还需要不断地理解、编程、写代码、经历失败,然后成功。-1.请先学习Python和R语言:)0.学习吴恩达的深度学习课程Siraj Raval的视频:Siraj Raval非常amazing,他可以用风趣易懂的方式来解释复杂的概念。你可以在YouTube上关注他的个人频道,其中这两个视频非常棒:François Chollet的两本书:Deep Learning with PythonDeep Learning with R分布式深度学习深度学习是数据科学家应该学习的最重要的工具和理论之一。我们很幸运,有那么多深度学习方向的研究、软件、工具和硬件被开发出来。深度学习的计算成本很昂贵,即使在理论、软件和硬件有所进展的情况下,我们也需要大数据和分布式机器学习的发展来提升深度学习的性能和效率。为此,人们开发出了分布式框架(Spark)和深度学习库(TensorFlow、PyTorch和Keras)。参考阅读:
以Windows为例:Python:由于实用到了f-string,至少要python 3.6以上版本,推荐现在比较流行的python 3.10ffmpeg:需要把ffmpeg里bin文件夹设置path环境变量,让python可以正常调用在cmd界面运行ffmpeg,可以查看到版本信息,就是变量设置成功了cuda:如果使用GPU来处理音频,可以用cuda提速,我是3050显卡,一首歌半分钟就转完了pytorch:一定要对应cuda对应的支持版本,否则程序无法正确运行目前cuda官网最新的版本是[12.4](https://developer.nvidia.com/cuda-downloads?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_local#),对应找到配套的[Pytorch](https://pytorch.org/get-started/locally/)版本,cuda12.1,实测可以匹配cuda 12.4下载完以后默认安装就可以本地运行完成安装如果没有N卡,可以用cpu代替cuda进行运算处理,缺点就是速度慢一些,代码中可以做一些相应调整(后面会讲到)[heading1]生成MID文件[content]把源文件放在input文件夹(支持MP3,WAV)可以直接用vs code运行start.py,也可以右键点击文件夹空白,打开Powershell窗口输入在cmd环境运行原始的start.py代码里是默认cuda运行的如果用cpu跑,还得把里面的cuda改成cpu,有点麻烦,我做了个简单的条件语句,这样可以在判定cuda不可用时自动转为cpu模式。转谱完成后,在output文件夹找到对应的mid文件