Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有什么AI扒谱软件

Answer

以下为一些常见的 AI 扒谱软件及相关资源:

  1. 对于将音乐转成 MIDI 五线谱并重新演奏,字节在 Github 发布了古典钢琴曲数据集GiantMIDI-Piano,知乎专栏上的大佬对此项目做了改进,可批量转谱。相关代码包和钢琴模型包的下载链接为:https://pan.baidu.com/s/1aqnlgfFCjB0KIlPEB8RcRg 提取码:xubj ,也可通过 wps 下载:https://kdocs.cn/join/gezxr3f 。需注意其中包含训练好的模型、ffmpeg 和 python 安装包,为避免多个 python 版本冲突,建议自行安装 python 并用 pip 安装 ffmpeg 库。
  2. Colab 上有扒谱模型 MT3,支持多种乐器,但精确度稍弱。其 Github 地址为:https://github.com/magenta/mt3/tree/main ,Colab 地址为:https://colab.research.google.com/github/magenta/mt3/blob/main/mt3/colab/music_transcription_with_transformers.ipynb#scrollTo=s2s3JAvBAgFB 。
Content generated by AI large model, please carefully verify (powered by aily)

References

AI离谱社黄师傅:AI 我中华工作流程分享

以下拆解来自「来来」:每个片段可以自己点小箭头展开括号中的软件,前者是做视频的,后者是做图片的,黑色是Runway+MJ;红色是Deforum+MJ;蓝色是Runway+SD光影文字光影字在文档最下面,如需学习可以到[目录:Stable Diffusion](https://waytoagi.feishu.cn/wiki/FUQAwxfH9iXqC9k02nYcDobonkf)板块有不少案例,比如24节气[heading2]画面1~6:风景:长城等(Runway+MJ)[content][heading2]画面7~9:北京风景:永定河+门头沟+天坛(Deforum+MJ)[content][heading2]画面10:北京文字(Runway+SD光影文字)[content][heading2]画面11~12:安徽风景:徽派建筑+黄山(Runway+MJ)[content][heading2]画面13:安徽文字(Runway+SD光影文字)[content][heading2]画面14:四川人文:熊猫打麻将(Runway+MJ)[content][heading2]画面15:四川文字(Runway+SD光影文字)[content][heading2]画面16:上海人文:小笼包(Runway+MJ)[content][heading2]画面17~19:上海人文(Deforum+MJ+SD光影文字)[content][heading2]画面20:重庆美食:火锅(Runway+MJ)[content][heading2]画面21:重庆文字(Runway+SD光影文字)[content][heading2]画面22:江西人文:山水+瓷器(Runway+MJ)[content][heading2]画面23:江西文字(Runway+SD光影文字)[content]

[音乐学习] AI音乐向100分迈进,钢琴曲音质修复

将音乐转成MIDI五线谱,然后通过成熟的合成器重新演奏,目前看是最稳定的合成方式了。字节已经在Github发布了古典钢琴曲数据集[GiantMIDI-Piano](https://github.com/bytedance/GiantMIDI-Piano),可以拿来抄作业,用钢琴转谱技术识别音频,并转换成可编辑的MIDI格式重新演奏。知乎专栏上的大佬在这个项目上做了些改进,可以批量转谱,很方便。下面是代码包和钢琴模型包,直接下载即可链接:[https://pan.baidu.com/s/1aqnlgfFCjB0KIlPEB8RcRg](https://link.zhihu.com/?target=https%3A//pan.baidu.com/s/1aqnlgfFCjB0KIlPEB8RcRg)提取码:xubj百度要会员比较麻烦,我另外传了个wps:https://kdocs.cn/join/gezxr3f注意里面包含了训练好的模型,ffmpeg和python安装包,为了避免多个python版本冲突,建议大家自己安装python,用pip安装ffmpeg库。

乐理篇:声音和音乐的基础

暂时学到的就在这里了,有音乐背景的大佬欢迎补充指点,下面是群里整合的系统学习乐理的文档[前菜:乐理知识](https://xinzhiaigc.feishu.cn/wiki/O9GzwtrShiUDhtkwCRTcy6u7ncf)[heading1]尝试AI转谱精细化处理[content]之前我有写过一篇本地化扒谱的脚本(目前只支持钢琴,字节的模型)[吵爷:AI音乐向100分迈进,钢琴曲音质修复](https://waytoagi.feishu.cn/wiki/QuH4wPKVyiggclkMG14cNrpnnxg)同时Colab上也有挺不错的扒谱模型MT3,支持多种乐器,但用下来精确度会弱一些,可以尝试一下Github:https://github.com/magenta/mt3/tree/mainColab:https://colab.research.google.com/github/magenta/mt3/blob/main/mt3/colab/music_transcription_with_transformers.ipynb#scrollTo=s2s3JAvBAgFB

Others are asking
录音转文字免费ai 都有哪些?
以下是一些免费的录音转文字工具: 1. 飞书妙记:飞书的办公套件之一,网址为 https://www.feishu.cn/product/minutes 。 2. 通义听悟:阿里推出的 AI 会议转录工具,网址为 https://tingwu.aliyun.com/home 。 3. 讯飞听见:讯飞旗下智慧办公服务平台,网址为 https://www.iflyrec.com/ 。 4. Otter AI:用于转录采访和会议纪要,网址为 https://otter.ai/ 。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。 此外,Vocs AI 也是一个免费的人工智能语音生成器和转换器,网址为 https://www.vocs.ai/ 。使用时需注意:上传一段清晰的无伴奏人声录音(wav 或 mp3 格式,更推荐 wav),从超过 20 名才华横溢的 AI 歌手、说唱歌手、叙述者、角色和配音艺术家中选择,将原始无伴奏声音转换成 AI 虚拟艺术家的声音,点击“转换”,下载转换后的音频。输入音频的质量将直接影响 AI 人声转换的输出质量,因此最好在进行 AI 转换之前,确保原始人声符合期望。 内容由 AI 大模型生成,请仔细甄别。
2025-02-26
小白如何用ai开始学习图片设计
对于小白如何用 AI 开始学习图片设计,以下是一些建议: 1. 图像流搭建 创建第一个图像流:由于文本类型大语言模型无法直接生成图片,需要通过【技能】部分的图像流为文本大模型提供图像生成能力。为 bot 加入图像流时,要设定图像流名称以及描述(名称只能是英文)。 了解图像流节点的意义:图像流编辑界面左侧的工具栏集合了所有可能用到的功能,大致可分为智能处理工具(如“智能生成”“智能抠图”“画质提升”等)、基础编辑工具(如画板、裁剪、调整、添加文字等)和风格处理类工具(如风格迁移、背景替换等)。从基础编辑工具开始尝试,熟悉后再探索其他功能。右侧类似画布,可拖拽左侧工具或点击“+”拖放各种工具模块,工具之间可连接形成工作流程。 根据需求进行图像流设计:例如生成海报功能,在总结故事后,将完整的故事作为输入,对输入的故事进行一轮提示词优化,从自然语言转变为更符合文生图大模型的提示词,将优化后的提示词输入生图大模型,调整生图的基础风格和信息,输出最终的配图海报。 测试图像流。 2. 利用即梦 AI 生成海报 提示词:皮克斯风格,三宫格漫画:一只小狗,坐在办公桌前,文字“KPI 达标了吗?”。一只小狗,拿着一个写满计划的大本子,微微皱着眉头,文字“OKR 写好了吗?”。一只小狗坐在电脑前,文字“PPT 做好了吗?”。 实操教程: 打开即梦 AI:https://jimeng.jianying.com/aitool/home 。 点击 AI 作图中的图片生成。 填写绘图提示词,选择生图模型 2.1,点击立刻生成。 3. 进阶技巧和关键词 图片内容一般分为二维插画以及三维立体两种主要表现形式。 主题描述:可以描述场景、故事、元素、物体或人物细节、搭配等。描述场景中的人物时,最好独立描述,不要用一长串文字,否则 AI 可能识别不到。 设计风格:可找风格类关键词参考或垫图/喂图,让 AI 根据给出的图片风格结合主题描述生成图片。对于某些材质的描述,关键词的运用有很多门道,需要针对某一种风格单独进行“咒语测试”。
2025-02-26
AI生成PPT
以下是关于 AI 生成 PPT 的相关内容: 卓 sir 的制作流程:先让 GPT4 生成 PPT 大纲,然后将大纲导入 WPS 启用 WPS AI 一键生成 PPT,再让 chatPPT 添加动画,最后手动修改细节。其中,生成符合要求的大纲最费时间。 市面上大多数 AI 生成 PPT 的思路:AI 生成 PPT 大纲、手动优化大纲、导入工具生成 PPT、优化整体结构。 相关推荐:gamma、AIPPT、islide AI 等产品,其中 gamma 被认为在审美方面表现较好。 扩展阅读:《AI 生成 PPT 工具红黑榜,这三款千万别用》《AI+PPT 等效率工具的研报》 您可以根据自己的需求和喜好选择合适的方法和工具来生成 PPT。
2025-02-26
文生营销图AI
以下是关于文生营销图 AI 的相关教程: Liblibai 简易上手教程: 1. 定主题:确定您需要生成的图片的主题、风格和要表达的信息。 2. 选择 Checkpoint:根据主题选择内容贴近的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. 设置 VAE:选择 840000 那一串。 5. CLIP 跳过层:设为 2。 6. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需语法和长句。 7. 负向提示词 Negative Prompt:用英文写要避免的内容,同样是单词和短语组合,用英文半角逗号隔开。 8. 采样方法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 9. 迭代步数:选 DPM++2M Karras 时,在 30 40 之间,多了意义不大且慢,少了效果差。 10. 尺寸:根据喜好和需求选择。 11. 生成批次:默认 1 批。 Tusiart 简易上手教程: 1. 定主题:确定图片的主题、风格和要表达的信息。 2. 选择基础模型 Checkpoint:根据主题选择贴近的 Checkpoint,如麦橘、墨幽的系列模型。 3. 选择 lora:寻找与生成内容重叠的 lora,以控制图片效果和质量。 4. ControlNet:用于控制图片中特定的图像,如人物姿态等,属于高阶技能。 5. 局部重绘:下篇再教。 6. 设置 VAE:选择 840000 那一串。 7. Prompt 提示词:用英文写需求,使用单词和短语组合,用英文半角逗号隔开,无需语法和长句。 8. 负向提示词 Negative Prompt:用英文写要避免的内容,同样是单词和短语组合,用英文半角逗号隔开。 9. 采样算法:一般选 DPM++2M Karras,也可参考模型作者推荐的采样器。 10. 采样次数:选 DPM++2M Karras 时,在 30 40 之间,多了意义不大且慢,少了效果差。 11. 尺寸:根据喜好和需求选择。 关于【SD】文生图提示词: 1. 避免使用太大的数值,如 1920x1080,可能导致奇怪构图,可使用高清修复放大图像倍率,记住高宽比主要控制画面比例。 2. 调整好参数后生成图片,若质感不足,可添加标准化提示词,如:,绘图,画笔等,让画面更趋近于固定标准。
2025-02-26
AI LOGO工具
以下是一些生成 Logo 的 AI 产品: 1. Looka:这是一个在线 Logo 设计平台,使用 AI 理解用户的品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器利用 AI 技术创建个性化设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的设计工具,用户能拖放设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 这些 AI 产品让无设计背景的用户也能轻松创建专业 Logo。使用时,用户可根据品牌理念和视觉偏好,通过简单交互获得系列方案,并进一步定制优化至满意。 此外,您还可以访问网站的 AI 生成 Logo 工具版块获取更多好用的工具:https://waytoagi.com/category/20 。 在第六期“一起做个 LOGO 吧”活动中,活动时间为 2024 年 6 月 9 日至 2024 年 6 月 16 日。活动目标包括探索制作 LOGO 方法、创造独特生成技巧、制作代表学习成果的作品。参与方式为使用 SD 等 AI 工具出图并将作品发送至 SD 学社微信群。会创建在线文档收集作品,6 月 16 日举行群内投票选出前三名,注意事项包括确保设计原创、允许作品公开展示以及在截止日期前提交。 在 AI 制作游戏 PV《追光者》中,故事背景创作阶段结合 chatGPT 发散制作游戏世界观,引导 ChatGPT 用分镜形式描述,使用 new bing 共创细致的故事分镜。生图阶段利用 ChatGPt 制作 midjourney 提示词工具,进入 midjourney 绘图包括制作 logo。还统一了 MJ 风格描述词,建立 AI 描述词模板,运用 midjourney 尝试制作不同风格 logo,最后用 PS 合成。
2025-02-26
我想知道ai学习路径
以下是为您提供的 AI 学习路径: 一、了解 AI 基本概念 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您可以找到为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并争取获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛,涵盖图像、音乐、视频等。您可以根据自身兴趣选择特定模块深入学习,比如掌握提示词的技巧,这上手容易且实用。 四、实践和尝试 理论学习后,实践是巩固知识的关键。您可以尝试使用各种产品进行创作,知识库中也有很多实践后的作品和文章分享,欢迎您在实践后进行分享。 五、体验 AI 产品 与现有的 AI 产品互动,如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人,了解其工作原理和交互方式,获得对 AI 实际应用表现的第一手体验。 六、技术研究方向 1. 数学基础:线性代数、概率论、优化理论等。 2. 机器学习基础:监督学习、无监督学习、强化学习等。 3. 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 4. 自然语言处理:语言模型、文本分类、机器翻译等。 5. 计算机视觉:图像分类、目标检测、语义分割等。 6. 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 7. 科研实践:论文阅读、模型实现、实验设计等。 七、应用方向 1. 编程基础:Python、C++等。 2. 机器学习基础:监督学习、无监督学习等。 3. 深度学习框架:TensorFlow、PyTorch 等。 4. 应用领域:自然语言处理、计算机视觉、推荐系统等。 5. 数据处理:数据采集、清洗、特征工程等。 6. 模型部署:模型优化、模型服务等。 7. 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 希望以上内容对您有所帮助。
2025-02-26
免费的图生视频软件
以下为一些免费的图生视频软件: Runway:可将图片拖进去生成 4 秒视频,但它是收费的,您也可以在闲鱼或淘宝找号。进入官网首页点击“start with image”,直接拖图片进来,动画幅度用 3,5 有时会乱跑,无需等进度条转完可继续放图。 Haiper:有免费额度,网址为 https://haiper.ai/ 。能生成文生视频、图生视频、素描生视频、扩展视频,还能生成 HD 超高清的视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值,图生视频只能写提示词、秒数(2s 和 4s)、种子值。 DynamiCrafter:免费,网址为 https://huggingface.co/spaces/Doubiiu/DynamiCrafter ,可生成 2 秒图生视频,还能做短视频拼长视频。 此外,还有一些相关模型的特点供您参考: |排序(从高到低)|模型|特点(优缺)| |||| |1|pd 2.0 pro|生成的画面有点颗粒感,p2.0 模型很能打,适合做一些二次元动漫特效,理解能力更强,更适合连续运镜| |2|luma 1.6|画面质量挺好,但太贵| |3|可灵 1.6 高品质|YYDS!| |4|海螺01live|文生视频比图生视频更有创意,图生也还可以,但大幅度动作下手部会出现模糊的情况,整体素质不错,就是太贵| |5|runway|画面质量不算差,适合做一些超现实主义的特效、经特殊就容镜头| |6|智谱 2.0|做的一些画面特效挺出圈,适合整过,但是整体镜头素质还差点,好处就是便宜,量大,管饱,还能给视频加音效| |7|vidu1.5|二维平面动画的快乐老家,适合做特效类镜头,单镜头很惊艳,大范围运镜首尾帧 yyds! 就是太贵| |8|seaweed 2.0 pro|适合动态相对小的,更适合环绕旋转运镜动作小的| |9|pixverse v3 高品质|首尾帧能打,就是画面美学风格还有待提升| |10|sora|不好用,文生视频挺强,但图生视频抽象镜头太多,半成品都算不上,不建议使用|
2025-02-26
Deepseek现在能和哪些办公软件联用了?
DeepSeek 目前可以与以下办公软件联用: 1. 飞书多维表格。 2. Coze 智能体。 3. 可通过浏览器插件调用,如使用 Chrome 或 Microsoft Edge 浏览器,安装插件(https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo ),然后进行相关配置和操作。
2025-02-26
我要做动画短片 ,从剧本到成片,需要用到哪些AI软件(国内可用的)?
2025-02-25
在短视频制作领域,有哪些AI软件可供使用?可以提供哪些帮助?有没有很好的案例参考?
在短视频制作领域,以下是一些可供使用的 AI 软件及其所能提供的帮助和相关案例参考: 1. ChatGPT + 剪映:ChatGPT 可生成视频脚本,剪映能依据脚本自动分析所需场景、角色、镜头等要素并生成素材和文本框架,实现从文字到画面的快速转化,节省时间和精力。 2. PixVerse AI:在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 3. Pictory:AI 视频生成器,允许用户轻松创建和编辑高质量视频,用户提供文本描述即可生成相应内容。 4. VEED.IO:提供 AI 图像生成器和 AI 脚本生成器,帮助用户从图像制作视频,并规划视频内容。 5. Runway:AI 视频创作工具,能将文本转化为风格化的视频内容,适用于多种场景,但存在爱变色、光影不稳定的问题。 6. 艺映 AI:专注于人工智能视频领域,提供文生视频、图生视频、视频转漫等服务,可根据文本脚本生成视频。 案例参考:在制作 AI 短片时,会根据不同工具对画面的处理能力进行组合使用。例如,Pixverse 擅长物体滑行运动,有手部特殊运动的画面会用 Runway 来辅助完成,需要人物表情自然的画面会用 Pika 来生成。在声音方面,使用 11labs 进行对白制作,但存在 AI 声音没有情绪和情感的问题。在剪辑方面,先进行粗剪确定画面逻辑,再进行定剪调整和替换画面素材。音效和音乐方面,剪映中有简单音效库,复杂音效可能需另外制作,商用音乐要注意版权。特效方面,剪映可添加一些光影效果。包装方面,剪映智能匹配字幕较为方便。
2025-02-25
户型方案布局AI软件有哪些
以下是一些户型方案布局的 AI 软件: 1. HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster,软件 UI 和设计成果颜值高。 2. Maket.ai:主要面向住宅行业,设计师输入房间面积需求和土地约束,软件能自动生成户型图。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期可引入标准和规范约束设计结果。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,将建筑全寿命周期内的信息集成,实现数据汇总与管理。 每个工具都有特定应用场景和功能,建议根据具体需求选择合适的工具。
2025-02-24
有可以用于建设工程工程量计算的AI软件吗
目前在建设工程工程量计算方面,有一些专门的 AI 软件可供使用。例如广联达 BIM 安装计量 GQI2021,它能够利用 AI 技术提高工程量计算的效率和准确性。此外,鲁班算量软件也在一定程度上应用了 AI 算法来辅助工程量的计算。不过,具体选择哪种软件还需根据您的具体需求和项目特点来决定。
2025-02-24