直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

音频转文字

回答

以下是关于音频转文字的相关信息:

  • 推荐使用 OpenAI 的 wishper,相关链接为:https://huggingface.co/openai/whisper-large-v2 。还有一个项目:https://huggingface.co/spaces/sanchit-gandhi/whisper-jax ,此项目在 JAX 上运行,后端支持 TPU v4-8,与 A100 GPU 上的 PyTorch 相比,快 70 多倍,是目前最快的 Whisper API。
  • 语音转文本 API 提供了转录和翻译两个端点,基于开源大型-v2 Whisper 模型。可用于将音频转录为任何语言,将音频翻译并转录成英语。目前文件上传限制为 25MB,支持的输入文件类型包括:mp3、mp4、mpeg、mpga、m4a、wav 和 webm。
  • 转录 API 的输入是要转录的音频文件及所需输出格式的音频文字稿,默认响应类型为包含原始文本的 JSON,可添加更多带有相关选项的--form 行设置其他参数。
  • 翻译 API 以任何支持的语言作为输入音频文件,并在必要时将音频转录成英文,目前仅支持英语翻译。
  • 支持的语言包括:南非荷兰语、阿拉伯语、亚美尼亚语、阿塞拜疆语、白俄罗斯语、波斯尼亚文、保加利亚文、加泰罗尼亚文、中文、克罗地亚文、捷克文、丹麦文、荷兰文、英国英语、爱沙尼亚文、芬兰文、法国法式英语、加利西亚语、德语、希腊语、希伯来语、印地语、匈牙利语、冰岛语、印度尼西亚语、意大利语、日语、卡纳达语、哈萨克语、韩语、拉脱维亚语、立陶宛语、马其顿语、马来语、马拉地语。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

语音:语音转文字

[title]语音:语音转文字语音转文字推荐OpenAI的wishperhttps://huggingface.co/openai/whisper-large-v2语音转文字:一分钟搞定的~ 23分钟的音频https://huggingface.co/spaces/sanchit-gandhi/whisper-jax这个项目在JAX上运行,后端支持TPU v4-8。与A100 GPU上的PyTorch相比,它要快70多倍,是目前最快的Whisper API。

语音转文本(Speech to text)

语音转文本API提供了两个端点,即基于我们最先进的开源大型-v2 Whisper模型的转录和翻译。它们可以用于:将音频转录为任何语言。将音频翻译并转录成英语。目前文件上传限制为25 MB,并支持以下输入文件类型:mp3、mp4、mpeg、mpga、m4a、wav和webm。[heading2]快速入门[heading3]转录[content]转录API的输入是您要进行转录的音频文件以及所需输出格式的音频文字稿。我们目前支持多种输入和输出文件格式。默认情况下,响应类型将是包含原始文本的JSON。要在请求中设置其他参数,您可以添加更多带有相关选项的--form行。例如,如果您想将输出格式设置为文本,则应添加以下行:[heading3]翻译[content]翻译API以任何支持的语言作为输入音频文件,并在必要时将音频转录成英文。这与我们的/Transcriptions端点不同,因为输出不是原始输入语言,而是被翻译成英文文本。在这种情况下,输入的音频是德语,输出的文本看起来像:我们目前仅支持英语翻译。

语音转文本(Speech to text)

[title]语音转文本(Speech to text)[heading2]支持的语言南非荷兰语,阿拉伯语,亚美尼亚语,阿塞拜疆语,白俄罗斯语,波斯尼亚文,保加利亚文,加泰罗尼亚文,中文,克罗地亚文、捷克文、丹麦文、荷兰文、英国英语、爱沙尼亚文、芬兰文、法国法式英語,加利西亞語,德國語,希臘語,希伯來語,印地語,匈牙利語,冰島icelandic読音:[ˈaɪsləndɪk],印度尼西雅Indonesian読音:[indoneˈsia],意大利Italian読音:[iːtæljən],日本Japanese読音:[dʒæpəniːz],卡纳达Kannada読音:[kʌn'na:dʌ],哈萨克Kazakh読音:[kɑzɑx],韩国Korean读作:[hanguk],拉脫維Latvian读作:[lætvijan],立陶宛Lithuanian读作:[liθu'einjən],马其顿Macedonian读作:[mækidouniən],马来Malay读作:['meilei],馬拉地Marathi讀作:[ma'rathi

其他人在问
音频克隆
以下是关于音频克隆的相关信息: GPTSoVITS 是一个声音克隆和文本到语音转换的开源 Python RAG 框架。其主要特点包括: 1. 零样本 TTS:输入 5 秒的声音样本即可体验即时的文本到语音转换。 2. 少量样本训练:只需 1 分钟的训练数据即可微调模型,提高声音相似度和真实感,模仿出来的声音更接近原声,更自然。 3. 跨语言支持:支持与训练数据集不同语言的推理,目前支持英语、日语和中文。 4. 易于使用的界面:集成了声音伴奏分离、自动训练集分割、中文语音识别和文本标签等工具,帮助初学者更容易地创建训练数据集和 GPT/SoVITS 模型。 5. 适用于不同操作系统:项目可以在不同的操作系统上安装和运行,包括 Windows。 6. 预训练模型:项目提供了一些已经训练好的模型,可直接下载使用。 GitHub 地址: 视频教程: 使用方法: 1. 注册 colab,启动准备:点击进入按照步骤注册,新建笔记本,运行脚本启动 GPTSo VITS。整个过程比较漫长,需要耐心等待,可以整个脚本一起运行,也可以一段一段运行。运行过程包括克隆项目代码库、进入项目目录、安装 Python 依赖包、安装系统依赖、下载 NLTK 资源、启动 Web UI。运行成功后会出现 public URL。 2. 训练音频准备与上传。 此外,还有 XiaoHu.AI 日报中提到的声音克隆相关内容,它由主要模型 SenseVoice 和 CosyVoice 构成,声音克隆仅需几秒音频样本,无需额外训练数据,还能控制情绪情感、语速、音高。详细内容:https://xiaohu.ai/p/10954 项目地址:https://funaudiollm.github.io 在线演示:https://modelscope.cn/studios/iic/CosyVoice300M
2024-11-12
获取视频音频转化成字幕并翻译的插件有么?
以下是一些可以将视频音频转化成字幕并翻译的插件和工具: 1. Reccloud:免费的在线 AI 字幕生成工具,可直接上传视频进行精准识别,能对识别的字幕进行翻译,自动生成双语字幕。声称已处理 1.2 亿+视频,识别准确率接近 100%。 2. 绘影字幕:一站式专业视频自动字幕编辑器,提供简单、准确、快速的字幕制作和翻译服务,支持 95 种语言,准确率高达 98%,还可自定义字幕样式。 3. Arctime:能对视频语音自动识别并转换为字幕,甚至支持自动打轴,支持 Windows 和 Linux 等主流平台,支持 SRT 和 ASS 等字幕功能。 4. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 此外,关于语音转文本(Speech to text),语音转文本 API 提供了两个端点,基于开源大型v2 Whisper 模型的转录和翻译。目前文件上传限制为 25MB,支持 mp3、mp4、mpeg、mpga、m4a、wav 和 webm 等输入文件类型。 对于提示词翻译,可使用百度翻译 API,方法如下: 1. 下载节点压缩包,并将它放在 custom_nodes 文件夹。 2. 去百度翻译 Api 登记册开发人员的帐户中得到您的 appid 和 secretKey,百度翻译平台地址:https://fanyiapi.baidu.com/manage/developer 。 3. 打开文件 config.py 在记事本或其他编辑工具中,填写您的 secretKey 并保存文件,重启 Comfy 即可。 以上工具各有特点,您可以根据自己的需求选择最适合的。内容由 AI 大模型生成,请仔细甄别。
2024-11-02
音频转文字
以下是关于音频转文字的相关信息: 推荐使用 OpenAI 的 wishper,相关链接:https://huggingface.co/openai/whisperlargev2 。 一分钟搞定 23 分钟音频的相关链接:https://huggingface.co/spaces/sanchitgandhi/whisperjax 。该项目在 JAX 上运行,后端支持 TPU v48,与 A100 GPU 上的 PyTorch 相比,速度快 70 多倍,是目前最快的 Whisper API。 语音转文本 API 提供了转录和翻译两个端点,基于开源大型v2 Whisper 模型。可用于将音频转录为任何语言,将音频翻译并转录成英语。目前文件上传限制为 25MB,支持的输入文件类型包括:mp3、mp4、mpeg、mpga、m4a、wav 和 webm。 转录 API 的输入是要转录的音频文件及所需输出格式的音频文字稿,默认响应类型为包含原始文本的 JSON,可通过添加更多带有相关选项的form 行设置其他参数。 翻译 API 以任何支持的语言作为输入音频文件,并在必要时将音频转录成英文,目前仅支持英语翻译。 支持的语言包括:南非荷兰语、阿拉伯语、亚美尼亚语、阿塞拜疆语、白俄罗斯语、波斯尼亚文、保加利亚文、加泰罗尼亚文、中文、克罗地亚文、捷克文、丹麦文、荷兰文、英国英语、爱沙尼亚文、芬兰文、法国法式英语、加利西亚语、德语、希腊语、希伯来语、印地语、匈牙利语、冰岛语、印度尼西亚语、意大利语、日语、卡纳达语、哈萨克语、韩语、拉脱维亚语、立陶宛语、马其顿语、马来语、马拉地语。
2024-10-31
请总结本知识库,并提炼出11节面向十岁儿童关于AIGC的课程,三节是提示词工程,2节文生文,2节文生图/图生图,2节文生音频,2节文生视频/图生视频,不需要涉及智能体及文生代码
以下是对本知识库的总结: 包含了不同时间段的 AIGC 周刊内容,如 Open AI 发布 ChatGPT 的 iOS 应用、Google 宣布多项 AI 新功能、AI 歌手相关教程等。 有关于提示词工程的课程及相关技巧介绍。 涉及一些特定的 AIGC 技术和方法,如 Donut 文档理解方法。 提到了谷歌的生成式 AI 学习课程。 以下是为十岁儿童设计的 11 节关于 AIGC 的课程: 1. 提示词工程基础 什么是提示词 提示词的作用 简单的提示词示例 2. 提示词工程进阶 复杂提示词的构建 如何优化提示词 提示词的实际应用 3. 提示词工程实践 设计自己的提示词任务 分享与讨论提示词成果 总结提示词的使用技巧 4. 文生文入门 了解文生文的概念 简单的文生文工具介绍 尝试生成一段文字 5. 文生文提高 优化文生文的输入 让生成的文字更有趣 比较不同文生文的效果 6. 文生图/图生图基础 认识文生图和图生图 常见的文生图工具 用简单描述生成一张图片 7. 文生图/图生图进阶 更复杂的描述生成精美图片 对生成的图片进行修改 分享自己生成的图片 8. 文生音频入门 什么是文生音频 简单的文生音频工具 生成一段简单的音频 9. 文生音频提高 让生成的音频更动听 给音频添加特效 欣赏优秀的文生音频作品 10. 文生视频/图生视频基础 文生视频和图生视频的概念 基本的文生视频工具 制作一个简单的视频 11. 文生视频/图生视频进阶 让视频更精彩 视频的后期处理 展示自己制作的视频
2024-10-31
情感丰富音频ai模型
以下为您介绍一些情感丰富音频 AI 模型: 阿里云最新开源模型 FunAudioLLM:这是通义实验室语音团队全新推出的生成式语音大模型,能提供舒适自然的语音合成能力。它可以生成不同情感的语音,如中性、悲伤、快乐等。例如,悲伤情感的语音有“等你熬过那些孤独无助的时刻,你才会发现,原来自己并没有想象中那么脆弱。原来一个人,也可以活成千军万马的模样。我可以安慰很多人,但就是不能安慰自己那颗千疮百孔的心。总有一些人会慢慢淡出你的生活。你要学会接受,而不是怀念。有些事。不管我们如何努力,回不去就是回不去了。我们漫长的岁月中有太多的过客,有太多的无奈。”;快乐情感的语音有“小丽抿着嘴,弓着腰,蹑手蹑脚地,一步一步慢慢地靠近它。靠近了,靠近了,又见她悄悄地将右手伸向蝴蝶,张开的两个手指一合,夹住了粉蝶的翅膀。小丽高兴得又蹦又跳。除夕晚上,儿子孙子都来到她身边,她满脸皱纹都舒展开了,就像盛开的菊花瓣,每根皱纹里都洋溢着笑意。” XiaoHu.AI 日报中提到的模型:它由 SenseVoice 和 CosyVoice 构成。声音克隆仅需几秒音频样本,无需额外训练数据,还能控制情绪情感、语速、音高。详细内容:https://xiaohu.ai/p/10954 项目地址:https://funaudiollm.github.io 在线演示:https://modelscope.cn/studios/iic/CosyVoice300M 此外,还有 LLM 比价工具,可对比不同种类模型型号的订阅价格和 API 价格,传送门:https://huggingface.co/spaces/philschmid/llmpricing 以及浦语灵笔 IXC2.5,能看懂视频,完整书写文章,自动生成网站,由上海人工智能实验室开发,使用 7B LLM 后端,具有与 GPT4V 相当的能力,擅长网页制作和高质量文本图像文章创作。详细内容:https://xiaohu.ai/p/10891
2024-10-28
有什么模型或者工具可以直接完成: 上传音频文件,输出文字稿,并且文字稿会做声纹识别区分说话人
以下是为您提供的相关信息: Hedra:hedra.com 放出了基础模型 Character1 的研究预览版,即日起在 http://hedra.com(桌面和移动)上提供。它可以直接文字转语音,目前有 6 个语音,也可以直接上传音频。 Sovits:关于基于 Sovits 的声音训练及推理,需要准备数据集,百度网盘链接为:https://pan.baidu.com/s/14iK32JKIPvjmf1Kfq21mzg?pwd=hjhj 提取码:hjhj 。模型的安装比较简单,拷贝就行,详情请看网盘里的说明。提取人声的最佳模型是 mdxnet,提取出来的声音一般还需要用 iZotope RX 等软件精细处理,去掉杂音、和声和混响,达到“干声”效果。iZotope RX 软件链接:https://pan.baidu.com/s/1NXh67SViKm39zT08U7zg?pwd=kmhd 提取码:kmhd 。安装时记得把 vst3 和 aax 勾上,主程序安装完成后,替换补丁是直接复制粘贴,不需要双击运行。安装完成后,打开提取的人声,左下角的控件移动到最左边,让图形更加清爽。去混响可按特定顺序操作,并通过调整数值以耳朵为准感受效果,合适则点击渲染应用到整首歌。
2024-10-23
文字生图的必学知识
以下是关于文字生图的必学知识: 1. 开始方式: 本地部署:如果电脑是 M 芯片的 Mac 电脑(Intel 芯片出图速度慢,不建议)或者 2060Ti 及以上显卡的 Windows 电脑,可以选择本地部署,强烈建议在配有 N 卡的 Windows 电脑上进行。 在线平台:对于电脑不符合要求的小伙伴可以直接使用在线工具,在线工具分为在线出图和云电脑两种,前者功能可能会受限、后者需要自己手动部署,大家根据实际情况选择即可。 配台电脑:非常不建议一上来就配主机,因为大概率会变成游戏机或者吃灰(土豪请随意)。玩几个月后还对 AI 有兴趣的话再考虑配个主机。主机硬盘要大,显卡预算之内买最好,其他的随意。 2. 课程简述: 先验经验:需要熟练使用文生图、图生图;需要有一定的逻辑思考能力以及推理能力;适合炼丹新人、小白。 课程安排:课程大约 70 80%是理论和方法论的内容,大部分练习会在课外跟大家沟通、练习。只有少部分必要内容会在课上演示。 3. 学习路径:必学、必看内容是基础课,主要是为了解决环境问题和软件安装不上的问题;建炉是针对不同炼丹方式提供了不同的炼丹工具的安装教程;正式的内容部分分为了数据集预处理、模型训练以及模型调试及优化三个部分。 4. 写提示词: 通常的描述逻辑:人物及主体特征(服饰、发型发色、五官、表情、动作),场景特征(室内室外、大场景、小细节),环境光照(白天黑夜、特定时段、光、天空),画幅视角(距离、人物比例、观察视角、镜头类型),画质(高画质、高分辨率),画风(插画、二次元、写实)。 辅助网站: http://www.atoolbox.net/:可以通过选项卡的方式快速地填写关键词信息。 https://ai.dawnmark.cn/:每种参数都有缩略图可以参考,可以方便更加直观的选择提示词。 C 站(https://civitai.com/):每一张图都有详细的参数,可以点击下面的复制数据按钮,然后直接粘贴到正向提示词栏里,然后点击生成按钮下的第一个按键,Stable Diffusion 就可以将所有的参数自动匹配。但要注意图像作者使用的大模型和 LORA,不然即使参数一样,生成的图也会截然不同。也可以只取其中比较好的一些描述词使用,比如人物描写、背景描述、一些小元素或者是画面质感之类的。 5. Tusiart 简易上手教程(文生图): 定主题:确定要生成的图的主题、风格、表达的信息。 选择基础模型 Checkpoint:按照主题,找内容贴近的 checkpoint。一般喜欢用模型大佬麦橘、墨幽的系列模型,比如麦橘写实、麦橘男团、墨幽人造人等,效果拔群。 选择 lora:在想要生成的内容基础上,寻找内容重叠的 lora,帮助控制图片效果及质量。可以多看看广场上做得好看的帖子里面,他们都在用什么 lora。 ControlNet:控制图片中一些特定的图像,可以用于控制人物姿态,或者是生成特定文字、艺术化二维码等等。也是高阶技能,后面再学不迟。 局部重绘:下篇再教,这里不急。 设置 VAE:无脑选择 840000 这个即可。 Prompt 提示词:用英文写想要 AI 生成的内容,不用管语法也不要写长句,仅使用单词和短语的组合去表达需求。单词、短语之间用英文半角逗号隔开即可。 负向提示词 Negative Prompt:用英文写想要 AI 避免产生的内容,也是一样不用管语法,只需单词和短语组合,中间用英文半角逗号隔开。 采样算法:比较复杂,一般选 DPM++ 2M Karras 较多。最稳妥的是留意 checkpoint 的详情页上,模型作者是否有推荐采样器,使用他们推荐的采样器会更有保障。 采样次数:要根据采样器的特征来,一般选了 DPM++ 2M Karras 之后,采样次数在 30 40 之间,多了意义不大还慢,少了出图效果差。 尺寸:看个人喜欢和需求。
2024-11-18
智谱清言,kimi,讯飞星火,在文字处理跟逻辑思维方面,谁更胜一筹
在文字处理和逻辑思维方面,智谱清言、Kimi 和讯飞星火各有特点: Kimi: 优势:具有超长上下文能力,最初支持 20 万字的上下文,现已提升到 200 万字,对于处理长文本或大量信息的任务有巨大优势,适合从事文案工作,特别是需要处理大量文字或文件的工作。 不足:在文字生成和语义理解、文字生成质量方面的能力可能不如国内其它产品好,且不支持用户自定义智能体。 智谱清言: 优势:背后的技术源自清华大学研发团队的科研成果转化,模型质量出色。在产品设计方面以 ChatGPT 为对标,努力打造类似的用户体验。是国内首批开放智能体应用的公司之一,在逻辑推理和处理复杂提示词方面表现出明显优势,在处理需要深度思考和分析的任务时表现出色。 不足:暂未提及。 讯飞星火:在结构化 prompt 测试中,对于同样的 prompt,最初的输出可能存在问题,但改写后的 prompt 效果不错。 综合来看,它们在不同方面各有优劣,具体谁更胜一筹取决于您的具体需求和使用场景。
2024-11-17
智谱清言,kimi,讯飞星火,在文字处理跟逻辑思维方面,谁更胜一筹
在文字处理和逻辑思维方面,智谱清言、Kimi 和讯飞星火各有特点: Kimi: 优势:具有超长上下文能力,最初支持 20 万字的上下文,现已提升到 200 万字,对于处理长文本或大量信息的任务有巨大优势,适合从事文案工作,特别是需要处理大量文字或文件的工作。 不足:在文字生成和语义理解、文字生成质量方面的能力可能不如国内其它产品好,且不支持用户自定义智能体。 智谱清言: 优势:背后的技术源自清华大学研发团队的科研成果转化,模型质量出色。在产品设计方面以 ChatGPT 为对标,努力打造类似的用户体验。是国内首批开放智能体应用的公司之一,在逻辑推理和处理复杂提示词方面表现出明显优势,在处理需要深度思考和分析的任务时表现出色。 不足:暂未提及。 讯飞星火:在结构化 prompt 测试中,对于同样的 prompt,最初的输出可能存在问题,但改写后的 prompt 效果不错。 综合来看,它们在不同方面各有优劣,具体谁更胜一筹取决于您的具体需求和使用场景。
2024-11-17
文字转语音
文字转语音方面的相关信息如下: 在游戏《神谕》中,ChatGPT 返回的中文文字通过 TTS 服务选择合适的声音播放出来,使用的是内部自研的 TTS 及代码平台。功能简述为让游戏开发者把文本直接转成语音。 在线 TTS 工具推荐: Eleven Labs:https://elevenlabs.io/ ,是一款功能强大且多功能的 AI 语音软件,能高保真地呈现人类语调和语调变化,并能根据上下文调整表达方式。 Speechify:https://speechify.com/ ,是一款人工智能驱动的文本转语音工具,可作为多种应用程序使用,用于收听网页、文档、PDF 和有声读物。 Azure AI Speech Studio:https://speech.microsoft.com/portal ,是一套服务,提供支持 100 多种语言和方言的语音转文本和文本转语音功能,还提供自定义的语音模型。 Voicemaker:https://voicemaker.in/ ,可将文本转换为各种区域语言的语音,并允许创建自定义语音模型,易于使用,适合为视频制作画外音或帮助视障人士。 语音转文字推荐 OpenAI 的 wishper,相关链接: https://huggingface.co/openai/whisperlargev2 https://huggingface.co/spaces/sanchitgandhi/whisperjax 。此项目在 JAX 上运行,后端支持 TPU v48,与 A100 GPU 上的 PyTorch 相比,快 70 多倍,是目前最快的 Whisper API。 在 WaytoAGI 的工具网站(https://www.waytoagi.com/sites/category/50 )上还有一系列推荐。请注意,上述内容由 AI 大模型生成,请仔细甄别。
2024-11-16
免费的语音转文字
以下是关于免费语音转文字的相关信息: 免费的会议语音转文字工具通常有使用时间限制,超过免费时间可能需要付费。以下为您推荐几款工具: 1. 飞书妙记:飞书的办公套件之一,网址为 https://www.feishu.cn/product/minutes 。 2. 通义听悟:阿里推出的 AI 会议转录工具,网址为 https://tingwu.aliyun.com/home 。 3. 讯飞听见:讯飞旗下智慧办公服务平台,网址为 https://www.iflyrec.com/ 。 4. Otter AI:转录采访和会议纪要,网址为 https://otter.ai/ 。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。 另外,语音转文本(Speech to text)方面: 1. 语音转文本 API 提供了基于开源大型v2 Whisper 模型的转录和翻译两个端点,可用于将音频转录为任何语言或翻译并转录成英语。目前文件上传限制为 25MB,支持 mp3、mp4、mpeg、mpga、m4a、wav 和 webm 等输入文件类型。 2. 对于默认情况下 Whisper API 仅支持小于 25MB 的文件,若音频文件更长,需将其分成小于 25MB 的块或使用压缩后格式,可使用 PyDub 开源 Python 软件包来拆分声频文件,但 OpenAI 对其可用性或安全性不作保证。 3. 您可以使用提示来提高 Whisper API 生成的转录质量,例如改善特定单词或缩略语的识别、保留分段文件的上下文、避免标点符号的省略等。 内容由 AI 大模型生成,请仔细甄别。
2024-11-16
语音转文字的工具
以下是一些语音转文字的工具: 1. 飞书妙记:https://www.feishu.cn/product/minutes ,是飞书的办公套件之一。 2. 通义听悟:https://tingwu.aliyun.com/home ,阿里推出的 AI 会议转录工具。 3. 讯飞听见:https://www.iflyrec.com/ ,讯飞旗下智慧办公服务平台。 4. Otter AI:https://otter.ai/ ,用于转录采访和会议纪要。 此外,还有 OpenAI 的 wishper,相关链接为: 1. https://huggingface.co/openai/whisperlargev2 2. https://huggingface.co/spaces/sanchitgandhi/whisperjax 。这个项目在 JAX 上运行,后端支持 TPU v48。与 A100 GPU 上的 PyTorch 相比,它要快 70 多倍,是目前最快的 Whisper API。 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。需要注意的是,大部分免费工具都有使用的时间限制,超过一定的免费时间后可能需要付费。同时,在使用时请仔细甄别内容。
2024-11-14