Chat with Wiki - 有没有语音翻译工具

Answer

以下为您介绍一些语音翻译工具：

Eleven Labs 推出的 Dubbing：可以将视频/音频翻译成不同的语言，同时保持原始的声音。支持十一种语言的 AI 配音功能，v2 模型目前支持包括印地语、葡萄牙语、西班牙语、日语、乌克兰语、波兰语、阿拉伯语等 20 多种语言的语音翻译。还可以检测多个说话人的声音，支持背景音分离和环境音降噪。
ZipZapAI：提供沉浸式阅读和写作体验，支持多种语言的高质量翻译。能够智能识别网页上的内容，如 Twitter、Discord 等，提供鼠标悬停翻译。支持 Chrome、Edge 等主流浏览器，下载插件即可使用。具有简单易用的用户界面，操作方便，内置了 GPT 的聊天功能，可以随时提问。

此外，ChatGPT 的语音功能已向所有免费用户开放，更新下载客户端即可使用。

Content generated by AI large model, please carefully verify (powered by aily)

References

ElevenLabs推出Dubbing，一种语音翻译工具，可以将视频/音频翻译成不同的语言，同时保持原始的声音。AI配音功能支持十一种语言，v2模型目前支持的20多种语言的语音翻译，包括印地语、葡萄牙语、西班牙语、日语、乌克兰语、波兰语或阿拉伯语。还可以检测多个说话人的声音，支持背景音分离和环境音降噪。国内优秀视频创作者的受众可以极大的拓展了。[heading2][谷歌在图片搜索中加入图片生成功能](https://blog.google/products/se[content]谷歌上周在搜索实验室中增加了一个功能，有两个触发方式首先是你可以直接在搜索框输入“画一张戴着厨师帽和烹饪早餐的水豚的图片”之类的内容生成图像。另一种方式可以直接在Google图片中创建AI生成的图像，作为此实验的一部分。此功能旨在当你寻找灵感时出现，例如“极简万圣节餐桌设置”或“幽灵狗屋创意”。除此之外还有一个即将推出的工具，名为“关于此图像”，它将帮助人们轻松评估图像的背景和可信度。例如，它可能会向你显示Google首次看到此图像的类似版本的时间；或向你显示网络上使用类似图像的其他页面，包括新闻或事实核查网站。图像生成和图像搜索这个场景结合还是挺好的，从图像质量来看也还行，在及格线以上。

XiaoHu.AI日报

🔗https://x.com/xiaohuggg/status/1727119128581100001?s=20🔟🗣️ChatGPT：语音功能向所有免费用户开放更新下载客户端即可使用语音功能。🔗https://x.com/xiaohuggg/status/1727112003372892187?s=201⃣1⃣️一个沉浸式的翻译工具：ZipZapAI🌐高质量多语言翻译：提供沉浸式阅读和写作体验，支持多种语言的高质量翻译。🔍智能内容识别：能够智能识别网页上的内容，如Twitter、Discord等，提供鼠标悬停翻译。🌍支持主流浏览器：支持Chrome、Edge等主流浏览器，下载插件即可使用。👍用户友好：简单易用的用户界面，操作很方便。💬随时询问AI：内置了GPT的聊天功能，可以随时提问。🔗https://twitter.com/xiaohuggg/status/1727267679663477212

TTS 数据整理

|类别|名称|描述|链接|详情||-|-|-|-|-||歌声|MUSDB18|corpus for music separation|[https://sigsep.github.io/datasets/musdb.html#musdb18-compressed-stems](https://sigsep.github.io/datasets/musdb.html#musdb18-compressed-stems)|||歌声|DSD100|100 full lengths music tracks of different styles along with their isolated drums,bass,vocals and others stems.|[https://sigsep.github.io/datasets/dsd100.html](https://sigsep.github.io/datasets/dsd100.html)|||歌声|Korean Songs||[http://urisori.co.kr/urisori-en/doku.php/](http://urisori.co.kr/urisori-en/doku.php/)|||speech2speech|cvss|21种语言转英语|[https://github.com/google-research-datasets/cvss](https://github.com/google-research-datasets/cvss)|||说话人日志Speaker diarisation|AiShell-4|211场会议，120小时|[http://www.aishelltech.com/aishell_4](http://www.aishelltech.com/aishell_4)|||说话人日志Speaker diarisation|AliMeeting|118.75小时会议数据|[https://www.openslr.org/119/](https://www.openslr.org/119/)|||wake up唤醒|WakeUp-1|中英文1561小时|[http://www.aishelltech.com/wakeup_data](http://www.aishelltech.com/wakeup_data)|||wake up唤醒|HI-MIA|340说话人,智能家居|[http://www.openslr.org/85/](http://www.openslr.org/85/)|||wake up唤醒|MobvoiHotwords|每词36k句|[https://www.openslr.org/87/](https://www.openslr.org/87/)|||wake up唤醒|hey snips||[https://github.com/sonos/keyword-spotting-research-datasets](https://github.com/sonos/keyword-spotting-research-datasets)|||speech translation|Fisher--CALLHOME|Es→En 160hrs|[https://joshua.incubator.apache.org/data/fisher-callhome-corpus/](https://joshua.incubator.apache.org/data/fisher-callhome-corpus/)|||speech translation|STC|En↔Jp 22hrs|[https://ahcweb01.naist.jp/resource/stc/](https://ahcweb01.naist.jp/resource/stc/)|||speech translation|How2|En→Pt 300hrs|[https://github.com/srvk/how2-dataset](https://github.com/srvk/how2-dataset)||