情感丰富音频ai模型-WayToAGI

回答

以下为您介绍一些情感丰富音频 AI 模型：

阿里云最新开源模型 FunAudioLLM：这是通义实验室语音团队全新推出的生成式语音大模型，能提供舒适自然的语音合成能力。它可以生成不同情感的语音，如中性、悲伤、快乐等。例如，悲伤情感的语音有“等你熬过那些孤独无助的时刻，你才会发现，原来自己并没有想象中那么脆弱。原来一个人，也可以活成千军万马的模样。我可以安慰很多人，但就是不能安慰自己那颗千疮百孔的心。总有一些人会慢慢淡出你的生活。你要学会接受，而不是怀念。有些事。不管我们如何努力，回不去就是回不去了。我们漫长的岁月中有太多的过客，有太多的无奈。”；快乐情感的语音有“小丽抿着嘴，弓着腰，蹑手蹑脚地，一步一步慢慢地靠近它。靠近了，靠近了，又见她悄悄地将右手伸向蝴蝶，张开的两个手指一合，夹住了粉蝶的翅膀。小丽高兴得又蹦又跳。除夕晚上，儿子孙子都来到她身边，她满脸皱纹都舒展开了，就像盛开的菊花瓣，每根皱纹里都洋溢着笑意。”
XiaoHu.AI 日报中提到的模型：它由 SenseVoice 和 CosyVoice 构成。声音克隆仅需几秒音频样本，无需额外训练数据，还能控制情绪情感、语速、音高。详细内容：https://xiaohu.ai/p/10954 项目地址：https://fun-audio-llm.github.io 在线演示：https://modelscope.cn/studios/iic/CosyVoice-300M 此外，还有 LLM 比价工具，可对比不同种类模型型号的订阅价格和 API 价格，传送门：https://huggingface.co/spaces/philschmid/llm-pricing 以及浦语灵笔 IXC-2.5，能看懂视频，完整书写文章，自动生成网站，由上海人工智能实验室开发，使用 7B LLM 后端，具有与 GPT-4V 相当的能力，擅长网页制作和高质量文本-图像文章创作。详细内容：https://xiaohu.ai/p/10891

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

XiaoHu.AI日报

[title]XiaoHu.AI日报[heading2]7月8日🎤它由主要模型构成：SenseVoice和CosyVoice。声音克隆仅需几秒音频样本无需额外训练数据控制情绪情感、语速、音高🔗详细内容：https://xiaohu.ai/p/10954🔗项目地址：https://fun-audio-llm.github.io🔗在线演示：https://modelscope.cn/studios/iic/CosyVoice-300M🔗https://x.com/imxiaohu/status/18102397448126792715⃣💲LLM比价工具📊可以选择不同种类的模型型号💵对其订阅价格和API价格进行对比🔍选择最适合你的模型🔗传送门：https://huggingface.co/spaces/philschmid/llm-pricing🔗https://x.com/imxiaohu/status/1810316837546344648⑥🖋浦语灵笔IXC-2.5：能看懂视频，完整书写文章。自动生成网站的多模态模型。由上海人工智能实验室开发，使用7B LLM后端。与GPT-4V相当的能力。擅长网页制作和高质量文本-图像文章创作。🔗详细内容：https://xiaohu.ai/p/10891

XiaoHu.AI日报