以下为您介绍一些情感丰富音频 AI 模型:
[title]阿里云最新开源模型——FunAudioLLM[heading2]Emotionally Expressive Voice Generation|Emotion|Generated 1|Generated 2|<br>|-|-|-|<br>|Neutral|<br>我是通义实验室语音团队全新推出的生成式语音大模型,提供舒适自然的语音合成能力。|<br>西红柿炒鸡蛋是一道简单又经典的家常菜。|<br>|Sad|<br>等你熬过那些孤独无助的时刻,你才会发现,原来自己并没有想象中那么脆弱。原来一个人,也可以活成千军万马的模样。|<br>我可以安慰很多人,但就是不能安慰自己那颗千疮百孔的心。总有一些人会慢慢淡出你的生活。你要学会接受,而不是怀念。有些事。不管我们如何努力,回不去就是回不去了。我们漫长的岁月中有太多的过客,有太多的无奈。|<br>|Happy|<br>小丽抿着嘴,弓着腰,蹑手蹑脚地,一步一步慢慢地靠近它。靠近了,靠近了,又见她悄悄地将右手伸向蝴蝶,张开的两个手指一合,夹住了粉蝶的翅膀。小丽高兴得又蹦又跳。|<br>除夕晚上,儿子孙子都来到她身边,她满脸皱纹都舒展开了,就像盛开的菊花瓣,每根皱纹里都洋溢着笑意。|
[title]XiaoHu.AI日报[heading2]7月8日🎤它由主要模型构成:SenseVoice和CosyVoice。声音克隆仅需几秒音频样本无需额外训练数据控制情绪情感、语速、音高🔗详细内容:https://xiaohu.ai/p/10954🔗项目地址:https://fun-audio-llm.github.io🔗在线演示:https://modelscope.cn/studios/iic/CosyVoice-300M🔗https://x.com/imxiaohu/status/18102397448126792715⃣💲LLM比价工具📊可以选择不同种类的模型型号💵对其订阅价格和API价格进行对比🔍选择最适合你的模型🔗传送门:https://huggingface.co/spaces/philschmid/llm-pricing🔗https://x.com/imxiaohu/status/1810316837546344648⑥🖋浦语灵笔IXC-2.5:能看懂视频,完整书写文章。自动生成网站的多模态模型。由上海人工智能实验室开发,使用7B LLM后端。与GPT-4V相当的能力。擅长网页制作和高质量文本-图像文章创作。🔗详细内容:https://xiaohu.ai/p/10891
[title]XiaoHu.AI日报[heading2]7月8日🎤它由主要模型构成:SenseVoice和CosyVoice。声音克隆仅需几秒音频样本无需额外训练数据控制情绪情感、语速、音高🔗详细内容:https://xiaohu.ai/p/10954🔗项目地址:https://fun-audio-llm.github.io🔗在线演示:https://modelscope.cn/studios/iic/CosyVoice-300M🔗https://x.com/imxiaohu/status/18102397448126792715⃣💲LLM比价工具📊可以选择不同种类的模型型号💵对其订阅价格和API价格进行对比🔍选择最适合你的模型🔗传送门:https://huggingface.co/spaces/philschmid/llm-pricing🔗https://x.com/imxiaohu/status/1810316837546344648⑥🖋浦语灵笔IXC-2.5:能看懂视频,完整书写文章。自动生成网站的多模态模型。由上海人工智能实验室开发,使用7B LLM后端。与GPT-4V相当的能力。擅长网页制作和高质量文本-图像文章创作。🔗详细内容:https://xiaohu.ai/p/10891