以下是一些关于 AI 相关技术的开源代码应用:
|技术名称|应用场景|技术类型|简介|主要特点|工作原理|其他|官方网站|项目及演示|论文|Github|在线体验|附件|最后更新时间|<br>|-|-|-|-|-|-|-|-|-|-|-|-|-|-|<br>|VALL-EX:一个开源的多语言文本到语音合成与语音克隆模型。|这个和19年百度地图发布的语音定制功能使用的meitron模型很像。这个功能现在依然在百度地图提供的功能里,用户只需在百度地图App上录制20句话、20分钟左右即可生成个人完整语音包。|语音|该模型支持多种语言(英语、中文和日语)和零样本语音克隆,你只需要提供一个人短短几秒钟的录音(3-10秒),就能模仿出那个人的声音。此外,它还具有语音情感控制和口音控制等高级功能。<br><br>同时相对于其他模型,它更轻量、更快速...<br><br>VALL-EX最初由微软发布。但并未发布任何代码或预训练模型。作者认识到了这项技术的潜力和价值,复现并训练了一个开源可用的VALL-E X模型。|VALL-E X模型具有以下显著的功能特点:<br>1.多语言TTS(文本到语音合成):支持英语、中文和日语,能进行自然和富有表现力的语音合成。
关于AI生成CAD(计算机辅助设计)图的相关资料,您可以参考以下几个方面:1.学术论文:搜索相关的学术论文,了解AI在CAD领域的应用和研究成果。可以通过Google Scholar、IEEE Xplore、ScienceDirect等学术数据库进行搜索。1.专业书籍:查找与AI在CAD领域相关的专业书籍,了解AI在CAD设计中的应用和案例。1.在线课程和教程:参加相关的在线课程,如Coursera、edX、Udacity等平台上的AI和CAD相关课程。查找YouTube等视频平台上的教程和演示视频,了解AI在CAD设计中的应用。1.技术论坛和社区:加入相关的技术论坛和社区,如Stack Overflow、Reddit的r/AI和r/CAD等,与其他专业人士交流和学习。关注AI和CAD相关的博客和新闻网站,了解最新的技术动态和应用案例。1.开源项目和代码库:探索GitHub等开源平台上的AI和CAD相关项目,了解AI在CAD设计中的应用和实现。例如,OpenAI的GPT-3、AutoGPT等AI模型在CAD设计中的应用。1.企业案例研究:研究AI在CAD领域应用的企业案例,了解AI技术在实际项目中的应用和效果。例如,Autodesk、Siemens等公司在AI在CAD设计中的应用。
[[Paper](https://fun-audio-llm.github.io/pdf/FunAudioLLM.pdf)][[Code](https://github.com/FunAudioLLM)][Modelscope:[SenseVoice](https://www.modelscope.cn/studios/iic/SenseVoice)[CosyVoice](https://www.modelscope.cn/studios/iic/CosyVoice-300M)][HuggingFace:[SenseVoice](https://huggingface.co/FunAudioLLM/SenseVoiceSmall)CosyVoice]Tongyi SpeechTeamAlibaba GroupAbstract:This report introduces FunAudioLLM,a framework designed to enhance natural voice interactions between humans and large language models(LLMs).At its core are two innovative models:SenseVoice for high-precision multilingual speech recognition,emotion recognition,and audio event detection; and CosyVoice for natural speech generation with multi-language,timbre,and emotion control.SenseVoice delivers exceptionally low latency and supports over 50 languages,while CosyVoice excels in multi-lingual voice generation,zero-shot voice generation,cross-lingual voice cloning,and instruction-following capabilities.The models related to SenseVoice and CosyVoice have been open-sourced on Modelscope and Huggingface,along with the corresponding training,inference,and fine-tuning codes released on GitHub.By integrating these models with LLMs,FunAudioLLM enables applications such as speech translation,emotional voice chat,interactive podcasts,and expressive audiobook narration,thereby pushing the boundaries of voice interaction technology.ContentsApplicationsSpeech-to-Speech TranslationEmotional VoiceChatInteractive PodCastExpressive AudiobookVoice Generation Model:CosyVoiceOverview of CosyVoiceMulti-lingual Voice GenerationZero-shot In-context GenerationInstructed Voice GenerationEmotionally Expressive Voice GenerationSpeaker Fine-tuneSpeaker InterpolationDemoVoice Understanding Model:SenseVoiceOverview of SenseVoiceMultilingual Speech RecognitionSpeech Emotion RecognitionAudio Event DetectionRich Transcribe Demo Samples