Chat with Wiki - 文字转语音

Answer

以下是关于文字转语音的相关信息：

Hedra：

Hedra.com 放出了基础模型 Character-1 的研究预览版，即日起在 http://hedra.com（桌面和移动）上提供。
具有无限期（打开预览为 30 秒）、每 60 秒产生 90 个（如果 H100 的供应保持不变）、富有表现力的说话、唱歌、说唱角色等特点。
其使命是建立一个人人都能使用的多模态创作工作室。
操作教程：可以直接文字转语音，目前有 6 个语音，也可以直接上传音频。

《神谕》：

为了提升交互体验，ChatGPT 返回的中文文字通过 TTS 服务选择合适的声音播放出来。
内部自研的 TTS 及代码平台可将游戏开发者输入的文本直接转成语音。

Content generated by AI large model, please carefully verify (powered by aily)

References

工具教程：Hedra

hedra.com放出了基础模型Character-1的研究预览版。即日起在http://hedra.com（桌面和移动）上提供。*无限期（打开预览为30秒）*每60秒产生90个（如果H100的供应保持不变）*富有表现力的说话、唱歌、说唱角色Hedra的使命是建立一个人人都能使用的多模态创作工作室，让创作者完全控制情感对话、动作和（是的）整个世界，这是Hedra迈出的第一步。[41997_1718734567.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/GiakbqPTWobAnAx0yiMcb6aindf?allow_redirect=1)作者说：关于图像比例问题，之后我们就支持多比例了，目前还是关注在人脸的区域，所以锁定了1:1，后续会支持不同分辨率输入，以及整个人体。我们目前对用户的输入crop并没有限制的特别死，但是人脸占比越大效果越清晰，越好。而且目前是一个快速版，主打生成速度更快，90s能够生成60s视频（H100）；之后也会提供更高质量的版本[heading2]操作教程[content]可以直接文字转语音，目前有6个语音也可以直接上传音频

工具教程：Hedra

声控游戏？用对话开启你和机器人的神奇旅程——《神谕》

使用文字输入还是太过繁琐，语音会让输入门槛大幅度降低。这里使用的是GVoice提供的语音录制和识别能力，中文识别率还是非常优秀的。注：语音识别的少量错误，可以被chatgpt正常理解和纠错，所以衔接还是比较流畅的。[heading3]2.3文字转语音（TTS）[content]ChatGPT返回的中文文字，为了提升交互体验，也通过TTS服务，选择合适的声音播放出来。这里我们选择内部自研的TTS以及代码平台，有机会公开的话可以分享给大家~功能简述：让游戏开发者把文本直接转成语音[heading3]2.4 AIGC MidJourney生成机器人从小到大成长的图片[content]Ai色彩关键帧通过Midjourney来生成需要的场景基础图。基于更大的库，mj的方案迭代更加高效，在已有设计的基础上能快速的融合风格和内容通过文本描述，快速生成需要的场景内容，迭代出需要的方案最终方案在ps里做微调所有关键帧完成后在sd里面，统一美术风格[heading3]2.5灵感小助手生成表情icon[content]使用ChatGPT生成lua代码控制机器人在关卡中的行为使用MidJourney、Clipdrop绘制制作表情