-
网站介绍: Moshi 是由法国人工智能研究实验室 Kyutai 开发的端到端实时音频多模态 AI 模型,具备听、说、看的能力,能够模拟多达 70 种情绪和风格进行交流。 (openi.cn)
-
核心功能:
- 支持多模态交互,处理和生成文本、语音和视觉信息。
- 模拟多达 70 种情绪和风格,提供生动真实的对话体验。
- 具备低延迟特性,快速响应用户输入,适用于实时反馈场景。
- 支持本地设备运行,保护用户隐私。
- 开源项目,代码、模型权重和技术论文将免费共享,供全球用户研究和开发。 (openi.cn)
-
如何使用:
- 访问 Moshi 的官方网站。
- 提供您的电子邮件地址,点击“Join queue”以免费开始使用。
- 确保您的设备(手机或电脑)配备麦克风和扬声器。
- 与 Moshi 进行语音互动,系统会提示您使用麦克风进行语音输入。
- 对着麦克风提出问题或指令,Moshi 将理解并生成相应的语音回答。 (openi.cn)
-
联系方式: 未直接提供,建议访问 Moshi 的官方网站获取更多信息。
-
社交媒体: 未直接提供,建议访问 Moshi 的官方网站获取更多信息。
-
公司背景: Kyutai 是法国的人工智能研究实验室,专注于开发先进的 AI 模型和技术。 (openi.cn)
订阅邮件
加入社区
订阅我们的频道和更新