对标 GPT-4o 的开源实时语音多模态模型：Moshi

59 阅读 0 评论 0 点赞

是由法国的 AI 实验室 Kyutai 推出的实时语音多模态模型，支持听、说、看，最关键的是你现在就可以在浏览器中使用，如果这个链接延迟高，可以试试这个, 无需输入邮箱，点击 Join queue 即可。

简单体验了下，比较笨笨的，延迟很低，可以随时打断，如果你一直不说话还会主动找你，很接近 GPT-4o 了！非常期待后续的开源。

本站资源均来自互联网，仅供研究学习，禁止违法使用和商用，产生法律纠纷本站概不负责！如果侵犯了您的权益请与我们联系！

转载请注明出处：免费源码网-免费的源码资源网站 » 对标 GPT-4o 的开源实时语音多模态模型：Moshi

点赞(0) 打赏

本文分类：文章资讯
本文标签：对标 GPT-4o 的开源实时语音多模态模型：Moshi
浏览次数：59 次浏览
本文链接：https://freeymw.com/article/16283.html

上一篇 > 全网视频下载之IDM下载安装，软破解
下一篇 > mmdetection3D指定版本安装指南

评论列表共有 0 条评论

暂无评论

发表评论取消回复

微信公众账号

微信扫一扫加关注

发表
评论返回
顶部