开源AI语音处理工具包,支持语音增强、分离和目标说话人提取。
高效、多语种的语音合成模型
实时浏览器端语音识别应用
开源、注重隐私的语音助手
自动语音识别工具,提供词级时间戳和说话人识别
AI语音代理测试与可观测性平台
Soro是将会议语音自动转文字的AI会议记录助手。
MiniCPM-o 2.6是一个强大的多模态大型语言模型,适用于视觉、语音和多模态直播。
通过语音触发Zapier自动化流程。