跳转至

WhisperLiveKit QuentinFuxa

QuentinFuxa WhisperLiveKit GitHub Repo stars

WhisperLiveKit 是一款超低延迟、自托管的语音转文本(ASR)系统,支持说话人识别。核心功能包括实时语音转写、多语言自动检测与翻译(支持 200+ 语言)、以及实时说话人区分。项目集成了 Whisper、NLLW、Voxtral Mini 等先进模型及 Silero VAD 技术,提供 Whisper、Faster-Whisper、MLX、Voxtral 等多种推理后端。支持命令行工具、Python API 集成及内置 Web 前端,兼容 Docker、GPU 与 CPU 环境,适用于会议记录、无障碍辅助、内容创作及客服通话等场景。