mlx audio Blaizzy
Blaizzy mlx-audio
¶
MLX-Audio 是基于 Apple MLX 框架的音频处理库,专为 Apple Silicon(M 系列芯片)优化,提供高效的文本转语音 (TTS)、语音转文本 (STT) 及音频处理功能。支持多语言模型(如 Kokoro、Whisper、Qwen 系列),具备声音克隆、定制及语速控制能力。提供命令行工具、Python API、Web 界面和 OpenAI 兼容的 REST API,支持模型量化与 iOS/macOS Swift 集成,并涵盖语音活动检测、说话人分离、源分离及音频增强等扩展功能。