VoxCPM OpenBMB
OpenBMB VoxCPM
¶
VoxCPM 是一款基于 MiniCPM-4 的无分词器端到端文本转语音(TTS)系统,采用扩散自回归架构直接在连续空间生成语音表示。核心功能涵盖上下文感知的表达性语音生成与真切的零样本语音克隆,支持流式合成且实时因子低至 0.17。项目提供 VoxCPM1.5 和 VoxCPM-0.5B 版本,主要支持中文和英文,支持通过全参数微调(SFT)或 LoRA 进行个性化定制。系统提供 Python 库、命令行工具、Web 演示及微调指南,代码与模型权重基于 Apache-2.0 协议开源。