OpenAvatarChat
样的
项目核心内容总结:
OpenAvatarChat 是一个集成了语音识别、语言模型、文本到语音、数字人生成等功能的开源项目,支持多模态交互。用户可以通过配置文件自定义模型参数,包括语音识别(ASR)、语言模型(LLM)、文本到语音(TTS)以及数字人生成(LiteAvatar)等模块。项目支持 Gradio 界面运行,可通过命令行指定配置文件启动服务。用户还可以通过 Docker 或脚本安装 Coturn 服务,以支持实时音视频通信。项目提供了多种模型的配置选项,并支持通过一键安装包进行快速部署。主要特性包括多模型支持、灵活配置、支持实时通信、提供一键安装包等。
使用方法:
- 克隆项目并安装依赖;
- 通过配置文件设置模型路径、参数等;
- 启动服务,可使用 Gradio 界面进行交互;
- 可选:使用一键安装包(B站、夸克网盘等)快速部署。
主要特性:
- 支持多模态交互(语音、文本、视频);
- 提供多种模型配置(如 MiniCPM、CosyVoice、LiteAvatar 等);
- 支持 HTTPS 通信和 Coturn 服务配置;
- 提供一键安装包,便于快速部署;
- 可通过配置文件灵活调整参数(如帧率、模型名称、语音阈值等);
- 支持多种模型的本地或远程调用(如百炼 API、阿里云等)。