Whisper openai
openai whisper
¶
Whisper 是 OpenAI 开发的通用语音识别模型,基于 Transformer 序列到序列架构。它支持多语言语音识别、语音翻译和语言识别功能。项目提供六种不同尺寸的模型(含英文专用版及 Turbo 版),可在速度与精度之间进行权衡。支持通过命令行工具或 Python API 进行音频转录,需依赖 PyTorch 和 ffmpeg 环境。
Whisper 是 OpenAI 开发的通用语音识别模型,基于 Transformer 序列到序列架构。它支持多语言语音识别、语音翻译和语言识别功能。项目提供六种不同尺寸的模型(含英文专用版及 Turbo 版),可在速度与精度之间进行权衡。支持通过命令行工具或 Python API 进行音频转录,需依赖 PyTorch 和 ffmpeg 环境。