gpt-load
GPT-Load 核心内容总结
Section titled “GPT-Load 核心内容总结”GPT-Load 是一个高性能、企业级的 AI API 透明代理服务,专为企业和开发者设计,用于集成多个 AI 服务。该项目使用 Go 语言编写,具备智能密钥管理、负载均衡、全面监控等功能,适用于高并发生产环境。
- 透明代理:完全保留原生 API 格式,支持 OpenAI、Google Gemini、Anthropic Claude 等多种格式。
- 智能密钥管理:高性能密钥池,支持按组管理、自动轮换、失败恢复。
- 负载均衡:支持多上游端点的加权负载均衡,提高服务可用性。
- 智能失败处理:自动密钥黑名单管理和恢复机制,确保服务连续性。
- 动态配置:系统设置和组配置支持热加载,无需重启。
- 企业架构:支持分布式主从部署,水平扩展和高可用。
- 现代管理界面:基于 Vue 3 的 Web 管理界面,直观易用。
- 全面监控:实时统计、健康检查和详细请求日志。
- 高性能设计:零拷贝流式处理、连接池复用、原子操作。
- 生产就绪:优雅关闭、错误恢复和全面安全机制。
- 双重认证:管理端和代理端的独立认证,代理认证支持全局和组级密钥。
支持的 AI 服务
Section titled “支持的 AI 服务”- OpenAI 格式:官方 OpenAI API、Azure OpenAI 等兼容服务。
- Google Gemini 格式:Gemini Pro、Gemini Pro Vision 等模型。
- Anthropic Claude 格式:Claude 系列模型。
-
Docker 快速启动
使用 Docker 镜像快速部署,支持环境变量配置密钥和数据存储路径。 -
Docker Compose(推荐)
提供完整的.env配置文件,支持 SQLite、MySQL、PostgreSQL 和 Redis,推荐用于生产部署。 -
源码构建
要求本地安装数据库和 Redis(可选),通过go mod安装依赖,运行服务。 -
集群部署
支持多节点部署,所有节点连接统一的数据库和 Redis,推荐使用 MySQL/PostgreSQL 和 Redis 集群。
- 静态配置:通过环境变量设置,如数据库连接、端口、认证密钥等,需重启生效。
- 动态配置:通过数据库配置,支持热加载,无需重启服务,优先级为:组配置 > 系统设置 > 环境配置。
数据加密迁移
Section titled “数据加密迁移”- 支持 API 密钥的加密存储,可随时启用、禁用或更换加密密钥。
- 提供 Docker Compose 和源码部署的迁移命令,操作前需备份数据库,防止数据丢失。
Web 管理界面
Section titled “Web 管理界面”- 提供实时统计、密钥管理、请求日志、系统设置等功能。
- 支持创建 AI 服务组、添加和管理 API 密钥、查看请求历史等。
API 使用指南
Section titled “API 使用指南”- 通过组名路由请求到不同 AI 服务。
- 代理接口格式为:
http://localhost:3001/proxy/{group_name}/{original_api_path}。 - 支持 OpenAI、Gemini、Anthropic 等接口示例,只需替换原始地址和密钥为代理地址和代理密钥即可使用。
- New API:优秀的 AI 模型聚合管理与分发系统。
- MIT 协议,详情见 LICENSE 文件。