rogue
项目核心内容总结:
功能:
Rogue 是一个用于评估 AI 代理(如聊天机器人)性能、合规性和安全性的工具,支持通过预设场景测试代理的政策遵循能力,并生成评估报告。支持多种模型(如 OpenAI、Gemini、Anthropic)和协议(A2A、MCP)。
使用方法:
- 安装:通过
uv sync或pip install安装依赖。 - 运行模式:
- TUI/WebUI 模式:通过命令
uvx rogue-ai启动,配置代理地址、LLM 模型等参数,实时观察测试过程。 - CLI 模式:非交互式自动化测试,需指定代理地址、场景文件、LLM 模型、业务背景等参数,适合 CI/CD 流程。
- TUI/WebUI 模式:通过命令
- 配置文件:支持通过 JSON 文件配置参数,覆盖 CLI 参数默认值。
主要特性:
- 动态生成测试场景:基于用户提供的业务背景自动生成测试用例。
- 实时交互监控:TUI/WebUI 中可观看评估代理与目标代理的对话过程。
- 详细报告生成:评估结束后生成 Markdown 格式报告,包含通过率、问题分析和建议。
- 多协议兼容:支持 A2A(基于 HTTP 的代理协议)和 MCP(基于消息的代理协议)。
- 自动化测试:CLI 模式适合集成到自动化测试流程中。
许可证:
项目开源,禁止商业销售。如需商业使用,需联系 admin@qualifire.ai。