跳转至

Firecrawl mendableai

mendableai firecrawl GitHub Repo stars

Firecrawl 是一个将网站转换为 LLM 就绪数据的 API 服务,旨在为 AI 代理和应用提供实时网络上下文。其核心功能包括:

  • 网页抓取:支持将 URL 转换为 Markdown、HTML、结构化 JSON 或截图。
  • 搜索:全网搜索并获取结果页面的完整内容。
  • AI Agent:根据自然语言提示自动导航并提取数据。
  • 全站爬取:单次请求即可爬取整个网站的所有页面。
  • 链接发现:快速发现网站内的所有 URL。
  • 高级交互:支持在提取前执行点击、滚动、输入等页面操作。
  • 批量处理:支持异步批量处理大量 URL。
  • 媒体解析:自动从 PDF、DOCX 和图片中提取文本。

项目提供 Python、Node.js 等 SDK 及 MCP 支持,兼容多种集成平台,提供开源自托管及云服务选项。