跳转至

CrawlerTutorial NanmiCoder

NanmiCoder CrawlerTutorial GitHub Repo stars

本项目是一个网络爬虫技术教程仓库,提供从入门到进阶的系统化学习资源。

核心内容: 1. 入门基础:涵盖爬虫原理、抓包工具、Python 网络请求库、静态与动态数据提取、数据存储及高效实现。 2. 进阶实战:包括工程化开发规范、反爬虫对抗(请求伪装、代理 IP)、Playwright 浏览器自动化、登录认证(Cookie/Session/扫码/短信)、验证码处理、数据清洗与可视化。 3. 配套资源:提供在线文档链接及 B 站视频合集。

免责声明: 内容仅供学习与研究,禁止用于商业或非法用途。