Introduction
1.
爬虫概述
2.
python 语法基础
3.
正则表达式与文件操作
3.1.
实验:采集贴吧信息
4.
简单的网页爬虫开发
4.1.
实验:抓取小说动物农场
4.2.
实验:抓取小说偶尔远行
5.
快速解析 HTML
5.1.
实验:抓取大麦网爬虫
5.2.
实验:抓取许嵩相关帖子
5.3.
实验:抓取全职高手的帖子
6.
MongoDB 与 Redis
6.1.
实验:抓取小说白夜行的正文内容
7.
异步加载与请求头
7.1.
实验:抓取乐视网视频评论信息
8.
综合实验
8.1.
使用 Fiddler 抓取微信饿了么小程序数据
Published with GitBook
《Python 爬虫开发:从入门到实战》读书笔记
爬虫概述
一、爬虫能做什么?
抓取数据
网络小说
价格变动
尽职调查
抓取公司或人在网络上的痕迹
刷流量和秒杀
刷流量:增加访问量
秒杀
抢优惠券
抢机票
抢火车票
二、爬虫技术
技术:各种语言和框架的使用
思想、流程和调度
如何突破反爬虫
如何隐藏爬虫
如何模拟人的行为
遇到没有见过的反爬虫策略如何思考
使用爬虫爬取非网页内容