最近经常有小伙伴咨询,爬虫到底该怎么学,有什么爬虫学习路线可以参考下,萝卜作为非专业爬虫爱好者,今天咱们就来分享下,对于我们平时的基础爬虫或者小规模爬虫,应该掌握哪些技能、需要如何学起!
学习路线大纲
Python 基础
由于本篇主要介绍 Python 爬虫学习路线,所以对于 Python 基础知识,仅仅提取了最为基础的部分,应付基础爬虫完全够用了,当然,对于底层基础,肯定是掌握的越多、越牢固越好~
数据采集与解析
多种采集方式
-
-
-
Selenium
-
-
元素选择 - (id,css,class,xpath)
-
-
-
-
存储知识
中间人代理
爬虫框架
-
Scrapy
-
-
-
-
分布式爬虫 - (scrapy-redis 使用,scrapy-redis 调度器)
-
-
-
反爬虫知识
-
-
-
-
特征识别型
-
访问频率限制 - (IP 代理池,搭建个人 IP 代理池)
-
Selenium 特征检测 - 隐藏 Selenium 特征
-
-
多终端爬虫
以上就是整理的基础爬虫所需的学习路线,当然鉴于个人水平有限,难免有不足之处,还望不吝指教!
下面分享一些免费好用的学习资料,大家自选
视频
-
2020年Python爬虫全套课程(学完可做项目)
-
https://www.bilibili.com/video/BV1Yh411o7Sz
-
Python爬虫编程基础5天速成(2021全新合集)Python入门+数据分析
-
https://www.bilibili.com/video/BV12E411A7ZQ
-
2021年最新Python爬虫教程+实战项目案例(最新录制)
-
https://www.bilibili.com/video/BV1i54y1h75W
网盘资料
-
《Python 网络爬虫实战》
-
https://pan.baidu.com/s/1ZZ1G047X_gsd3Gq7boHKcw 提取码: h5fx
-
《Python 网络数据采集》
-
链接: https://pan.baidu.com/s/1yMguYZ61GaXcadYQ9_FpQA 提取码: vq8y
-
Python 分布式爬虫
-
链接: https://pan.baidu.com/s/1EY_n6FTnzkA7ahHstUp2oQ 提取码: 73s8
在线网站
-
廖雪峰官网 Python教程
-
https://www.liaoxuefeng.com/wiki/1016959663602400
-
相关法律法规
基本上做到以上几点,我们的爬虫就是安全的,不要过度妖魔化爬虫,当然网络更不是法外之地,要做一个合格的遵纪守法好公民!
尾声
以上就是萝卜断断续续写了几天,结合个人经验,同时也参考了网上大量的视频、文章总结而成的 Python 爬虫学习路线,确实非常的不容易,如果大家觉得满意请务必点个赞 + 在看 支持下。
公众号后台回复【爬虫路线】可以获取学习大纲思维导图原图
本文由 mdnice 多平台发布