其实这个问题你可以转换一下思路,自学python有什么合适的学习路线,基本路线里涉及到的都是需要掌握的~ 单个知识点那罗列起来可是太多了~
另外你可以考虑下你自学python的目的和方向,是单纯兴趣还是说要学了就业~ 想往人工智能方向发展还是Python+大数据开发方向~
Python的应用领域非常广泛,像网站开发,数据分析,智能问答,自动化测试,机器人,人脸识别等都有Python的应用,其次是国家正在大力推广Python的学习,小学高中大学都已经引入了python课程,在PYPL编程语言排行榜中也名列前茅,所以学习python是紧跟时代潮流,是未来职业发展不可或缺的一项职业技能。
最后就是Python语言简单易学,开发代码少,精确表达需求逻辑,33个关键词,7中基本数据类型。语法规则简单,接近自然语言。
下面是Python学习路线,可以提供下参考建议哦~
python虽然在编程语言里面相对简单,但是如果想真的学好,建议还是可以按照一个完整的学习路线图跟着去学习的,可以让你少走弯路~
系统地自学Python分为以下五个阶段:
一、Python基础阶段
掌握python脚本、python界面编程能力、数据库、基本爬虫、多线程多进程开发能力,可以胜任基本的python开发工作。知识点:
1.数据的存储:Python概述、进制以及进制转换、原码、反码、补码、第一个Python程序、终端读取与打印等。
2.运算符与表达式:关键字和标识符、算术运算符、python数据类型、赋值运算符、运算符、复合运算符、条件控制语句(if…else…)、逻辑运算符等。
3.循环:循环语句之while、循环语句之for、break与continue语句等。
4.基础数据结构:Number与数学函数操作、String(查找,替换,下标索引、列表(常用)、元祖、字典(常用)、set集合、迭代器与生成器(常用)、函数概述等。
5.函数:函数的调用、简单函数的定义、函数的返回值、传递参数、关键字参数、默认参数、不定长参数、匿名函数、装饰器、偏函数、回调函数、变量的作用域、递归函数、目录遍历、递归遍历目录、栈模拟递归遍历目录(深度遍历)、队列模拟递归遍历目录(广度遍历)等。
6.模块:模块概述使用标准库中的模块使用自定义模块name属性包的概述安装第三方模块virtualenv与时间相关模块。
7.面向对象编程:面向对象思想、类与对象、类的方法与属性、构造函数与析构函数、self的使用、重写__ repr__ 与__str__ 函数、访问限制等。
8.继承、封装、多态 :单继承的实现、多继承的实现、函数重写、人开枪射击子弹小案例、多态、对象属性与类属性、类方法与静态方法等。
9.面向对象高阶:动态添加属性方法、property、运算符重载、发邮件与发短信等。
10.文件操作与异常处理:StringIO与BytesIO、文件的管理操作、文件读写(csv、txt)操作、异常处理等。
11.高阶函数与测试:调试(打印、断言、logging、pdb)
12.排列组合与正则表达:破解密码(排列、组合、排列组合)、正则表达等。
13.网络编程:TCP/IP简介、TCP编程、UDP编程等。
二、Linux和数据库阶段
掌握Linux操作系统管理技术,可以搭建几乎所有Linux环境服务器。知识点:
1.Linux操作系统:常见操作系统、操作系统发展历史、系统的使用、Linux版本、Linux应用领域、虚拟机与Vmware的安装、Linux版本与Ubuntu 16.04、配置自己的Linux系统、编程IDE的安装、apt-get安装软件包。
2.文件系统与用户管理:目录访问、文件与目录的管理、文件的权限、用户管理。
3.文本操作命令:文本命令、文本编辑器Vi/Vim。
4.网路命令、进程管理与服务配置:网络管理命令、系统目录、重要系统文件、设置开机启动与登陆启动、IP配置、服务的启动停止、防火墙配置。
5.Shell编程与bash、源文件编译:基础IO操作、流程控制、定义变量与环境变量、脚本传参、定时任务、定时系统操作。
6.版本控制:Git的安装与配置、GitHub的注册与使用、Clone与Fork、Git常用命令、标签、分支与源、多人协作开发。
7.MySQL基本使用:MySQL的安装、MySQL简介、MySQL基本命令脚本、MySQL与Python的交互。
8.MongoDB的基本使用:MongoDB安装、MongoDB的基本操作。
9.Redis的基本使用:Redis安装、Redis的基本操作、Redis的数据类型、Redis的备份与恢复。
三、Python web开发
掌握Python后端框架,解决前后端Web开发问题,知识点:
1.HelloDjango:BS/CS,MVC/MTV、Django请求流程、Admin管理。
2.Models:ORM、模型字段属性、CRUD、聚合函数,F,Q对象。
3.Models&Templates:模型对应关系、模板加载、静态资源、模板语法。
4.Views:路由规则、反向解析、请求与响应、会话技术cookie,token,ses-sion、文件上传。
5.Advanced:验证码、分页器、类视图、中间件、日志、缓存、信号、Cerlery、用户权限,用户角色。
6.RESTful:REST概念、HelloREST、数据序列化、请求与响应、视图,转换器、关系,超链接、认证和权限。
四、Python爬虫阶段
掌握分布式多线程大型爬虫技术,能开发企业级爬虫程序。
1.多线程原理:同步与异步、串联与并发、线程、开辟一个线程、线程安全与线程锁、多线程队列。
2.协程:线程的局限、协程的定义与原理、协程的实现。
3.爬虫的概念及相关工具:爬虫的概念及作用、HTTP协议原理、工具的安装、使用。
4.Python http libs:urllib的使用、示例requests库的使用、bs4库的使用、xpath语法。
5.爬虫实战:使用requests编写-个简单爬虫、改造requests爬虫为多线程版、利用redis改造多线程版爬虫至分布式。
6.scrapy框架:scrapy安装、创建项目、创建spider文件,编写parse方法、scrapy子命令、运行scrapy爬虫程序、命令行传递参数、进一步解析二级页面、parse方法之前传递参数、导出json、Csv格式的数据、scrapy爬虫的状态保存、item的定义、item的使用、pipeline的使用、使用pipeline将items存储至MySQ、Lscrapy整体架构、downloadermiddleware、使用downloadermiddleware实现IP代理池、spidermiddleware、scrapy插件、scrapy-redis。
7.量化交易:自动化交易理论、Python量化交易框架。
五、Python机器学习阶段
掌握Python数据挖掘分析,入门人工智能。知识点:
1.jupyter入门:jupyter软件安装、jupyter入门、numpy学习。
2.pandas:pandas入门、pandas-Series、pandas数据丢失、pandas索引、pandas数据处理、基于Pandas的人脸识别技术。
3.scipy:scipy学习
4.matpoltlib:数据可视化的概念、可视化图表的绘制、动画及交互渲染、数据的合并与分组。
5.KNN:临近算法、预处理、KNN相关函数。
6.线性回归与逻辑斯蒂回归:线性回归、逻辑斯蒂回归。
7.决策树与贝叶斯:贝叶斯学习、决策树学习。
8.SVM与K均值聚类:SVC学习
9.Kmeans: Kmeans学习
10.机器学习框架TensorFlow:机器学习、权重分配与优选方案、深度学习、自动化神经网络、AI网络的描述。
11.自然语言处理与社交网络处理:文本数据处理、自然语言处理及NLTK、主题模型、LDA、图论简介、网络的操作及数据可视化。
国外Python的使用率非常高,但在国内Python是近几年才火起来,Python正处于高速上升期市场对于Python开发人才的需求量急剧增加,学习Python的前景比较好。
Python+大数据开发学习路线
猎聘大数据研究院发布了《2022未来人才就业趋势报告》
从排名来看,2022年1-4月各行业中高端人才平均年薪来看,人工智能行业中高端人才平均年薪最高,为31.04万元;金融行业中高端人才以27.69万元的平均年薪位居第二;通信、大数据行业中高端人才平均年薪分别为27.51万元、25.23万元,位列第三、第四;IT/互联网行业中高端人才平均年薪23.02万元,位列第七。
图表来源:《2022未来人才就业趋势报告》
如果你觉得很高,被平均了这样?那么打开Boss直聘,搜大数据工程师:
我们来做下数据分析:
薪资那一列都有一个最低薪资和最高薪资,我们通过不同城市来对比分析一下,发现北京的工资水平最高,最低为22k,最高为38k。
工作年限也是一个制约工资水平的很大因素,从图中可以看出,即使是刚毕业,也能达到一个11-20k的薪资范围。
而学历要求来说,大部分为本科,其次为大专和硕士,其他比较少,以至于在图中并没有显示出来。
企业对不同岗位的要求以3-5年的居多,企业当然是需要有一定工作经验的员工,但是在实际招聘中,如果你有项目经验,且理论知识没问题,企业也会放宽条件。
分析不同行业, 我们发现,大数据岗位需求分布在各行各业,主要还是在计算机软件和互联网最多,也有可能是这个招聘软件决定的,毕竟Boss直聘还是以互联网行业为主。
来看看哪些公司在招聘大数据相关岗位,从这个超过15的数量来看,华为,腾讯,阿里,字节,这些大厂对这个岗位的需求量还是很大的。
那么这些岗位都需要什么技能呢?Spark,Hadoop,数据仓库,Python,SQL,Mapreduce,Hbase等等
根据国内的发展形势,大数据未来的发展前景会非常好。自 2018 年企业纷纷开始数字化转型,一二线城市对大数据领域的人才需求非常强烈,未来几年,三四线城市的人才需求也会大增。
在大数据领域,国内发展的比较晚,从 2016 年开始,仅有 200 多所大学开设了大数据相关的专业,也就是说 2020 年第一批毕业生才刚刚步入社会,我国市场环境处于急需大数据人才但人才不足的阶段,所以未来大数据领域会有很多的就业机遇。
薪资高、缺口大,自然成为职场人的“薪”选择!
任何学习过程都需要一个科学合理的学习路线,才能够有条不紊的完成我们的学习目标。Python+大数据所需学习的内容纷繁复杂,难度较大,为大家整理了一个全面的Python+大数据学习路线图,帮大家理清思路,攻破难关!
Python+大数据学习路线图详细介绍
学前导读:从传统关系型数据库入手,掌握数据迁移工具、BI数据可视化工具、SQL,对后续学习打下坚实基础。
1.大数据数据开发基础MySQL8.0从入门到精通
MySQL是整个IT基础课程,SQL贯穿整个IT人生,俗话说,SQL写的好,工作随便找。本课程从零到高阶全面讲解MySQL8.0,学习本课程之后可以具备基本开发所需的SQL水平。
2022最新MySQL知识精讲+mysql实战案例_零基础mysql数据库入门到高级全套教程
学前导读:学习Linux、Hadoop、Hive,掌握大数据基础技术。
2022版大数据Hadoop入门教程
Hadoop离线是大数据生态圈的核心与基石,是整个大数据开发的入门,是为后期的Spark、Flink打下坚实基础的课程。掌握课程三部分内容:Linux、Hadoop、Hive,就可以独立的基于数据仓库实现离线数据分析的可视化报表开发。
2022最新大数据Hadoop入门视频教程,最适合零基础自学的大数据Hadoop教程
学前导读:本阶段课程以真实项目为驱动,学习离线数仓技术。
数据离线数据仓库,企业级在线教育项目实战(Hive数仓项目完整流程)
本课程会、建立集团数据仓库,统一集团数据中心,把分散的业务数据集中存储和处理 ;目从需求调研、设计、版本控制、研发、测试到落地上线,涵盖了项目的完整工序 ;掘分析海量用户行为数据,定制多维数据集合,形成数据集市,供各个场景主题使用。
大数据项目实战教程_大数据企业级离线数据仓库,在线教育项目实战(Hive数仓项目完整流程)
学前导读:Spark官方已经在自己首页中将Python作为第一语言,在3.2版本的更新中,高亮提示内置捆绑Pandas;课程完全顺应技术社区和招聘岗位需求的趋势,全网首家加入Python on Spark的内容。
1.python入门到精通(19天全)
python基础学习课程,从搭建环境。判断语句,再到基础的数据类型,之后对函数进行学习掌握,熟悉文件操作,初步构建面向对象的编程思想,最后以一个案例带领同学进入python的编程殿堂。
全套Python教程_Python基础入门视频教程,零基础小白自学Python必备教程
2.python编程进阶从零到搭建网站
学完本课程会掌握Python高级语法、多任务编程以及网络编程。
Python高级语法进阶教程_python多任务及网络编程,从零搭建网站全套教程
3.spark3.2从基础到精通
Spark是大数据体系的明星产品,是一款高性能的分布式内存迭代计算框架,可以处理海量规模的数据。本课程基于Python语言学习Spark3.2开发,课程的讲解注重理论联系实际,高效快捷,深入浅出,让初学者也能快速掌握。让有经验的工程师也能有所收获。
Spark全套视频教程,大数据spark3.2从基础到精通,全网首套基于Python语言的spark教程
4.大数据Hive+Spark离线数仓工业项目实战
通过大数据技术架构,解决工业物联网制造行业的数据存储和分析、可视化、个性化推荐问题。一站制造项目主要基于Hive数仓分层来存储各个业务指标数据,基于sparkSQL做数据分析。核心业务涉及运营商、呼叫中心、工单、油站、仓储物料。