前几天和一个小伙子聊天时,发现了一个问题,他从零开始学Python,学完列表、字典和函数等基础之后,就开始往爬虫方向进阶学习,结果又花了一个多月的时间,啥也没学成,反而寸步难行。
其实这个问题的主要原因还是在于Python入门知识没学好,我所说的Python入门知识指的不仅仅是列表等基础知识,还包括面向对象和进程线程等高级编程内容。
这可能是初学者不太清楚该怎么打基础,然后不巧的是所选择的学习资源就没有好好讲高级编程这一块的内容,导致了后面学起来吃力。欲速则不达,所以要往Python爬虫等方向学习的小伙伴们,我个人觉得应当先把入门知识学好。
今天给大家写了一篇关于Python高级编程这一块的教学文章,在你学完了列表等基础之后,学学这一块的内容,将会让你的进阶之路更加轻松顺畅!
先来看一下Python高级编程包括哪些东西:
面向对象是一个抽象的编程思维,很多编程语言都有的一种思想,Python是纯的面向对象的语言,简单来说可以理解为注重如何解决问题,而不是去研究底层怎么实现。
面向对象和面向过程是两种不同的思想,面向对象编程的语言有Python等语言,面向过程编程的语言有C等语言,在写代码的编程思维是不同的。
举个例子来理解这两种思想,拿洗衣服为例。
用手洗衣服一般是这么干的:找盆-放水-加洗衣粉-浸泡衣服-搓洗-拧干-冲洗-拧干-晾晒。
这是一种面向过程的思想,一旦中间哪个环节不知道怎么办,洗衣服就洗不好,比如说你不知道怎么搓洗导致衣服洗不干净,比如说搓洗完之后没有拧干直接晾晒导致一地水等等,某1个环节出错了,都达不到想要的洗衣服效果。
用洗衣机洗衣服一般是这么干的:打开洗衣机-把衣服放进去-加洗衣粉-按开始按钮-晾晒。
这是一种面向对象的思想,你不用知道把衣服放进去之后洗衣机是怎么洗的,你只要知道把衣服放进去后倒洗衣粉然后按按钮就可以了。
同样的,在编程语言当中,体现是不一样的,C语言写代码的时候你得关注着你的内存等底层东西,但Python写代码的时候我们几乎很少去关注底层的东西,注重点在于用什么方法去解决问题就可以了。
在正式涉及代码之前,有一段概念性的东西是需要理解的,理解了这些基础概念之后,我们才能更好地进入面向对象编程。
这两个概念放在一起谈可能更容易理解一些,可以简单理解为类是产生对象的模板。
上面我们说过洗衣机的例子,如果说洗衣机是对象,那么制造这种洗衣机的图纸就是类;如果说鸡蛋是对象,那么母鸡就是类;如果说狗是对象,那么狗类就是类。
在Python中,万物皆对象,变量是对象,函数是对象,字符串、列表、元组等等都是对象。
(1)对象的组成: 对象=属性+方法
对象是由属性和方法组成的,属性可以理解为对象有什么,方法可以理解为对象能做什么。
(2)对象的属性有哪些特征
比如说洗衣机是一个对象,那么洗衣机是有颜色的,颜色就是1个属性,但颜色是个抽象东西,因为它可以是红色、白色、黑色等等颜色。
比如说计算机是1个对象,那么计算机有硬盘,硬盘就是计算机的一个属性,所以说对象的属性可以是另一个对象。
比如说鼠标是一个对象,鼠标的滚轮是1个对象,鼠标里面的单片机是1个对象等等,你会发现,鼠标这个大对象是由多个小对象组成。
(3)对象的方法
有1个规则先了解一下,对象的方法可以被自己调用,也可以被别的对象调用,后面我会详细讲解。
在对象这里我们暂时不讲代码,因为还要先讲类的知识,才能更好地理解代码里的类和对象,下面会讲到的。
上面有提到过,类是产生对象的模板,那么类就是对象的抽象化,对象是类的具象化。
既然 对象=属性+方法,同样的,类=属性+方法。
(1)创建类
创建类的方法:
class 类名:
属性1
属性2
方法1
方法2
#1个类中可以有多个属性和方法,也可以只有属性或者只有方法
举例,创建1个学生类,并使用它创建对象
#创建Student类
class Student:
name = "小明" #学生类的name属性
age = 18 #学生类的age属性
def learn(self): #学生类的learn方法
print("学生的学习方法被调用了")
#创建Student类的对象
s1 = Student() #Student()就是创建的1个类对象,只是便于简写,我把它传给了s1
s1.learn() #对象的方法
print(s1.age) #执行对象的属性
#上面这两行代码其实可以直接写成Student().learn() ,也同样是利用类创建了对象并调用对象的方法
执行结果:
其实创建Student类的对象时,后面的3行代码还可以写成这样,效果是一样:
Student().learn() #创类的对象并使用对象的方法
print(Student().age) #创建类的对象并执行对象的属性
回过头来,我们再从代码和概念结合的角度来理解一下什么是属性和什么是方法。
类属性就是类里面有什么,比如说类里面有name和age,所以name和age是Student这个类的属性。
类方法是类能做什么,比如说类里面有learn(self)这个函数,它能执行“学生的学习方法被调用了”,也就是这个类能执行什么能干什么,所以learn(self)这个函数就是类的方法。
我们前面介绍过对象的属性和类的属性,那么我们来看一下两者的区别和特征。
类属性
对象属性
对象属性定义在方法内部
类方法的声明
def 函数名(self,参数1,参数2,…)
self
1.self默认传递,不需要传值
2.self指代的是当前的实例(对象)
3.一定会有self传递,但名字不一定必须叫self,可以叫aa
4.self后面可以跟多个参数,用“,”隔开
方法的调用
1.对象.方法名(自动传递对象),例如 s2.fun1()
2.类名.方法名(类名()) #“类名()”相当于创建对象
注:方法的调用与函数类似,谁调用就返回给谁
初始化的方法(特殊的类的方法)
def init():
1.这个方法不需要被调用,只要创建对象就会自动执行
2.这个方法只能返回None值,无法返回其他类型的值
3.如果要给init传递多个参数,只能通过 类名(多个参数) 的方式去传递
4.如果类里面没有定义init,默认去调用父类
5.如果类里面重复定义了多个init方法,会被最后一个init方法覆盖
举例:创建对象,查看默认执行的init并传递多个值;调用1个类的方法,确认该方法被调用并执行传递的值。
#创建类
class Student:
name = "小莫"
age = "18"
def __init__(self,aa,bb):
print("init被调用了")
print(aa)
print(bb)
def fun1(self):
print("函数1")
print(self)
def fun2(self):
print("函数2")
Student.fun1(Student(100,200)) #创建对象并传递多个值给init
执行结果为:
init被调用了
100
200
函数1
<__main__.Student object at 0x000001DAD8168400> #self值的存储地址
三大特性:封装、继承、多态。
1.对象都有明确的边界,把属性和方法保护在边界之内。(安全性)
2.封装的力度适中。
3.封装的原则
(1)将不需要对外提供的内容进行隐藏。
(2)隐藏属性,提供公共的方法对其访问
私有属性:__name="xxx"
继承是父类与子类的关系,比如狗类和二哈,狗类就是父类,二哈是子类。
(1)定义形式(类的完整形式)
class 子类的类名(父类的类名):
属性
方法
(2)父类:基类,超类
object————顶层类
如果对象没有书写继承关系,默认继承object
(3)继承的特点
举例:用子类创建的对象调用父类的属性和方法
# 定义父类
class A:
name1 = "父类的属性1"
def aa(self):
print("父类的方法1")
# 定义子类
class B(A):
name2 = "子类的属性1"
def bb(self):
print("子类的方法1")
n = B()
print(n.name2) #调用子类的属性
n.bb() #调用子类的方法
print(n.name1) #调用父类的属性
n.aa() #调用父类的方法
执行结果为:
子类的属性1
子类的方法1
父类的属性1
父类的方法1
可扩展性。父类扩展了,子类也得到扩展。
如果子类没有构造方法,对象会去调用父类的。
如果子类有自己的构造方法,则不会去调用父类的。
子类的构造方法可以调用父类的构造方法,调用可以有以下两种方式:
父类的类名.init(self) #手动传递self
super().init() #不需要加self
多继承
一个子类可以继承多个父类。
# 定义父类A
class A:
name_a = "父类A的属性1"
def aa(self):
print("父类A的方法1")
# 定义父类B
class B:
name_b = "父类B的属性1"
def bb(self):
print("父类B的方法1")
#定义子类C
class C(A,B): #继承两个父类
pass #跳过
n = C()
print(n.name_a)
print(n.name_b)
n.aa()
n.bb()
执行结果为:
父类A的属性1
父类B的属性1
父类A的方法1
父类B的方法1
注:多继承有好有坏,优点是增强了可拓展性,缺点则是继承关系复杂之后容易混乱逻辑,难看懂,同时也会占用大量资源,比如著名的钻石继承问题,主要涉及mro和C3算法,不懂的可以百度一下。
(4)方法覆盖
子类中的方法与父类中的方法同名,则覆盖父类。
#定义父类
class Animal:
def eat(self):
print(“动物会吃东西”)
#定义子类狗
class dog(Animal):
def eat(self):
print(“狗会吃东西”)
d = dog()
d.eat()
执行结果为:
狗会吃东西
子类覆盖了覆盖的方法之后,本质上并没有替换父类的方法,父类的方法依然存在并可以给其他子类调用。
方法覆盖的前提:子类的方法名必须和父类的完全相同
(5)方法重载
出现多个方法名一样的方法(函数),Python中通过默认值进行方法重载。
多态:一类事物有多种形态,是一种使用对象的方式,子类重写父类的方法,调用不同的子类对象的相同父类的方法,可以产生不同的效果。
举例:以王者荣耀选英雄为例,英雄类(Hero)为父类,该父类中有一个方法叫stroke(技能);程咬金和后裔分别为两个子类,两个子类中也有stroke这个方法;调用者为另一个父类,有一个选择英雄的方法,该方法需要调用stroke这个类方法,最后调用不同的子类(程咬金或后裔)对象,得到不同的技能描述。
#定义父类Hero
class Hero :
def stroke(self): #技能函数
print("英雄技能")
#定义子类程咬金
class ChengYaoJin(Hero):
def stroke(self): #技能函数
print("一技能跳跃,二技能旋转,大招回血")
#定义子类后裔
class HouYi(Hero):
def stroke(self): #技能函数
print("一技能多发,二技能射圈,大招大鸟眩晕")
#定义调用者
class Person:
def chose_hero(self,hero): #玩家选择英雄
hero.stroke()
c = ChengYaoJin() #程咬金
x = HouYi() #后裔
p = Person() #玩家
p.chose_hero(c) #玩家选择程咬金,"c"换成"x"就会产生不同的结果
执行结果为:
一技能跳跃,二技能旋转,大招回血
多态性:向不同的对象发送不同的信息,不同的对象接收到信息后,会做出不同的反应。
#定义鸟类
class Bird:
def fly(self):
print("鸟会飞")
#定义飞机类
class Plane:
def fly(self):
print("飞机会飞")
#定义火箭类
class Rocket:
def fly(self):
print("火箭会飞")
#函数调用父类的fly方法
def fun1(obj):
obj.fly()
fun1(Bird()) #调用鸟类的fly方法
fun1(Plane()) #调用飞机类的fly方法
fun1(Rocket()) #调用火箭类的fly方法
执行结果为:
鸟会飞
飞机会飞
火箭会飞
模块指的是Python的程序文件(源文件),模块的文件名就是模块名加上.py,里面包含了Python对象定义和Python语句,模块包含了定义函数、类和执行代码等等,一般情况下不要去修改模块,以免模块失效。
Python中允许导入的形式来进行模块调用,Python中的模块也是对象,模块中定义的所有全局变量,导入后都成为模块的属性。
语法1: import 模块名
如果要导入多个模块,可以只用1个import来导入多个模块,多个模块之间用逗号隔开即可,但是在Python的PEP8风格里面,不建议这么做,所以要导入几个模块,就写几个import来进行挨个导入。
例子:导入math模块并调用sqrt()开平方的功能对9进行开平方
import math
num = math.sqrt(9)
print(num)
输出结果:
3.0
提示一下,在Python中进行运算操作默认返回的是float类型,所以是3.0。
语法2: from 模块名 import 功能1,功能2
注意这里的功能后面不加括号。
例子:导入math模块并调用sqrt()开平方的功能对9进行开平方
from math import sqrt
num = sqrt(9)
print(num)
输出结果:
3.0
语法3:from 模块名 import
一般情况下,这个语法可以导入模块的所有功能,当你要用某个模块的多个功能的时候,就不用挨个写了,这里我就不举例了,都是一样的。
注意点:
这个方式并非在所有情况下都能导入模块中的所有功能,
如果模块中有__all__=["功能1","功能2"]这样的声明,
那么导入的模块只能用功能1和功能2,
如果模块中还有功能3等等功能,但是没有在__all__=[列表]中声明,则无法调用。
例子:(这个例子需要看完下面的自定义模块才看得懂)
新建了1个叫module1的模块,模块代码有2个功能:
def fun1() : #实现a+b并输出结果
print("fun1")
def fun2() : #实现a+b并输出结果
print("fun2")
__all__ = ["fun1"] #声明只能调用fun1()
在另一个Python文件中用语法3的方式导入模块中的所有方法:
from module1 import *
fun1()
fun2()
执行结果只打印出来fun1,然后就报错提示fun2()没有被定义,无法识别,这就是因为
在module1中用__all__声明了可调用的方法只有fun1()。
有的模块或者模块内的功能名字比较长,多次使用的时候不方便,可以进行自定义模块或者功能的名字。
1.模块自定义别名: import 模块名 as 别名
例子:自定义time模块为别名t并使用。
import time as t
t.sleep(3) #延迟三秒
print("hello world")
程序执行3秒后输出:
hello world
2.功能自定义别名: from 模块名 import 功能名 as 别名
例子:导入time模块并自定义sleep()功能为s这个名字
from time import sleep as s
s(5) #延时5秒
print("hello world")
程序执行5秒后输出:
hello world
每个人都能生成自定义模块来进行调用,自定义模块就是Python文件,我们写代码时创建的Python文件就相当于1个模块。
注意点:被调用的模块尽量放在当前Python文件相同目录下,否则导入时要声明所在文件夹才能导入。
例子:自定义1个模块,在另一个Python文件中进行调用。
新建1个名为module1的Python文件,代码如下:
def fun1(a,b) : #实现a+b并输出结果
print(a+b)
相同目录下新建另一个Python文件,调用module1.py这个模块:
import module1
module1.fun1(20,30)
运行当前Python文件结果:
50
每个模块导入的时候都默认被执行一遍,但同时在模块内部又存在着很多的内部测试代码,为了避免导入模块时执行了模块内部的测试代码,于是就牵扯到一个方法:
很多模块在内部都有测试方法:
if __name__ == "__main__":
代码1
这个方法能够实现一个功能,在模块中执行的话,就会执行代码1的代码,在其他文件导入该模块的时候,则不会执行代码1的代码,所以一般模块内部的测试都放在了代码1当中。
为什么?神奇的点就在于__name__,它在当前文件中执行的结果是__main__,在其他文件导入时执行的结果是模块名,所以利用这一点,用上if语句就能判断模块执行到底是在当前文件执行还是被导入执行。
举例:
新建1个Python叫module1,作为模块,代码如下:
print(__name__) #打印__name__
执行结果:
__main__
再新建1个Python文件,导入刚才建好的module1.py模块:
import module1
执行结果:
module1
在当前文件的执行和被导入时执行,结果是不一样的,所以它成为了模块的内部测试方法。
注意点:在自定义的模块中,不建议写while循坏,不然导入的过程中一直在执行模块里面的while循坏,可能会跳不出来,也就是一直在导入模块,其他代码执行不到。
包就是将有联系的模块放在同一个文件夹下,并且该文件夹里有“__init__.py”这个文件,这个文件夹就叫做包。
包的特征:
1.包也是对象
2.必须有__init__.py文件
3.__init__.py文件是包的构造方法,控制着包的导入行为,一般是个空包
4.包里面不仅可以有模块,还可以有子包
在Pycharm软件中新建1个项目文件,创建完成后,打开Pycharm创建1个项目文件夹→点击文件夹→右键弹出选项→New→Python Package→完成创建,创建的新文件夹就是包,里面自动创建了init文件。
常规导入方法主要有2种。
方法1:import 包名.模块名.目标
方法2:import 包名.子包.模块名.目标
这里所说的目标可以是变量、函数等等对象,具体的在下面会讲到。
使用形式1:常规使用1
import 包名.模块名
包名.模块名.功能
举例:创建1个包,在另一个.py文件中使用,要求.py文件不包含在创建的包内。
步骤1,打开Pycharm新建一个项目,创建1个包,命名为demo,包里面新建1个.py文件,命名为my_module,代码如下:
a = 100
def fun1():
print("这是1个包")
步骤2,打开另1个.py文件,导入已创建的包
import demo.my_module
print(demo.my_module.a)
demo.my_module.fun1()
执行结果:
100
这是1个包
使用形式2:常规使用2
from 包名 import 模块名
模块名.功能
模块名.变量
举例:我沿用上面已经创建好的demo包,直接在步骤2中修改代码,用这个新方式去导入包并使用。
from demo import my_module
print(my_module.a)
my_module.fun1()
执行结果是一样的:
100
这是1个包
使用形式3:另起别名并使用
import 包名.模块名 as 别名
别名.功能
别名.变量
上面使用形式1中可能有人会发现,导入模块后的使用不太方便,又要包名又要模块名的,能不能简单点?当然可以,直接给包里的模块另起1个缩短的别名,后面直接用别名就可以了。
沿用上面的使用形式1的例子,这里我就不改动步骤1了,我直接在步骤2中进行另起别名。
import demo.my_module as n1 #另起别名为n1
print(n1.a)
n1.fun1()
执行结果:
100
这是1个包
结果是一样的,但如果代码比较长的话,使用别名会方便很多。
当然了,这里也可以用使用形式2的方式导入包并另起别名,使用时用别名就可以了,这个方式我就不举例了,你们自己可以去试试。
使用方式4:导入某个功能
from 包名.模块名 import 功能1
功能1
这里我也沿用已创建好的包,直接在另一个.py文件中进行使用。
from demo.my_module import fun1
fun1()
执行结果:
这是1个包
使用方式5:导入所有功能
在模块导入的时候我们介绍了import * 这个方式去导入模块里面的所有功能,在这里也可以这么入导入包里面的模块的所有功能。
举例,名叫“demo”包里面有1个模块叫“hhhh”,模块的代码如下:
def fun1():
print("这是功能1")
def fun2():
print("这是功能2")
然后我们在另一个.py文件中调用一下;
from demo.hhhh import *
fun1()
fun2()
执行结果:
这是功能1
这是功能2
6.关于all的使用
关于__all__的使用在模块的时候有介绍过,那是控制可以被导入的功能列表,但在包里面,__all__是控制可以被导入的模块列表,即声明哪些模块可以被导入。
包里面的__all__是在__init__文件中声明的,而不是在哪个模块中写的。
举例:一个包里面有多个模块,其中被all声明的模块可以被导入,不声明的不可以被导入。
步骤1,在名为demo的包里面有hhhh和my_module两个模块,但在int文件中被all声明只有hhhh文件可以使用,int文件的代码如下:
__all__ = [
"hhhh" # hhhh模块允许被导入
]
步骤2,在新的.py文件中导入demo包里面的hhhh和my_module两个模块:
from demo import * #导入包里面的所有模块
hhhh.fun1() #调用hhhh模块的fun1功能,输出“这是功能1”
my_module.fun1() #调用my_module模块的fun1功能,输出“这是1个包”
执行结果:
很明显,虽然用 * 导入了所有模块,但被all声明可导入的hhhh模块是可以被使用的,没被all声明的my_module模块是不能使用的,系统无法识别。
1.提高代码的可重用性。好用的代码不止你1个人可以用,很多人都可以重复使用它。
2.提高代码的可读性。如果所有的代码都放在1个.py文件中,那代码就太长了,增加了理解和维护难度,所以可以把一些常用的代码封装成包和模块,起1个望文生义的名字,需要的时候直接用就行,减少了代码的数量,提高了可读性。
3.减少代码的冗余。模块里面封装的一些方法,我们直接给参数去使用就可以了,不用把方法再写一遍,占用内存,也就减少了代码的冗余。
Python虽然有很多自带的模块和包,简称内置模块,但只会使用内置模块还不够,毕竟内置模块有限,我们经常会用到第三方的库,这个时候学习怎么安装第三方的库(包)是很必要的。
今天来介绍3种第三方模块与包的安装方法。
可以通过包管理命令pip去进行第三模块与包的下载和安装,前提是你安装的Python是照着我前面在【Python基础入门】那篇文章所讲的方式去安装,所有的选项都勾选了,这样你就不用配置环境变量了,首先查看一下你的pip是否能用。
方法:WIN+R调出运行窗口→输入cmd→如果出现下面的pip信息则是可以使用pip
如果出现红字提示“cmd中 ’pip‘不是内部或外部命令,也不是可运行的程序或批处理文件”,那么你就手动配置一下环境变量吧,实在不行就回过头跟着我说的安装Python的步骤去重新装吧。
回到pip如何安装第三方模块与包的问题,首先我们得知道我们要安装的第三方模块与包是叫什么名字,比如Pillow这个第三方库,这是Python下非常强大的处理图像的工具库,安装方法是:
1.WIN+R调出运行窗口
2.输入cmd
3.输入 pip install Pillow
4.等待下载和安装的完成
有时候会出现很多红字提示下载失败,这个很正常,原因可能是:
(1).pip版本过低,升级一下pip版本,在黑窗口输入:python -m pip install -U pip
(2)网络不好,多下载几遍就可以了
通过pip安装是不需要打开软件的,但我们也可以通过Pycharm进行安装,方法如下:
点击左上角的 File → Settings → Project:项目名 → Python interpreter → 点击 + →
输入你想安装的包名,选择你看上的 → 点击 Install Package → 等待下载和安装
可以通过官网等渠道去搜索和下载你想要的包,官网:https://pypi.org/ ,搜索你要下载的第三方库,比如说Pillow这个库,直接搜就可以了:
然后选择你要下载的文件,比如Pillow8.3.2这个版本,进入下载页面,点击 Download files。
进去之后有很多的版本型号,建议选择与你符合的版本,否则可能装不了,这里要注意Python版本、系统和电脑的位数。
比如说我的Python装的是3.9.6的,所以我下的是cp39里面的,电脑是64位,用的是Windows系统,所以我下的版本是 Pillow-8.3.2-cp39-cp39-win_amd64.whl 这个文件。
下载好之后,WIN+R 打开命令行输入CMD,在黑窗口中输入 pip install 文件路径下的文件名,比如我下载后存放的路径是D:谷歌浏览器,所以我在黑窗口输入的代码是:
pip install D:谷歌浏览器Pillow-8.3.2-cp39-cp39-win_amd64.whl
然后回车进行安装,等待安装完成。
计算机中的文件通常是指计算机硬盘为载体的、存储在计算机中的信息集合,主要的表现形式为视频、音频、图片以及文档四类,比如执行性文件.exe、文档文件.txt、网页文件.html等等。
在现实中,我们对文件进行操作可以大致总结为“打开→操作(阅读、删除、修改等)→保存→关闭”,在Python当中依然是如此,在用Python开始文件操作之前,我们先学几个方法。
1.open(name,mode) ----打开文件
这是Python打开文件的方法,用于打开一个文件,返回的是一个文件对象。
name指的是文件名,一定要写全,何为写全?就是要写清楚 存储路径+文件名+后缀 。
为何要写这么全?因为就算是相同的存储路径下,文件名相同的文件也可能不止一个,只要后缀不一样,计算机是允许存在同名文件,所以不写全的话,计算机是不知道你指的是谁
mode是打开文件的模式,默认是r,也就是只读的方式。mode的方式有很多,比如读、写等等,后面我们会讲到。
2.write(“内容") ------写
顾名思义,就是向文件对象中写入内容。
3.read() -------读
向文件中写入内容,括号里面可以写数字也可以不写,不写的话默认是读取全部内容,写数字则表示读取X个字符,比如说read(6)则读取文件对象的6个字符。
4.close() ------关闭文件
关闭文件的方法,如果你在进行文件操作之后不进行关闭文件,则文件一直处于打开和操作的状态,会占用内存。
5.案例
在了解了这4个基本方法之后,我们来开始做1个小案例:新建一个项目,然后新建一个名为“文件”的Python文件用于写代码,然后我们用写的方式向1个叫“文件1”的.txt文件写入“hello world”,代码如下:
f = open("文件一.txt",'w') #以写入的方式,打开文件
f.write("hello world") #向文件一中写入内容
f.close() #关闭文件
前面讲过 open() 这个方法返回的是一个文件对象,所以我们用f进行接收一下,这是没有运行前的界面:
运行后:
运行后生成了一个新的名为“文件一.txt”文件,打开它之后就能看到我们输入的内容。进行写操作时,如果文件不存在,则默认会创建一个。
同样的,我们也可以对这个文件进行读的操作:
f = open("文件一.txt",'r') #以写入的方式,打开文件
print(f.read()) #读文件
f.close() #关闭文件
运行结果:
hello world
这就是一个最基本的文件操作流程。
在这里要注意一点,open(name,mode)在一开始写的时候,mode就已经决定了你能做什么操作,也就是说如果你在开始写代码的时候写的是:
f = open("文件一.txt",'r') #只读的方式打开文件
那么后面你想进行write()的写操作是会报错的,因为mode里面声明了r只读模式,所以你没有写的权限,这一点要注意一下。
6.mode的其他操作模式
mode中有很多的操作模式,我们以表格的方式来看看:
模式
描述
r
以只读的形式打开文件,文件的指针在开头
r+
读写,文件指针在开头
rb
以二进制的形式,只读文件指针在开头
w
只写,文件不存在,则创建新的,存在则覆盖,指针在开头
w+
读写,文件不存在,则创建新的,存在则覆盖,指针在开头
wb
只写,以二进制的形式
a
追加模式,文件指针在结尾
a+
读写,不存在则创建,存在直接追加
ab
以二进制形式追加
指针在这里可以理解为光标,它在哪里,你的操作就从哪里开始。
举例:新建1个名为 “test” 的.txt文件,第一次向里面写入aaa,第二次向里面写入bbb。
f = open("test.txt", 'a+')
f.write("aaa")
f.close()
f = open("test.txt") # 默认只读模式
print(f.read()) # 打印内容
f = open("test.txt", 'a+')
f.write("bbb")
f.close()
f = open("test.txt") # 默认只读模式
print(f.read()) # 再次打印内容
运行结果:
aaa
aaabbb
1.file的对象属性
有三个常用的方法可用于查看文件对象的属性:
1. closed
如果文件对象已关闭,返回True,否则返回False
2. mode
返回文件对象的访问模式
3. name
返回文件的名称
案例:对文件进行操作(随意),查看被操作的文件名、操作模式和是否关闭。
f = open("test.txt", 'a+')
f.write("aaa")
f.close()
print(f.closed) #查看是否关闭
print(f.name) #查看文件名字
print(f.mode) #查看操作模式
运行结果:
True
test.txt
a+
2.file的对象方法
文件的方法有很多,前面我们已经讲过一点,比如read()和write(),但还有一些常用的方法需要掌握的,比如下面的:
1. close()
关闭文件---非常重要
2. read([count])
读取文件中的内容
count:字节数量
3. readlines()
读取所有内容,打包成列表
4. readline()
读取一行数据,追加读取,读取过的不能再次读取
5. seek(offset,[from])
修改指针的位置:从from位置移动了offset个字节
from:0则表示从起始位置,1则表示从当前位置开始,2则表示从末尾开始
oofset:要移动的字节数
6. write()
向文件中写入内容
举例:向test.txt文件中写入aaabbbccc,将文件中的内容输出为列表。
f = open("test.txt", 'a+')
f.write("aaabbbccc")
f.close()
f = open("test.txt")
print(f.readlines())
f.close()
运行结果:
['aaabbbcccaaabbbccc']
os模块是一个用于访问操作系统的模块,在进行文件操作的时候常会用到它。模块在使用之前要进行导入。
import os
1.关于文件的功能
1.os.rename(原文件名,新的文件名) ——文件重命名
2.os.remove(文件名) ——删除文件
如果不说明路径,则在源代码所在文件夹下寻找,寻找不到会报错。
若想删除指定文件夹下的文件,文件名则需要具体路径,例如 os.remove(r"D: est_1文件名"),r防止斜杠发生转义
举例:已有文件test1.txt,将其修改成test20.txt。
import os
os.rename("test1.txt","test20.txt")
运行结果:
2.文件夹的功能
1.os.mkdir(文件夹名) ——创建文件夹
2.os.rmdir(文件夹名) ——删除文件夹
3.os.getced() ——获取当前目录
4.os.chdir(目录) ——切换目录
5.os.listdir(目录) ——获取当前文件夹下所有的文件或者文件夹,返回一个列表
os.listdir("aa") #获取aa文件夹下的所有文件或文件夹,返回一个列表
举例:在现有文件夹venv里面新建一个新建文件夹。
import os
os.chdir(r"D:文件env") #切换到venv文件夹下,r是防止转义
os.mkdir("新建文件夹") #在venv文件夹下创建一个新建文件夹
print(os.getcwd()) #输出当前目录位置
运行结果:
异常是一个事件,该事件在程序执行过程中发生,影响程序的正常执行。一般情况下,Python无法正常处理程序时就会发生一个异常。
例如我在代码中只写了一个变量a,运行程序,pycharm无法识别这个变量,所以报错,便是出现了异常。
所以我们需要掌握处理异常的方法,处理异常的方法有很多种,接下来我们一个个来看。
它能够将可能出错的代码进行处理,处理后报错的红色字体将会转换成简短的、正常的字体,用法如下:
try:
有可能出现异常的代码
except 异常类型 as 变量
处理后的代码
举例:直接打印变量a会报错。
经过tyr-except处理过一下:
try:
print(a)
except NameError as s:
print(s)
再次运行看效果:
飘红的报错信息变得简短且颜色正常,看起来这个异常是不是显得舒服多了?
这里的tyr-except并不影响代码的运行,如果你的代码没有报错,你就算是写了tyr-except,它也只会执行try那行代码,那行代码没有错误,那就不会执行except里面的代码。
例如我们来一个正常的:
这种方法和前面的try-except写法是差不多的,只是后面再增加了一个except,可用于判断多种可能报错的情况。
例如:有两行代码可能会报错,两种不同类型的异常,但不想让它飘红。
try:
1 / 0
print(a)
except NameError as s: # 第一种写法,用as+变量
print(s)
except ZeroDivisionError: # 第二种写法,自定义输出内容
print("除数不能为0") # 自定义输出的内容
运行结果:
虽然报错,但没有飘红,这里注意一下except的两种写法。
try-except的写法很灵活的,我们同样可以用元组把可能报错的异常类型囊括进去,避免写多行except,例如:
如果没有异常,则执行else里面的代码,例如:
不管代码是否有异常,最后都会执行finally里面的代码。例如:
except后面其实可以不加错误类型,因为系统会默认认为后面的错误是类型是Exception,这是1个顶层类,包含了所有的出错类型。
有没有发现,前面我们去做基本的异常捕获时,每次可能出错的地方就得写一个try-except,如果有多个地方可能会出错呢?是否我们需要写多个try-except?又或者理论上代码可以运行,但我想定一下规矩,凡是不符合我规矩的行为,我都让它出现异常,比如密码长度超出我规定的长度,我想让程序出现异常。
自定义异常可用于引发一个异常(抛出一个异常),由关键字raise引发。
举例:模拟用户输入密码的情景,用户输入的密码不能低于6位数,自定义一个异常,用于检测用户输入的密码是否符合规定,不符合则引发异常,提示当前输入的密码长度和最小密码长度不能低于6位数。
class MyError(Exception): # 异常捕获的类
def __init__(self, length, min_len): # length为用户输入的密码长度,min_len为规定的最小长度
self.length = length
self.min_len = min_len
# 设置抛出异常的描述信息
def __str__(self):
return "你输入的长度是%s,不能少于%s" % (self.length, self.min_len)
def main():
try:
con = input("请输入密码:") # 获取用户输入的密码
l = len(con) # 获取用户输入的密码长度
if l < 6:
raise MyError(l, 6) # 长度低于设定的6位数则引发异常
except Exception as ss: # 有错误则提示
print(ss)
else:
print("您的密码输入完毕") # 没有错误则执行
main()
运行结果:
从上面的代码中我们又用到了之前面向对象板块里面的类和实例对象的知识,忘记的赶紧去复习吧,除此之外,这里还结合了前面的try-except,还有我们的关键字raise引起异常捕获。
在讲正则表达式之前,我们首先得知道哪里用得到正则表达式。正则表达式是用在findall()方法当中,大多数的字符串检索都可以通过findall()来完成。
1.导入re模块
在使用正则表达式之前,需要导入re模块。
import re
2.findall()的语法:
导入了re模块之后就可以使用findall()方法了,那么我们必须要清楚findall()的语法是怎么规定的。
findall(正则表达式,目标字符串)
不难看出findall()的是由正则表达式和目标字符串组成,目标字符串就是你要检索的东西,那么如何检索则是通过正则表达式来进行操作,也就是我们今天的重点。
使用findall()之后返回的结果是一个列表,列表中是符合正则要求的字符串
(1)普通字符
大多数的字母和字符都可以进行自身匹配。
import re
a = "abc123+-*"
b = re.findall('abc',a)
print(b)
输出结果:
['abc']
(2)元字符
元字符指的是. ^ $ + {} []之类的特殊字符,通过它们我们可以对目标字符串进行个性化检索,返回我们要的结果。
这里我给大家介绍10个常用的元字符以及它们的用法,这里我先给大家做1个简单的汇总,便于记忆,下面会挨个讲解每一个元字符的使用。
** 1 []**
[] 的使用方式主要有以下三种:
常用来指定一个字符集。
s = “a123456b”
rule = “a[0-9][1-6][1-6][1-6][1-6][1-6]b” #这里暂时先用这种麻烦点的方法,后面有更容易的,不用敲这么多[1-6]
l = re.findall(rule,s)
print(l)
输出结果为:
['a123456b']
例如要在字符串"abcabcaccaac"中选出abc元素:
s = "abcabcaccaac"
rule = "a[a,b,c]c" # rule = "a[a-z0-9][a-z0-9][a-z0-9][a-z0-9]c"
l = re.findall(rule, s)
print(l)
输出结果为:
['abc', 'abc', 'acc', 'aac']
例如要在字符串“caabcabcaabc”中选出“caa”:
print(re.findall("caa[a,^]", "caa^bcabcaabc"))
输出结果为:
['caa^']
注意点:当在[]的第一个位置时,表示除了a以外的都进行匹配,例如把[]中的和a换一下位置:
print(re.findall("caa[^,a]", "caa^bcabcaabc"))
输出:
['caa^', 'caab']
2^
^ 通常用来匹配行首,例如:
print(re.findall("^abca", "abcabcabc"))
输出结果:
['abca']
3 $
$ 通常用来匹配行尾,例如:
print(re.findall("abc$", "accabcabc"))
输出结果:
['abc']
4
反斜杠后面可以加不同的字符表示不同的特殊含义,常见的有以下3种。
d:匹配任何十进制数等价于[0-9]
print(re.findall(“cddda”, “abc123abc”))
输出结果为:
['c123a']
可以转义成普通字符,例如:
print(re.findall("^abc", "^abc^abc"))
输出结果:
['^abc', '^abc']
5 s
匹配任何的空白字符例如:
print(re.findall("ss", "a c"))
输出结果:
[' ', ' ']
6 w
匹配任何字母数字和下划线,等价于[a-zA-Z0-9_],例如:
print(re.findall("www", "abc12_"))
输出:
['abc', '12_']
7 {n}
{n}可以避免重复写,比如前面我们用w时写了3次w,而这里我们这需要用用上{n}就可以,n表示匹配的次数,例如:
print(re.findall("w{2}", "abc12_"))
输出结果:
['ab', 'c1', '2_']
8 *
*表示匹配零次或多次(尽可能的多去匹配),例如:
print(re.findall("010-d*", "010-123456789"))
输出:
['010-123456789']
9 +
+表示匹配一次或多次,例如
print(re.findall("010-d+", "010-123456789"))
输出:
['010-123456789']
?? .
.是个点,这里不是很明显,它用来操作除了换行符以外的任何字符,例如:
print(re.findall(".", "010
?!"))
输出:
['0', '1', '0', '?', '!']
1 1 ?
?表示匹配一次或零次
print(re.findall("010-d?", "010-123456789"))
输出:
['010-1']
这里要注意一下贪婪模式和非贪婪模式。
贪婪模式:尽可能多的去匹配数据,表现为d后面加某个元字符,例如d*:
print(re.findall("010-d*", "010-123456789"))
输出:
['010-123456789']
非贪婪模式:尽可能少的去匹配数据,表现为d后面加?,例如d
print(re.findall("010-d*?", "010-123456789"))
输出为:
['010-']
12{m,n}
m,n指的是十进制数,表示最少重复m次,最多重复n次,例如:
print(re.findall("010-d{3,5}", "010-123456789"))
输出:
['010-12345']
加上?表示尽可能少的去匹配
print(re.findall("010-d{3,5}?", "010-123456789"))
输出:
['010-123']
{m,n}还有其他的一些灵活的写法,比如:
关于常用的元字符以及使用方法就先到这里,我们再来看看正则的其他知识。
在Python中,re模块可通过compile() 方法来编译正则,re.compile(正则表达式),例如:
s = "010-123456789"
rule = "010-d*"
rule_compile = re.compile(rule) #返回一个对象
# print(rule_compile)
s_compile = rule_compile.findall(s)
print(s_compile) #打印compile()返回的对象是什么
输出结果:
['010-123456789']
正则对象的使用方法不仅仅是通过我们前面所介绍的 findall() 来使用,还可以通过其他的方法进行使用,效果是不一样的,这里我做个简单的总结:
(1)findall()
找到re匹配的所有字符串,返回一个列表
(2)search()
扫描字符串,找到这个re匹配的位置(仅仅是第一个查到的)
(3)match()
决定re是否在字符串刚开始的位置(匹配行首)
就拿上面的 compile()编译正则之后返回的对象来做举例,我们这里不用 findall() ,用 match() 来看一下结果如何:
s = "010-123456789"
rule = "010-d*"
rule_compile = re.compile(rule) # 返回一个对象
# print(rule_compile)
s_compile = rule_compile.match(s)
print(s_compile) # 打印compile()返回的对象是什么
输出:
可以看出结果是1个match 对象,开始下标位置为0~13,match为 010-123456789 。既然返回的是对象,那么接下来我们来讲讲这个match 对象的一些操作方法。
这里先介绍一下方法,后面我再举例,Match对象常见的使用方法有以下几个:
(1)group()
返回re匹配的字符串
(2)start()
返回匹配开始的位置
(3)end()
返回匹配结束的位置
(4)span()
返回一个元组:(开始,结束)的位置
举例:用span()来对search()返回的对象进行操作:
s = "010-123456789"
rule = "010-d*"
rule_compile = re.compile(rule) # 返回一个对象
s_compile = rule_compile.match(s)
print(s_compile.span()) #用span()处理返回的对象
结果为:
(0, 13)
re模块中除了上面介绍的findall()函数之外,还有其他的函数,来做一个介绍:
(1)findall()
根据正则表达式返回匹配到的所有字符串,这个我就不多说了,前面都是在介绍它。
(2)sub(正则,新字符串,原字符串)
sub() 函数的功能是替换字符串,例如:
s = "abcabcacc" #原字符串
l = re.sub("abc","ddd",s) #通过sub()处理过的字符串
print(l)
输出:
ddddddacc #把abc全部替换成ddd
(3)subn(正则,新字符串,原字符串)
subn()的作用是替换字符串,并返回替换的次数
s = "abcabcacc" #原字符串
l = re.subn("abc","ddd",s) #通过sub()处理过的字符串
print(l)
输出:
('ddddddacc', 2)
(4)split()
split()分割字符串,例如:
s = "abcabcacc"
l = re.split("b",s)
print(l)
输出结果:
['a', 'ca', 'cacc']
操作系统可以执行多个任务,比如我们的Windows系统,除了目前在执行的、你能看得到的几个任务,还有很多后台正在执行的任务,可以用Ctrl+Alt+Del键调出任务管理器看一下就知道了。
我的电脑配置经常会看到有几核处理器的属性,例如我的电脑是12核的,也就是说电脑最多能同时执行12个任务,最多运行12个进程同时进行。
但为什么我们的电脑却能够同时运行几百个任务呢?
其实这得益于于操作系统的任务调度,大部分的操作系统是采用抢占时间片的形式进行调度。系统在极其微小的时间内,在多个任务之间进行极快速的切换,比如说8核的操作系统理论上1秒钟之内只能同时执行8个任务,但是系统在1秒钟之内可能在上百个任务之间进行切换,A任务执行一下、B任务执行一下、C任务执行一下…结果1秒钟之内很多任务都能被执行到,造成了肉眼可见的几百个任务在一直执行。
术语叫“宏观并行,微观串行”,实际上电脑在极端的时间内只能执行不超过配置核数的任务数,8核还是只能执行8个任务。
既然讲到了任务,那么进程就是任务,1个进程就相当于1个任务,是操作系统分配资源的最小单位。在python中,想要实现多任务可以使用进程来完成,进程是实现多任务的一种方式。
进程的多个子任务就称之为线程,线程是进程的最小执行单位, 一个进程可以有很多线程,每个线程执行的任务都不一样。
Python既支持多进程又支持多线程,接下来我们就开始进入Python的进程与线程的学习。
如果你利用多进程,你的Python代码是从头到尾逐行执行的,这其实就是在执行1个进程,这一点应该很好理解。
要想更多利用CPU资源,我们可以利用多进程,这里介绍一个Python多进程时常用的包multiprocessing,它拥有很多的功能,比如子进程、通讯、共享、执行不同的形式等等,我们来了解一些常用的。
Process是multiprocessing里面的一个进程类,通过它就能实现多进程。我们先来看一下它的用法,后面我们会有实际的例子去讲述。
Process(target,name,args,kwargs)
Process里面有很多方法,其中最常用的就是start()启动进程的方法。
进程名.start() #开始进程
举例:写好的代码如下,我想看看开启和没开启多进程调用函数的效果。
import time
#2个要同时执行的函数
def music() :
for i in range(5): #执行5次
print("听音乐中...")
time.sleep(0.2) #延迟0.2s,目的是让效果对比更明显一些
def movie():
for i in range(5):
print("看视频中...")
time.sleep(0.2) #延迟0.2s
music()
movie()
print("主进程执行完毕")
在没有开启多进程时,执行效果如下:
可以看到,这是很正常的运行情况,程序从上运行到下,逐行运行,music()里面的三次循环没有执行完毕就不会执行movie()里面,以及这两个函数如果没有执行完毕,就不会执行最后一行的print(“主进程执行完毕”)。
我们再来看在上面案例的代码中加入多进程:
import time
import multiprocessing
# 2个要同时执行的函数
def music():
for i in range(5): # 执行5次
print("听音乐中...")
time.sleep(0.2) # 延迟0.2s,目的是让效果对比更明显一些
def movie():
for i in range(5):
print("看视频中...")
time.sleep(0.2) # 延迟0.2s
if __name__ == "__main__": # 解决Windows系统下调用包时的递归问题
# 创建子进程
music_process = multiprocessing.Process(target=music)
movie_process = multiprocessing.Process(target=movie)
# 启用进程
music_process.start()
movie_process.start()
print("主进程执行完毕")
代码中我加入了一个if语句来判断__name__这个,为什么?因为在Windows系统下, multiprocessing这个包会发生递归现象,就是会在“导入模块—调用模块”之间反复执行,不信你可以把if语句去掉,把里面的代码全部放到外面来执行就会报错,这是Windows系统下会发生的一个现象,mac、linux等系统是不用加ifl来做判断的。
关于__name__ = "main"这个知识点我在模块与包的初始化时候有讲过,不懂的可以回去看一下。
运行效果:
可以看出来,这开启进程之后,代码运行时是有3个进程同时进行的,一个是从上往下执行的主进程,执行到下面输出“主进程执行完毕”,另外两个子进程去执行music()和movie()进程,从他们的执行速度来看,它们是同时在进行的,所以没有像刚才那样非要等其中一个函数里面的代码执行3遍才开始第2个函数。
同样的代码,你们的执行效果可能会跟我有所差异,因为效果是根据系统当前的状况去随机分配的,但并不影响你能看出来它的结果是多线程在进行。
最后补充一下,前面我们讲过Process里面有args和kwargs可进行参数传递,args是普遍参数的传递,kwargs是以字典的形式进行参数传递,我们还是以上面的代码为例,进行一下有参数传递的多进行。
前面我们讲到了代码执行时有多个进程在同时进行任务,那么怎么样查看当前进程的编号来得知目前有哪些进程在运行呢?哪些是主进程哪些是子进程呢?3个方法,我们先来看一下方法,后面再结合例子一起使用。
(1)获取当前进程的编号:
需要用到一个os模块里面的getpid()方法,用法如下:
os.getpid()
(2)获取当前进程的名字
这里用的还是multiprocessing包,里面有个current_process()的方法,用法如下:
multiprocessing.current_process()
(3)获取当前父进程(主进程)的编号
子进程是属于哪个父进程的?这个用的是os模块里面的getppid() ,用法如下:
os.getppid()
那么方法都看到了,我们来在刚才的例子的基础上,获取并打印一下当前进程的名字、编号以及父进程的编号。
import time
import multiprocessing
import os
# 2个要同时执行的函数
def music():
print("music子进程名字:", multiprocessing.current_process())
print("music子进程编号:", os.getpid())
print("music所属主进程的编号:", os.getppid())
for i in range(5): # 执行5次
print("听音乐中...")
time.sleep(0.2) # 延迟0.2s,目的是让效果对比更明显一些
def movie(a, b):
print("movie子进程名字:", multiprocessing.current_process())
print("movie子进程编号:", os.getpid())
print("movie所属主进程的编号:", os.getppid())
for i in range(5):
print("看视频中...")
time.sleep(0.2) # 延迟0.2s
if __name__ == "__main__": # 解决Windows系统下调用包时的递归问题
# 创建子进程
music_process = multiprocessing.Process(target=music)
movie_process = multiprocessing.Process(target=movie, kwargs={"a": 30, "b": 40})
# 启用进程
music_process.start()
movie_process.start()
print("主进程编号:",os.getpid())
运行结果:
可以只要我们使用获取线程的方法的线程,都能被打印出来编号和名字。
多进程能同时运行几个任务,前面我们讲过进程的最小单位是线程,那么线程也同样可以进行多个任务。如果一个进程只有1个任务(主进程),那么也可以说是只有1个线程,就比如我们不使用多进程运行代码的时候,这时候就可以说1个主进程或1个主线程。
多线程常用的一个模块是threading,里面有个教Thread的类,跟前面我们将多进程时用到的Process类差不多,我们先来看看用法:
Thread(target=None,name=None,args=(),kwargs=None)
同样的,多线程也要有开启的方法,跟前面的也差不多:
start()
还有获取线程名字的方法:
threading.current_thread()
知道了这些知识点,我们开始举例:用跟上面差不多的例子去使用一下我们的多线程。
import threading,time
def music(name,loop):
for i in range(loop):
print("听音乐 %s , 第%s次"%(name,i))
time.sleep(0.2)
def movie(name,loop):
for i in range(loop):
print("看电影%s , 第%s次"%(name,i))
time.sleep(0.2)
if __name__ =="__main__":
music_thread = threading.Thread(target=music,args=("最亲的人",3))
movie_thread = threading.Thread(target=movie,args=("唐探2",3))
music_thread.start()
movie_thread.start()
print("主线程执行完毕")
运行结果:
听音乐 最亲的人 , 第0次
看电影唐探2 , 第0次
主线程执行完毕
听音乐 最亲的人 , 第1次看电影唐探2 , 第1次
看电影唐探2 , 第2次听音乐 最亲的人 , 第2次
可以看出来,我们的多线程其实是跟多进程差不多的,同样可以运行多个任务,这里我们还增加了参数的使用。
我们除了用上面的方法实现多线程任务,还可以用继承类的方式去实现多线程。
举例:通过多线程的方式,去打印“凉凉”和“头发没了"。
import threading,time
#多线程的创建
class MyThread(threading.Thread):
def __init__(self,name): #初始化
super().__init__() #调用父类Thread的初始化方法
self.name = name #name变成实例属性
def run(self):
#线程要做的事情
for i in range(5):
print(self.name)
time.sleep(0.2)
#实例化子线程
t1 = MyThread("凉凉")
t2 = MyThread("头发没了")
t1.start()
t2.start()
MyThread这个类是我们自己创建的,它是继承于父类threading.Thread ,同时我们需要写上MyThread的初始化方法,每当被调用的时候把准备工作做好,super().int() 这个我们也讲过了,在前面的面向对象时有讲过,不懂的可以去看看面向对象那篇文章的内容。
运行结果:
凉凉
头发没了
凉凉
头发没了
凉凉头发没了
凉凉头发没了
凉凉
头发没了
随机效果是有的,你们的效果和我的可能会不一样,每台电脑在运行多线程代码时,哪个线程能够抢到时间片谁就先执行。
通过类Thread继承一样可以实现多线程。
在Python中,容器是把多种元素组织在一起的数据结构,容器中的元素就可以逐个迭代获取。说白了,它的作用就像它的名字一样:用来存放东西(数据)。
容器实际上是不存在的,它并不是一种数据类型,只是人为的一种概念,只是为了方便学习所创造的一个概念词,它可以用成员关系操作符(in或not in)来判断对象是否在容器里面。
当然了,它不是我创造的,我没有那么大本事哈,是官方创造的好吧,你也不用担心我是在教你一些奇奇怪怪的名词,说出去别人都听不懂…python中都是这么叫的。
常见的容器类型有列表(list)、元组(tuple)、字符串(str)、字典(dict)以及集合(set )。
既然容器里面的数据是可以迭代获取的,那么我们又得来学一个新概念:可迭代对象。
什么是可迭代对象?
在python中,可迭代对象并不是指某种具体的数据类型,它是指存储了元素的一个容器对象。
也就是说,如果容器里面没有存储数据,那它就不是可迭代对象,并不是所有的容器都是可迭代对象,容器包含但并不仅限于可迭代对象。
注意两个点:
1.很多容器都是可迭代对象(容器包含了可迭代对象)。
2.一个可迭代对象是不能独立的进行迭代的,迭代是通过for来完成的,凡是可迭代对象都可以直接使用for循环进行访问。
for循环大家应该不陌生吧?有没有想过,for循环内部是怎么实现的?比如说这个for循环的例子,为什么能输出列表里的每一个元素?它的内部是怎么实现的?
其实for循环做了两件事情:
1.使用 __iter__() 返回1个迭代器,迭代器在下面会讲,这里先知道有这么个东西。
2.使用 __next__() 获取迭代器中的每一个元素。
那么我们不用for循环来输出列表里的每一个元素,
l = [1,2,3,4]
# for i in l:
# print(i)
ite =l.__iter__() #接收一下ietr()干了什么
print(ite) #打印
print(ite.__next__()) #for循环干第2件事情的时候做的第1步
print(ite.__next__()) #for循环干第2件事情的时候做的第2步
print(ite.__next__()) #for循环干第2件事情的时候做的第3步
print(ite.__next__()) #for循环干第2件事情的时候做的第4步
输出结果:
可以看出来,如果我们去掉哪行打印ite的代码,执行效果就是跟for循环输出列表里面的每一个元素是一样的,for循环里面限定了范围是4次,实际上就执行了1次__iter__()和4次__next__(),也就是说for循环访问迭代对象的本质就是通过这么去实现的。
而且,for循环本质上干的那两件事情,缺一不可,也就是说如果没有__iter__()先返回了迭代器,__next()__也无法获取到元素,恰恰说明了前面说要注意的两点中的第2点:一个可迭代对象是不能独立的进行迭代的。
有两个内置函数跟它们原理是一样的,本质相同,一般要用的话用内置函数要方便一些,起码不用写那么多下划线:
内置函数 iter() 的本质是 __inter__() ,也是返回一个迭代器。
内置函数 next() 的本质是 __next__(),也是有了迭代器之后获取元素。
可以看出来结果也是一模一样的,既然讲到了迭代器,那么就来看看什么是迭代器。
通过上面的for循环例子我们大概也能看得出来,
只要是实现了__iter__()和__next__()的对象,就是迭代器,迭代器是一个可迭代对象。
总之,迭代器是有__iter__()生成,可以通过__next__()进行调用。
既然如此,我们在学Python基础的时候讲过range()是一个可迭代对象,那么它也是可以通过__iter__()生成一个迭代器的。
序列在【赋值语句】那个专题文章中我有提过,这里再讲一下,序列也是一个抽象的概念,它包含了列表、元组和字符串,它本身是不存在的,也是便于学习所创造的一个概念词。
可迭代对象包含序列,既然序列包含了列表、元组和字符串,前面我们的例子中也涉及到 了,所以说序列可以被iter()和next()使用。
序列可以分为有限序列和无限序列。有限序列就是有范围的,比如说range(10)就已经限定了范围,相反的,无限序列也就是没有限定范围的序列。
我们来生成一个无限序列,这里需要用到1个新模块itertools,itertools用于高效循环的迭代函数集合,它下面有一个方法count(),可生成迭代器且无范围,可以理解为无限迭代器。
通过这个例子我们可以看出来,只要执行一次,next()就会获取一次迭代器里面的内容并逐次获取,我这里只写了4个next(),你多写几次就会多输出几次。
像next()这种什么时候需要就什么时候调用的机制叫做懒加载机制,也叫懒汉式加载;
相反地就有饿汉式加载。比如for循环这种的,只要一执行就会把可迭代器里面的所有对象都获取。
列表推导式跟生成器有关,在讲生成器之前,需要先知道什么是列表推导式,列表推导式就是生成列表的一种方法,语法是这样的:
l = [i for i in 可迭代对象]
i表示要放进列表里的对象,for循环是一个式子。
比如我们用列表推导式来生成一个列表试试:
l = [i for i in range(5)]
print(l)
运行结果:
[0, 1, 2, 3, 4]
运用列表推导式可以很方便地生成我们想要的列表。
同时它也有很多灵活的用法,比如在后面加上条件判断
l = [i for i in range(5) if 4<5]
print(l)
运行结果:
[0, 1, 2, 3, 4]
if后面的条件判断为真,则可以正常生成列表,如果为假,则列表推导式是无效的,此时的l将是一个空列表。
还有其他灵活的用法,比如操作前面的i,比如让i的数值全都翻2倍:
我们把迭代对象换一下,换成字符串,也同样可以输出,只是*在字符串里面表示重复操作符,所以效果变成了这样:
不仅如此,前面的i*2我们还可以用函数来进行操作,比如:
总而言之,列表推导式就是用来快速和自定义生成列表的一种方法,很灵活。
那么有人可能会举一反三了,列表推导式都是用 [] 来进行操作的,那如果用()来操作行吗它会不会生成一个元组?我们来看看:
[] 换成()之后,返回的是一个生成器generrator ,那么下面我们再来讲讲生成器:
生成器是真实存在于Python中的对象,与容器这种概念词是不同的,它是可以直接通过next()进行调用的。
第一种创建方法跟列表推导式是差不多的,就是 [] 换成了():
l = (i for i in 可迭代对象)
比如我们来生成一个生成器,看看能不能用next()直接调用:
l = (i for i in "abcd")
print(next(l))
运行结果:
a
可以看出,生成器是可以直接调用的。那么既然生成器可以被next()调用,那么生成器就是一个特殊的迭代器,是一个可迭代对象。
除了用上面那种方法创建生成器,还可以用yield来创建,方法如下:
yield 关键字
比如说我们用一个函数中包含yield来创建生成器:
def fun():
a = 10
while 1:
a += 1
yield a
b = fun()
print(b)
运行结果:
结果就是生成了一个生成器,而且此时的函数fun()就已经不再是一个函数了,它是一个生成器,只要函数中出现了yield,函数就变成了生成器。
为什么while循环没有一直执行?先不着急,我们输出看看:
def fun():
a = 10
while 1:
a += 1
yield a
b = fun()
print(next(b))
print(next(b))
print(next(b))
运行结果:
11
12
13
我调用了三次,所以它就运行了三次,while循环虽然存在,但是却不起作用,是因为前面我们提过的懒汉式加载。
什么时候需要了,什么时候用next()调用,就是懒汉式加载,不像饿汉式加载那样,提前生成了所有对象,如果这里换成for循环来完成,比如:
def fun():
a = 10
while 1:
a += 1
print(a)
b = fun()
运行之后程序将会进入死循环,一直给a自加1,你可以试试看效果,这就是饿汉式加载提前生成了迭代器并调用了全部迭代器对象,饿汉式加载占用资源的放大镜。
最后用一张图来总结一下它们的关系:
修饰器又叫装饰器,本身也是一个函数,是在原有的函数或者是方法上增添一些额外的功能。
概括的讲,装饰器的作用就是为已经存在的对象添加额外的功能。
比如说这个函数是注册的功能,但有时候这个用户在执行这个操作的时候,他是已注册的用户,我这个函数已经写好了,不想动它了,那么我们就可以通过修饰器来给这个函数增加一个登录的功能。
它经常用于有切面需求的场景,比如:插入日志、性能测试、事务处理、缓存、权限校验等场景。装饰器是解决这类问题的绝佳设计,有了装饰器,我们就可以抽离出大量与函数功能本身无关的雷同代码并继续重用。
修饰器的具体操作,我们来慢慢学习。
在使用修饰器之前,我们得记住几个关于修饰器的使用说明:
(1)修饰器的关键字是 @ ,Python代码中只要出现了它,你就可以想到是修饰器了。
(2)修饰器修饰的是函数或者是方法,不能修饰一个类。
(3)修饰器必须出现在被修饰函数或者方法的前一行,不能够将修饰器定义在函数的同行。
例子:
虽然修饰器本身是一个函数,但它的出现是有规定的,我上面的修饰器就没有出现在被修饰函数或者方法的前1行,所以连 print(“龙叔”) 这一行代码都执行不了。
(4)修饰器本身是一个函数,将被修饰的函数作为参数,传递给修饰器,执行修饰器中功能,返回传递进来的函数对象,调用返回出来的函数。
这几个点很重要,下面我们通过修饰器的多种使用方式来加深理解。
如果被修饰的函数不调用,则执行@后面的函数,并把被修饰的函数当做参数传递过去了,则修饰器函数的返回值可以是任意值。
例子:
def dec(a): #修饰器函数
print(a) #看一下形参传了什么
print("helloworld")
return None
@dec #使用修饰器
def funA(): #被修饰的函数
pass
运行结果:
helloworld
首先我们可以看出来,这就是很简单的一个修饰器的使用例子,用 @dec 来调用dec()修饰器函数,而被修饰的函数funA()是没有进行什么操作的。
其次我们再看,被修饰的函数funA()不调用什么,但却被当做参数传递给了修饰器函数dec(),所以dec()需要一个形参来接受传递值,我用的是a作为形参,如果你去掉a的话,系统就会报错,因为被修饰的函数funA()返回的值没有东西接受,你可以试试。
最后还有1点,被修饰函数funA()并没有被调用,注意到了吗?所以修饰器函数dec()返回什么都可以,上面返回的是None,你返回一个“有病”也可以的,返回什么都可以的,下面我们再看被修饰函数 funA() 被调用的情况。
如果被修饰的函数调用了,直接执行修饰器,并把被修饰的函数当做参数专递给修饰器,但是修饰器的返回值必须是当前参数。
例子:
def dec(a):
print(a)
print("helloworld")
return "有病"
@dec #使用修饰器函数
def funA():
pass
funA() #调用被修饰函数
运行结果:
helloworld
Traceback (most recent call last):
File "E:Python-learn可迭代对象修饰器修饰器_test.py", line 11, in
funA()
TypeError: 'str' object is not callable
出现错误了,说字符串str不能被迭代,为什么?其实原因就是有修饰器存在并使用的情况下,被修饰函数又被调用了,这个时候返回值就不能是任意值了,此时的修饰器函数只能返回传递值,你可以试试把 return “有病” 改成 return a 就可以正常输出了,又或者你去掉 funA() 这一行代码,不调用被修斯函数,则输出也是正常的。
def dec(a):
print(a)
print("helloworld")
return a
@dec
def funA():
pass
funA()
运行结果:
helloworld
一切正常。
我们再来看看修饰器的执行逻辑是怎么样的:
def dec(a):
print(a)
print("修饰器函数")
return a
@dec
def funA():
print("被修饰函数")
funA()
print("龙叔")
运行结果:
修饰器函数
被修饰函数
龙叔
从这个运行结果我们可以看出修饰器的运行逻辑是:被修饰的函数 funA() 被调用了,但却没有被直接执行,而是直接执行修饰器dec,并把被修饰的函数 funA() 当做参数专递给修饰器dec,执行修饰函数dec()里面的代码,返回传递值a后才执行的被修饰函数funA()里面的代码,最后走完了被修饰函数funA() 才执行剩余的代码。
我用个比较草一点的图来表示一下:
前面我们讲过了修饰器的基本使用方式,修饰器的使用方式很多,还可以使用函数嵌套的方式。
用个简单例子来演示一下:
def A(x): #修饰器函数
def B(): #修饰器函数里面嵌套的函数
print("B")
B()
return x
@A #使用修饰器
def C(): #被修饰函数
print("C")
C() #调用被修饰函数
运行结果:
B
C
从运行结果来看,被修饰函数里面也是可以进行函数嵌套的。
闭包的也是属于函数里的一种,只是比较特殊,关于闭包的知识我这里就不复述了,在【Python基础】里面我们有讲过关于闭包的知识,忘了的可以去看看或者百度一下,我们来看看修饰器里面的闭包是怎么使用的。
def A(x):
def B():
print("B")
return x() # C 无差别调用只能一层,这里是无法通过x调用
return B
@A
def C():
print("C")
C()
运行结果:
B
C
可以看出在修饰器函数中,闭包也是可以正常使用的。
如果被修饰的函数有参数传递,参数只能传给修饰器函数里面的内嵌函数。
def A(x): #修饰器函数
print(x)
def B(aa, bbb): # 内嵌函数,接收被修饰函数传递的参数
print("B")
print(aa, bbb)
return x(aa, bbb) # C
return B
@A
def C(n, nn): #被修饰函数
print("C")
C("10", "20")
运行结果:
B
10 20
C
可以看出来,虽然被修饰函数 C()传递了参数给修饰器函数 A() ,但是默认传递的还是C()这个对象,修饰器函数A()接受的还是被修饰函数C(),参数传到了修饰器函数A()里面的函数B()。
就算你在A()里面加两个形参,它也接受不了,只会报错,前面在修饰器的使用说明我们已经说了,“被修饰的函数作为参数,传递给修饰器”,所以修饰器函数接受的只是被修饰函数这个对象,其他如果要传递参数,那么修饰器函数里面就就得有其他函数来接受传递的参数。
如果修饰器有参数但被修饰函数却没有参数的情况下,只能使用内嵌函数来收取参数。
def fun(a=20):
print(a)
def c(bb):
print(bb)
return bb # 可以无差别调用,因为是在第二层才接收的funB,相当于第一层
return c
@fun(30)
def funB():
print("xixixi")
funB()
运行结果:
30
xixixi
前面我们所讲的都是我们自定义的修饰器,在Python中是有内置的修饰器,我们来学习一下常见的三种Python内置修饰器:staticmethod,classmethod,property。
它们的作用就是把类中的方法变为静态方法,包括类的类属性和类方法,具体的使用,我们来简单的看一下。
property可以将方法变为属性,被修饰的方法名必须和property下方的方法名一样,property只能用于私有属性。
我们来做一个对比,我们在不使用property的情况下,创建一个类并使用类里面的方法,是这样的:
class A:
def __init__(self):
self.age = 20 #实例属性
def getattr(self): #打印实例属性
print(self.age)
def setattr(self,newage): #给实例属性赋值
self.age = newage
a = A()
a.setattr(30)
a.getattr()
运行结果:
30
没有什么问题,运行结果正常,那我们用内置修饰器property来试试看有何不同。
在使用内置修饰器property之前,我们得补充一个点:私有属性,在函数内部创建的属性是私有属性,在不经过特殊处理之前,无法在函数外部使用,私有属性前面加两个下划线表示,比如类里面的__name就表示私有属性,我们通过一个简单的例子来看看:
可以看出来,私有属性在类内部是可以进行访问的,在外部是不行的(做了一些处理之后是可以访问的,这里就不介绍了,可以网上查一下)。
回到我们的内置修饰器property,在前面不使用property的例子中,我们做一下修改,加入内置修饰器property。
class A:
def __init__(self):
self.__age = 20
@property
def age(self): #被修饰的方法
return self.__age
@age.getter
def age(self): #被修饰的方法
return self.__age
@age.setter
def age(self, newage): #被修饰的方法
self.__age = newage
a = A()
a.age = 200
print(a.age)
运行结果:
200
从这个例子我们可以看出,内置修饰器property是可以用于私有属性,并且可以将方法变为属性,比如a.age就是在调用属性而不是方法了,在类中虽然多次出现了age()这个方法但却没有因为方法覆盖而报错,也是因为property的存在,property规定了被修饰的方法名必须和property下方的方法名一样。
内置修饰器staticmethod是一个静态方法,功能是将被修饰的方法从类中抽离出来,成为独立的函数,该函数不能访问类的属性。
我们先写一个简单的类,通过使用与不使用staticmethod来做一个对比,不使用的情况下
class B:
def __init__(self, name):
self.name = name
def eat(self): # 打印传递的值
print(self.name)
b = B("龙叔")
b.eat()
运行结果:
龙叔
这个没有什么问题,再来看看使用了staticmethod,直接加上看看:
报错了,原因就是加上了@staticmethod 后,eat()这个方法就变成了一个普通的函数,它的位置虽然在类里面,但实际上却相当于一个普通的函数,并不是类的方法了,所以你得给它传递一个值,不然形参self就没有值传递从而报错了。
正确的写法应该是:
我们来总结一下这个staticmethod 静态方法:
1. 这个函数是一个普通函数,只有这个类能用
2. 静态方法可以设置参数,也可以不需要参数了(self)
3. 该函数不能访问类的属性
被classmethod修饰的方法,与实例方法的区别是接收的第一个参数不是self,而是cls(当前类的具体类型),被修饰的方法无法访问实例属性,但是可以访问类属性。
class B:
age = 10
def __init__(self, name):
self.name = name
def sleep(self): #打印
print(self)
@classmethod
def eat(cls): # 被修饰的函数
print(cls) #看看传递的是类还是值
print(cls.age) #访问类的属性
print(self.name) #访问实例对象的属性
b = B("龙叔")
b.sleep()
b.eat()
运行结果:
<__main__.B object at 0x0000024FD7B3CFA0>
10
Traceback (most recent call last):
File "D:pythonProject1专题2.py", line 21, in
b.eat()
File "D:pythonProject1专题2.py", line 14, in eat
print(self.name)
NameError: name 'self' is not defined
通过结果可以看出,从sleep()和eat() 打印的对象来看,sleep()传递的对象是创建的实例对象b,而被修饰器修饰的函数eat()传递的是类;从eat()访问类的属性和实例属性来看,访问类的属性是没有问题的,但访问实例对象的属性时就报错了。
所以验证了前面讲的:被classmethod修饰的方法,与实例方法的区别是接收的第一个参数不是self,而是cls(当前类的具体类型),被修饰的方法无法访问实例属性,但是可以访问类属性。
~
运行结果:
<__main__.B object at 0x0000024FD7B3CFA0>
10
Traceback (most recent call last):
File "D:pythonProject1专题2.py", line 21, in
b.eat()
File "D:pythonProject1专题2.py", line 14, in eat
print(self.name)
NameError: name 'self' is not defined
通过结果可以看出,从sleep()和eat() 打印的对象来看,sleep()传递的对象是创建的实例对象b,而被修饰器修饰的函数eat()传递的是类;从eat()访问类的属性和实例属性来看,访问类的属性是没有问题的,但访问实例对象的属性时就报错了。
所以验证了前面讲的:被classmethod修饰的方法,与实例方法的区别是接收的第一个参数不是self,而是cls(当前类的具体类型),被修饰的方法无法访问实例属性,但是可以访问类属性。
今天的分享就到这里,欢迎大家在评论区留言交流!
深知大多数初中级Java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则近万的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《Java开发全套学习资料》送给大家,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
小编已加密:aHR0cHM6Ly9kb2NzLnFxLmNvbS9kb2MvRFVrVm9aSGxQZUVsTlkwUnc==出于安全原因,我们把网站通过base64编码了,大家可以通过base64解码把网址获取下来。