大家好,我是卷心菜。因为项目的需要,最近在学习Python的爬虫。这一篇是关于Python的基础知识点,也是学习爬虫的入门知识点!如果您看完文章有所收获,可以三连支持博主哦~,嘻嘻。
函数 | 功能 |
---|---|
len | 可以获取字符串的长度 |
find | 查找指定内容在字符串中是否存在,如果存在就返回该内容在字符串中第一次出现的开始位置索引值,如果不存在,则返回-1. |
startswith | 判断字符串是否以XXX开头 |
endswith | 判断字符串是否以XXX结尾 |
count | 返回 str在start和end之间 在 mystr里面出现的次数 |
replace | 替换字符串中指定的内容,如果指定次数count,则替换不会超过count次 |
split | 通过参数的内容切割字符串 |
upper | 将字符串转化为大写 |
lower | 将字符串转化为小写 |
strip | 去空格 |
join | 字符串拼接 |
说了这么多函数,接下来用代码举例实践实践:
country = 'China'
print(len(country)) # 5
print(country.find('C')) # 0
print(country.find('in')) # 2
print(country.find('inc')) # -1
print(country.find('e')) # -1
print(country.startswith('C')) # True
print(country.startswith('c')) # False
print(country.endswith('a')) # True
print(country.endswith('A')) # False
message = 'aabbccc'
print(message.count('c')) # 3
print(message.count('c', 0, 5)) # 1
print(message.replace('c','d')) # aabbddd
print(message.replace('c','d',2)) # aabbddc
print(message.split('c')) # ['aabb', '', '', '']
print(country.upper()) # CHINA
print(country.lower()) # china
information = ' space '
print(information.strip()) # space
print(len(information.strip())) # 5
news = 'abc'
print('-'.join(news)) # a-b-c
添加元素的使用
函数 | 功能 |
---|---|
append | 在末尾添加元素 |
insert | 在指定位置插入元素 |
extend | 合并两个列表 |
代码举例实践:
time_list = ['早上', '中午', '傍晚']
time_list.append('夜晚')
print(time_list) # ['早上', '中午', '傍晚', '夜晚']
time_list.insert(1, '晌午')
print(time_list) # ['早上', '晌午', '中午', '傍晚', '夜晚']
time_list1 = ['午夜', '凌晨']
time_list.extend(time_list1)
print(time_list) # ['早上', '晌午', '中午', '傍晚', '夜晚', '午夜', '凌晨']
删除元素的使用
函数 | 功能 |
---|---|
del | 根据下标进行删除 |
pop | 删除最后一个元素 |
remove | 根据元素的值进行删除 |
代码举例实践:
del time_list[0]
print(time_list) # ['晌午', '中午', '傍晚', '夜晚', '午夜', '凌晨']
time_list.pop()
print(time_list) # ['晌午', '中午', '傍晚', '夜晚', '午夜']
time_list.remove('午夜')
print(time_list) # ['晌午', '中午', '傍晚', '夜晚']
修改元素的使用
修改元素是通过指定下标来访问列表元素,为指定的列表下标赋值即可
time_list[0] = '早上'
print(time_list) # ['早上', '中午', '傍晚', '夜晚']
查找元素的使用
所谓的查找,就是看看指定的元素是否存在,主要包含两个方法:
函数 | 功能 |
---|---|
in | 存在结果为true,否则为false |
not in | 不存在结果为true,否则为false |
代码举例实践:
time = input('请输入你选择的时间:')
if time in time_list:
print('你选择的时间允许')
else:
print('你选择的时间不允许')
if time not in time_list:
print('你选择的时间不允许')
else:
print('你选择的时间允许')
运行结果:
元组的元素不能修改
,包括不能删除其中的元素代码举例实践:
number_tuple = (1, '2', 'cabbage')
print(number_tuple)
print(number_tuple[2])
# del number_tuple[0] 不允许删除
# 报错:TypeError: 'tuple' object doesn't support item deletion
message = input('请输入名称:')
if message in number_tuple:
print('在元组范围内')
else:
print('不在元组范围内')
运行结果:
需要注意的是:当我们只定义一个元素的元组,需要在唯一的元素后面写一个逗号
# 定义只有一个元素的元组,需要在唯一的元素后写一个逗号
a = (12)
print(type(a)) # int类型
b = (12,)
print(type(b)) # tuple类型
字符串
、列表
、元组
都支持切片操作语法:
[起始:结束:步长],也可以简化使用 [起始:结束]注意:
选取的区间从"起始"位开始,到"结束"位的前一位结束(不包含结束位本身),步长表示选取间隔代码举例实践:
message = 'HelloWorld'
print(message)
print(message[4]) # 第五个位置上的字符
print(message[:4]) # 第五个位置前的所有元素
print(message[1:]) # 第二个位置在内后的所有元素
print(message[1:4]) # 范围[第二个位置,第五个位置)
print(message[1:9:2]) # 步长为2
运行结果:
查看元素
除了使用key查找数据,还可以使用get来获取数据
information = {'name': 'cabbage', 'age': 21, 'major': '计算机科学与技术'}
print(information['major'])
# print(information['sex']) 当没有key时,会报错
print(information.get('name'))
print(information.get('sex')) # 当没有key时,默认为None
print(information.get('sex','man')) # 当没有key时,自定义默认为man
运行结果:
修改元素
字典的每个元素中的数据都是可以修改的,只要通过key即可修改
print('修改之前%s' % information)
information['major'] = '软件工程'
print('修改之后%s' % information)
运行结果:
添加元素
如果在使用 变量名['键'] = 数据
时,这个“键”在字典中,不存在,那么就会新增这个元素
information['sex'] = 'Man' # 为不存在的key赋值就是添加
print(information)
删除元素
主要有两种操作:del和clear()
# 删除单个元素
del information['sex']
print(information)
# 删除整个字典
# del information 报错,整个字典删除
# 清空字典
information.clear()
print(information)
遍历元素
主要有四种遍历方式:遍历key、遍历value、遍历项以及遍历键值对
# 遍历key
for key in information.keys():
print(key)
# 遍历value
for value in information.values():
print(value)
# 遍历项
for item in information.items():
print(item)
# 遍历键值对
for key, value in information.items():
print('key=%s,value=%s' % (key,value))
运行结果:
感谢阅读,一起进步,嘻嘻~