大家好,我是卷心菜。因为项目的需要,最近在学习Python的爬虫。这一篇是关于Python的基础知识点,也是学习爬虫的入门知识点!如果您看完文章有所收获,可以三连支持博主哦~,嘻嘻。

| 函数 | 功能 |
|---|---|
| len | 可以获取字符串的长度 |
| find | 查找指定内容在字符串中是否存在,如果存在就返回该内容在字符串中第一次出现的开始位置索引值,如果不存在,则返回-1. |
| startswith | 判断字符串是否以XXX开头 |
| endswith | 判断字符串是否以XXX结尾 |
| count | 返回 str在start和end之间 在 mystr里面出现的次数 |
| replace | 替换字符串中指定的内容,如果指定次数count,则替换不会超过count次 |
| split | 通过参数的内容切割字符串 |
| upper | 将字符串转化为大写 |
| lower | 将字符串转化为小写 |
| strip | 去空格 |
| join | 字符串拼接 |
说了这么多函数,接下来用代码举例实践实践:
country = 'China'
print(len(country)) # 5
print(country.find('C')) # 0
print(country.find('in')) # 2
print(country.find('inc')) # -1
print(country.find('e')) # -1
print(country.startswith('C')) # True
print(country.startswith('c')) # False
print(country.endswith('a')) # True
print(country.endswith('A')) # False
message = 'aabbccc'
print(message.count('c')) # 3
print(message.count('c', 0, 5)) # 1
print(message.replace('c','d')) # aabbddd
print(message.replace('c','d',2)) # aabbddc
print(message.split('c')) # ['aabb', '', '', '']
print(country.upper()) # CHINA
print(country.lower()) # china
information = ' space '
print(information.strip()) # space
print(len(information.strip())) # 5
news = 'abc'
print('-'.join(news)) # a-b-c

添加元素的使用| 函数 | 功能 |
|---|---|
| append | 在末尾添加元素 |
| insert | 在指定位置插入元素 |
| extend | 合并两个列表 |
代码举例实践:
time_list = ['早上', '中午', '傍晚']
time_list.append('夜晚')
print(time_list) # ['早上', '中午', '傍晚', '夜晚']
time_list.insert(1, '晌午')
print(time_list) # ['早上', '晌午', '中午', '傍晚', '夜晚']
time_list1 = ['午夜', '凌晨']
time_list.extend(time_list1)
print(time_list) # ['早上', '晌午', '中午', '傍晚', '夜晚', '午夜', '凌晨']
删除元素的使用| 函数 | 功能 |
|---|---|
| del | 根据下标进行删除 |
| pop | 删除最后一个元素 |
| remove | 根据元素的值进行删除 |
代码举例实践:
del time_list[0]
print(time_list) # ['晌午', '中午', '傍晚', '夜晚', '午夜', '凌晨']
time_list.pop()
print(time_list) # ['晌午', '中午', '傍晚', '夜晚', '午夜']
time_list.remove('午夜')
print(time_list) # ['晌午', '中午', '傍晚', '夜晚']
修改元素的使用修改元素是通过指定下标来访问列表元素,为指定的列表下标赋值即可
time_list[0] = '早上'
print(time_list) # ['早上', '中午', '傍晚', '夜晚']
查找元素的使用所谓的查找,就是看看指定的元素是否存在,主要包含两个方法:
| 函数 | 功能 |
|---|---|
| in | 存在结果为true,否则为false |
| not in | 不存在结果为true,否则为false |
代码举例实践:
time = input('请输入你选择的时间:')
if time in time_list:
print('你选择的时间允许')
else:
print('你选择的时间不允许')
if time not in time_list:
print('你选择的时间不允许')
else:
print('你选择的时间允许')
运行结果:

元组的元素不能修改,包括不能删除其中的元素代码举例实践:
number_tuple = (1, '2', 'cabbage')
print(number_tuple)
print(number_tuple[2])
# del number_tuple[0] 不允许删除
# 报错:TypeError: 'tuple' object doesn't support item deletion
message = input('请输入名称:')
if message in number_tuple:
print('在元组范围内')
else:
print('不在元组范围内')
运行结果:

需要注意的是:当我们只定义一个元素的元组,需要在唯一的元素后面写一个逗号
# 定义只有一个元素的元组,需要在唯一的元素后写一个逗号
a = (12)
print(type(a)) # int类型
b = (12,)
print(type(b)) # tuple类型
字符串、列表、元组都支持切片操作语法:[起始:结束:步长],也可以简化使用 [起始:结束]注意:选取的区间从"起始"位开始,到"结束"位的前一位结束(不包含结束位本身),步长表示选取间隔代码举例实践:
message = 'HelloWorld'
print(message)
print(message[4]) # 第五个位置上的字符
print(message[:4]) # 第五个位置前的所有元素
print(message[1:]) # 第二个位置在内后的所有元素
print(message[1:4]) # 范围[第二个位置,第五个位置)
print(message[1:9:2]) # 步长为2
运行结果:


查看元素除了使用key查找数据,还可以使用get来获取数据
information = {'name': 'cabbage', 'age': 21, 'major': '计算机科学与技术'}
print(information['major'])
# print(information['sex']) 当没有key时,会报错
print(information.get('name'))
print(information.get('sex')) # 当没有key时,默认为None
print(information.get('sex','man')) # 当没有key时,自定义默认为man
运行结果:

修改元素字典的每个元素中的数据都是可以修改的,只要通过key即可修改
print('修改之前%s' % information)
information['major'] = '软件工程'
print('修改之后%s' % information)
运行结果:

添加元素如果在使用 变量名['键'] = 数据 时,这个“键”在字典中,不存在,那么就会新增这个元素
information['sex'] = 'Man' # 为不存在的key赋值就是添加
print(information)
删除元素主要有两种操作:del和clear()
# 删除单个元素
del information['sex']
print(information)
# 删除整个字典
# del information 报错,整个字典删除
# 清空字典
information.clear()
print(information)
遍历元素主要有四种遍历方式:遍历key、遍历value、遍历项以及遍历键值对
# 遍历key
for key in information.keys():
print(key)
# 遍历value
for value in information.values():
print(value)
# 遍历项
for item in information.items():
print(item)
# 遍历键值对
for key, value in information.items():
print('key=%s,value=%s' % (key,value))
运行结果:

感谢阅读,一起进步,嘻嘻~