import pandas as pd
# 创建 Series 对象
s = pd.Series([1, 2, 3, 4, 5])
print(s)
0 1
1 2
2 3
3 4
4 5
dtype: int64
# 创建 DataFrame 对象
df = pd.DataFrame({'列 1': [1, 2, 3, 4, 5], '列 2': [6, 7, 8, 9, 10]})
print(df)
列 1 列 2
0 1 6
1 2 7
2 3 8
3 4 9
4 5 10
import numpy as np
import pandas as pd
arr = np.array([[1, 2, 3], [4, 5, 6]])
df = pd.DataFrame(arr,index=["hang","zhou"],columns=["lie","zhou","ya"])
print(df)
lie zhou ya
hang 1 2 3
zhou 4 5 6
dropna()
函数,可以删除包含缺失值的行或列。例如:import pandas as pd
data = {'A': [1, 2, None, 4], 'B': [None, 2, 3, 4]}
df = pd.DataFrame(data)
# 删除包含缺失值的行
df_no_na = df.dropna()
# 删除包含缺失值的列
df_no_na = df.dropna(axis=1)
fillna()
函数,可以填充缺失值。可以使用指定的值、前一个值、后一个值、均值、中位数等方法。例如:import pandas as pd
data = {'A': [1, 2, None, 4], 'B': [None, 2, 3, 4]}
df = pd.DataFrame(data)
# 使用指定的值填充缺失值
df_filled = df.fillna(value=0)
# 使用前一个值填充缺失值
df_filled = df.fillna(method='ffill')
# 使用后一个值填充缺失值
df_filled = df.fillna(method='bfill')
# 使用均值填充缺失值
df_filled = df.fillna(method='mean')
import pandas as pd
# 创建一个 dataframe 对象
data = {'Category': ['A', 'B', 'A', 'B', 'A', 'B', 'A', 'A'],
'Value': [10, 20, 30, 40, 50, 60, 70, 80]}
df = pd.DataFrame(data)
# 使用 groupby() 函数进行分组
grouped = df.groupby('Category')
# 查看分组结果
for name, group in grouped:
print(name)
print(group)
A
Category Value
0 A 10
2 A 30
4 A 50
6 A 70
7 A 80
B
Category Value
1 B 20
3 B 40
5 B 60
import pandas as pd
# 创建一个 DataFrame
data = {'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]}
df = pd.DataFrame(data)
# 定义一个函数,用于将每个元素乘以 2
def multiply_by_2(x):
return x * 2
# 使用 apply 函数
result = df.apply(multiply_by_2)
print(result)
执行结果:
A B
0 2 10
1 4 12
2 6 14
3 8 16
import pandas as pd
# 创建一个数据框
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data)
# 创建透视表
pivot_table = pd.pivot_table(df, values='C', index='A', columns='B', aggfunc='sum')
print(pivot_table)
输出:
B sum
A
1 10 1100
2 20 2100
3 30 3100
4 40 4100
5 50 5100