需求分析:
1.在本代码中,实现的功能为先合并两张子表,表一为主表,里面存在了姓名,然后表二根据表一中的'姓名'去进行匹配,补充信息
2.补充信息的时候,保留了一对多的情况
3.通过groupby进行补充数据,然后得到姓名里面的列,然后取出重复的姓名数
4.输出不同职务职称信息下的不同姓名的人数
代码如下:
import pandas as pd
# 读取第一张表格
table1 = pd.read_excel("table1.xlsx")
# 读取第二张表格
table2 = pd.read_excel("table2.xlsx")
# 合并两张表格,使用姓名作为连接键,保留一对多的情况
merged_table = pd.merge(table1, table2, on='姓名', how='left')
# 使用groupby来统计不同职务信息下的不同姓名人数
result = merged_table.groupby(['职务职称'])['姓名'].nunique()
# 输出结果
print("不同职务信息下的不同姓名人数:")
print(result)
重要知识点补充
nunique() 方法用于获取 'Team’列中所有唯一值的数量。