series=data['列名'].str.split(' ')
series=data['列名'].str.split(',',expand=True)
import pandas as pd
aa ='./data/TB2018.xlsx'
df = pd.DataFrame(pd.read_excel(aa))
series=df['收货地址'].str.split(' ',expand=True) # 使用split()方法分隔“收货地址”并创建列表
df['省']=series[0] # 提取列表中的省份数据
# 按省汇总金额
df1=df.groupby(["省"])["买家实际支付金额"].sum()
print(df1) # 输出结果
df.to_excel('test.xlsx') # 输出结果保存在Excel中
df.sort_values(by='图书名称',ascending=False)
df.sort_values(by=['图书名称','销量'])
df1=df.groupby(["类别"])["销量"].sum().reset_index()
df2=df1.sort_values(by='销量',ascending=False)
df.sort_values(by=0,ascending=False,axis=1)
df['销量'].rank(ascending=False)
df['销量'].rank(method="first",ascending=False)
df['销量'].rank(method="min",ascending=False)
df['销量'].rank(method="max",ascending=False)
import pandas as pd
aa =r'./data/fl4.xls'
df = pd.DataFrame(pd.read_excel(aa))
df2=df[['label1','label2']]
tuples = [tuple(x) for x in df2.values] # 使用列表推导式将转换为元组的DateFrame生成列表
print(tuples)