图形绘制的代码:链接:https://pan.baidu.com/s/1pgS60sry6XDILIhth8bAvA?pwd=abcd
提取码:abcd
sort_index()方法在指定轴上根据索引进行排序,默认升序
sort_values()方法在指定轴上根据数值进行排序,默认升序
Series.sort_values(axis = 0, ascending = True)
DataFrame.sort_values(by, axis = 0, ascending = True)
by: axis轴上的某个索引或索引列表
NaN统一放到排序末尾
适用于Series和DataFrame类型
适用于Series类型
适用于Series和DataFrame类型
适用于Series和DataFrame类型,滚动计算(窗口计算)
两个事物,表示为X和Y,如何判断它们之间的存在相关性?
X增大,Y增大,两个变量正相关
X增大,Y减小,两个变量负相关
X增大,Y不变,两个变量不相关
协方差>0,X和Y正相关
协方差<0,X和Y负相关
协方差=0,X和Y独立无关
Pearson相关系数
r的取值范围 [-1,1]
0.8-1.0极强相关
0.6-0.8强相关
0.4-0.6中等强度相关
0.2-0.4弱相关
0.0-0.2极弱相关或不相关
常见的图表类型
Series的plot方法参数
DataFrame的plot方法参数
【例】在pandas中使用Series绘制线性图,代码如下。
from pandas import DataFrame,Series
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
s = pd.Series(np.random.randn(10).cumsum(), index=np.arange(0, 100, 10))
s.plot()
plt.show()
【例】在pandas中使用DataFrame绘制线性图,代码如下。
from pandas import DataFrame,Series
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.randn(10, 4).cumsum(0),
columns=['A', 'B', 'C', 'D'],
index=np.arange(0, 100, 10))
df.plot()
plt.show()
plot.bar()
【例】在pandas中使用Series绘制柱状图,代码如下。
from pandas import DataFrame,Series
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
fig, axes = plt.subplots(2, 1)
data = pd.Series(np.random.rand(16), index=list('abcdefghijklmnop'))
data.plot.bar(color='r', alpha=0.7) # 垂直柱状图
plt.show()
【例】在pandas中使用Series中绘制条形图,代码如下。
from pandas import DataFrame,Series
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
fig, axes = plt.subplots(2, 1)
data = pd.Series(np.random.rand(16), index=list('abcdefghijklmnop'))
data.plot.barh(color=‘r’, alpha=0.7) # 条形图
plt.show()
【例】在pandas中使用DataFrame绘制柱状图,代码如下。
from pandas import DataFrame,Series
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(4, 4),
index=['one', 'two', 'three', 'four'],
columns=pd.Index(['A', 'B', 'C', 'D'], name='bar'))
df.plot.bar()
plt.show()
plot.hist()
【例】在pandas中绘制直方图,代码如下。
from pandas import DataFrame,Series
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from numpy.random import randn
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),}, columns=['a', 'b'])
df.plot.hist(bins=20)
plt.show()
plot.scatter()
【例】在pandas中绘制散点图,代码如下。
plot.pie()
【例】在pandas中绘制饼图,代码如下。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.Series(3*np.random.rand(4),index = list('ABCD'))
df.plot.pie(subplots = True)
plt.show()
plot.area()
【例】在pandas中绘制面积图,代码如下。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(8,4),columns = list('ABCD'))
df.plot.area()
plt.show()
plot.box()
【例】在pandas中绘制盒须图,代码如下。
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.DataFrame(np.random.rand(8,4),columns = list('ABCD'))
df.plot.box()
plt.show()