目录
什么是数据集?
任何数据的集合就是数据集。
数据类型
数值数据是数字,主要分为两种:离散数据(discrete)和连续数据(continuous)。
分类数据是无法相互度量的值:yes/no。
序数数据类似于分类数据,但可以相互度量:A优于B的成绩。
下面我们给出一组数据如下:
data = [1,2,3,4,5,6,7,8,9,6,6,6]
均值(mean)
- import numpy as np
-
- data_mean = np.mean(data)
- data_mean
运行结果如下:
5.25
中值(median)
- data_median = np.median(data)
- data_median
运行结果如下:
6.0
众数(mode)
- from scipy import stats
- data_mode = stats.mode(data)
- data_mode
运行结果如下:
ModeResult(mode=array([6]), count=array([4]))