1、发现数据中可能存在的错误和遗漏。
2、掌握数据的基本情况,获得进一步分析的灵感
对数据范围、中值、分散成都等进行探查
3、检查要执行的统计检验的假设是否成立。
许多统计检验对数据本身存在一定都要求(分布形态),需满足要求时,统计检验才有意义。
定义:典型例子,性别、种族、职业等。离散数据中,分有序变量(比如教育程度,可以有顺序排列),也有名义变量(比如性别、职业,无排序规则)。
探索性分析方法:构建频数表(占比)
定义:数值有具体的科学意义,并且可以在数轴上的某个范围连续取值。
探索性分析方法:平均数、中位数、方差、标准差、频率直方图