卡方检验,是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,包括两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。
卡方检验分为拟合度的卡方检验和卡方独立性检验。
在大数据运营场景中,通常用在某个变量(或特征)值是不是和因变量有显著关系。
通俗来讲:卡方检验就是检验两个变量之间有没有关系,
例如:
- 卡方检验可以检验男性或者女性对线上买生鲜食品有没有区别;
- 不同城市级别的消费者对买SUV车有没有什么区别;
检验某个连续变量的分布是否与某种理论分布相一致。例如是否符合正态分布,均匀分布,Poisson(泊松)分布
检验某个分类变量的各类的概率是否等于指定概率
检验某两个分类变量是否 相互独立
检测两种方法的检测结果是否一致
检测控制某种或某几种的变量后,另外两个分类变量是否相互独立。