双变量相关分析根据变量的数据类型不同而不同。当数值数据和数值数据计算相关性时,指标为相关系数;数值数据和类别数据计算相关性时,指标为相关比;类别数据和类别数据计算相关性时,指标为克里姆相关系数。
按照变量的类型有三种分析相关性指标。
数值数据和数值数据计算相关性时,指标为相关系数
数值数据和类别数据计算相关性时,指标为相关比
类别数据和类别数据计算相关性时,指标为克里姆相关系数
数据为数值类型
现在假设我们有以下数据,求化妆品费和装置费(服装费)之间相关性
如下年龄为数值数据,品牌为类别数据。求”年龄“和”喜欢的服装品牌“之间相关性
计算:
整理上表,按每个类别分组
相关比的意义:
克里姆相关系数也可称为克莱姆的关联系数或独立系数
如下交叉表,性别为类别数据,希望的表白方式也为类别数据。求”性别“和”希望的表白方式“之间相关性
计算:
参考:
漫画统计学