Kendall(肯德尔)系数的定义为:n个同类的统计对象按特定属性排序,其他属性通常是乱序的。同序对(concordant pairs)和异序对(discordant pairs)之差与总对数(n*(n-1)/2)的比值。
背景说明:
在进行相关性分析时,我们通常关注变量之间的关联程度。这可以帮助我们理解变量之间的关系,从而更好地解释数据和预测未来的趋势。在这个问题中,我们对A1~A5这两个变量进行了相关性分析,目的是研究它们之间是否存在显著的相关性关系。-1到1。
分析结果如下所示:
由kendall_tau相关性分析可知
A1与A2之间的相关性分析结果不显著,不存在显著相关性关系(r=0.001,p=0.992>0.05)。 A1与A3之间的相关性分析结果显著,成显著正相关关系(r=0.533,p=0.000<0.05)。 A1与A4之间的相关性分析结果显著,成显著正相关关系(r=0.379,p=0.000<0.05)。 A1与A5之间的相关性分析结果显著,成显著正相关关系(r=0.277,p=0.005<0.05)。 A2与A3之间的相关性分析结果不显著,不存在显著相关性关系(r=0.170,p=0.080>0.05)。 A2与A4之间的相关性分析结果不显著,不存在显著相关性关系(r=0.101,p=0.298>0.05)。 A2与A5之间的相关性分析结果不显著,不存在显著相关性关系(r=-0.009,p=0.926>0.05)。 A3与A4之间的相关性分析结果显著,成显著正相关关系(r=0.477,p=0.000<0.05)。 A3与A5之间的相关性分析结果显著,成显著正相关关系(r=0.361,p=0.000<0.05)。 A4与A5之间的相关性分析结果显著,成显著正相关关系(r=0.221,p=0.023<0.05)。
同时SPSSMAX还提供另一个格式的相关性分析表格。
相关性分析的热力图输出:
在相关性热力图中,每个变量都表示为图表中的一个行和列。通过对角线上的单元格,我们可以看到每个变量与自身的相关性,这总是为1,因为一个变量与自身完全相关。
非对角线上的单元格反映了不同变量之间的相关性。颜色的深浅表示相关性的强度,通常使用颜色渐变来表示。通常,较深的颜色(如深蓝色)表示较强的正相关性,而较浅的颜色(如浅蓝色)表示较强的负相关性。中间的颜色(如白色或浅黄色)表示相关性较弱或接近于零。
参考文献:
[1]林卓琛,张晋昕.基于非参数相关系数的心肌病自动诊断[J].中国医学物理学杂志,2021,038(1):80-85
[2]王彦敏,刘天浩,董晨磊,姚福艳.基于信息熵权—复相关系数法的煤层底板突水危险性评价[J].现代矿业,2021,037(2):173-177
[3]李玉水.随机变量的Kendall相关系数的推广[J].莆田学院学报,2009,016(005):15-17