您好,欢迎访问三七文档
皮尔逊相关系数皮尔逊积矩相关系数,用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间,其中,1表示变量完全正相关,0表示无关,-1表示完全负相关。。两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差和标准差的商。假设有两个变量X、Y,那么两变量间的皮尔逊相关系数可通过以下公式计算:公式一:2)^(2^2^)(2^),(yynxxnyxxynYXCorr公式二:2)^(2)^())((),(YYXXYYXXYXCorr按照高中数学水平来理解,它很简单,可以看做将两组数据首先做Z分数处理之后,然后两组数据的乘积和除以样本数Z分数一般代表正态分布中,数据偏离中心点的距离.等于变量减掉平均数再除以标准差.(就是高考的标准分类似的处理)标准差则等于变量减掉平均数的平方和,再除以样本数,最后再开方.所以,根据这个最朴素的理解,我们可以将公式依次精简为:在python算法中,我们采用公式一对皮尔逊相关系数进行计算,步骤如下①得到X,Y的评分统计表,统计总的样本数N②分别X;Y;YX;2^2^YX和五个相关系数③根据公式二进一步求出皮尔逊相关系数并返回
本文标题:皮尔逊相关系数
链接地址:https://www.777doc.com/doc-5185805 .html