#皮尔逊相关系数: 用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间
from scipy.stats import pearsonr x = [0.5, 0.4, 0.6, 0.3, 0.6, 0.2, 0.7, 0.5] y = [0.6, 0.4, 0.4, 0.3, 0.7, 0.2, 0.5, 0.6] print(pearsonr(x, y)) # 输出:(r, p) # r:相关系数[-1,1]之间 # p:相关系数显著性
相关性的强度确实是用相关系数的大小来衡量的,但相关大小的评价要以相关系数显著性的评价为前提
因此,要先检验相关系数的显著性,如果显著,证明相关系数有统计学意义,下一步再来看相关系数大小,如果相关系数没有统计学意义,那意味着你研究求得的相关系数也许是抽样误差或者测量误差造成的,再进行一次研究结果可
能就大不一样,此时讨论相关性强弱的意义就大大减弱了。【“The p-values are not entirely reliable but are probably reasonable for datasets larger than 500 or so.”,p-value在500个样本值以上有较高的可靠性】
在满足相关系数显著的条件下,相关系数越大,相关性就越强