上期内容回顾上期介绍了协方差与相关系数,将R中常用的计算协方差、Pearson相关系数和Spearman相关系数,下面一起来回顾一下吧:
⊙ 计算协方差:直接调用cov()函数,可以得到变量之间相关差的方阵。
⊙ 计算相关系数:直接调用cor()函数,如果求Pearson相关系数,参数method需设置为pearson;如果求的是Spearman相关系数,参数method需设置为Spearman。
温馨提示:如果您对此感到有些陌生,那就赶快翻开公众号历史消息温习一下,点击文章末尾“阅读原文”可见~温故而知新哦~
本期内容导读知道了如何计算协方差与相关系数,相关系数的显著与涉及相关性检验。本期将会沿用上期数据集attitude。
数据展示:
讲解示例Question: [size=1em]求取总体评分(rating)与其他几个影响变量之间的相关系数,并进行显著性检验◎ 计算相关系数
使用cor()函数,具体使用方法在上期已经进行了详细的讲解,这里不在赘述。
◎ 相关系数显著性检验
调用函数:
cor.test(x, y, alternertive, method, conf.level)
参数解释:
x,y为所要检验的变量; alternative可以制定进行双侧检验(“two.sided”)或单侧检验(“greater”、“less”),可以使用首字母代替; method可以选择计算的相关类型(“pearson”、“kendall”或“spearman”); conf.level可以指定置信度。
使用示例:
按照α=0.05的标准来看,过于严苛(critical)与总体评分(rating)的相关系数为0.156,P>0.05,没有显著相关性;同样也可以看到抱怨(complaints)与总体评分(rating)的检验中,相关系数为0.825,P<0.05,有显著相关性。
但是cor.test()方法的一个缺陷是不能对多个变量同时进行检验,对此“psych”包中corr.test()函数提供了便利。
调用函数:
corr.test(x, y, use, method, adjust, alpha)
提示:需要先安装并加载psych包才能使用,另外要看清楚与之前的区别,切忌混淆。
参数解释:
参数 | 描述 |
x | 待检验变量,可以为矩阵或数据框 |
y | 同x,默认为NULL |
use | 指定缺失数据的方式。可选的方式为all.obs(假定不存在缺失数据——遇到缺失数据时将报错),everything(遇到缺失数据时,相关系数的计算结果将被设为missing)、complete.obs(行删除)以及pairwise(成对删除,也是默认情况) |
method | 制定计算方法,有pearson、spearman和kendall三种选择,默认为pearson |
adjust | 多重检验的判定方式,有“holm”、“Hochberg”、“hommel”、“bonferroni”、“BH”、“BY”、“fdr”和“none”几种方式,前四中主要用来控制多个显著性检验下的FWER错误,BH、BY、fdr用于控制FDR。默认情况为“holm”。 |
alpha | 置信度 |
使用范例:
图中显示了mydata中所有变量之间的相关系数及相关性检验,图中也可看到过于严苛(critical)、进步(advance)分别与总体评分(rating)之间的相关性检验的P值均为1,说明它们与总体评分(rating)之间统计意义上的相关度为0。
延伸拓展
⊙ State.x77数据集中提供了美国50个州在1977年的人口、收入等数据(使用?stat.x77对其进行了解),请将其导入R中,并进行相应分析来检验高中毕业率与收入、高中毕业率与犯罪(谋杀)等因素之间的关系。
⊙ 有兴趣的读者可以尝试用相关性检验的方式来检验从正态分布中抽取的10个样本的均值和其数列和的平方的相关性。
关注我们—官方网站—
—官方QQ群—
R语言中文论坛-2(1000人群):427060123
R语言中文论坛(2000人群,已满):74076289
Biostatistician(500):186701945
—官方微博—
新浪微博:@R语言中文网官网
—官方微信—
微信名:R语言中文网 微信号:rchinanet