上期内容回顾上期介绍了双因素方差分析及结果可视化,双因素方差分析能够确定两因素及两个因素交互作用对结果的影响,而结果可视化能够将结果用图示的方法较为直观的展现出来,一面一起来回顾一下吧:
1. 双因素方差分析:数据格式改动,可以使用reshape包中的melt()函数改动数据格式,rename()函数改变变量名字,再直接调用aov()函数,并用summary()函数对结果进行总结;
2. 结果可视化:可以直接调用interaction.plot()函数,它提供了一个自变量在另一个自变量各个水平下的均值;gplots包中的plotmean()函数,该函数提供了数据的均值、标准误差以及样本大小,具体应用方法还请读者查看双因素方差分析一期内容。
温馨提示:如果您对此感到有些陌生,那就赶快翻开公众号历史消息温习一下,点击文章末尾“阅读原文”可见~温故而知新哦~
本期内容导读我们已经学习了方差分析中的单因素方差分析、双因素方差分析,本期将会对重复测量方差分析和多因素方差分析进行介绍。
■ 重复测量方差分析
重复测量即在日常研究中常需对一个观察单位重复进行多次测量,通常是在不同的时间点上或者不同的场合进行观测,这样会得到一个变量的多个观测值,由于观察值来自不同时间点或场合,因而它们之间不是独立的,如病人在治疗后的一天、两天……各个时间点上特定指标的变化。此处参考了《R语言实战》一书。
调用函数
aov(formula, data)
参数解释:formula,形如y~A*B+Error(Subject/B),A为组间因子,B为组内因子,y为因变量,subject为研究对象,data为数据在R中的名称。
示例
使用R中自带CO2数据集,它记录了来自于加拿大魁北克省和美国密西西比州两个地区各六种植物在6种CO2浓度下的二氧化碳吸收值。数据如下:
Q:经过冷冻处理的植物,植物的不同地区条件与二氧化碳浓度对二氧化碳吸收的影响。
A:显然数据集中二氧化碳的浓度为组内因子,而Type为组间因子,因此操作步骤如下
如图可见,组间差异显著,也即南北植物对于二氧化碳的吸收影响显著;组内差异显著,也即在不同二氧化碳浓度对于二氧化碳的吸收影响显著;此外,两因素的交互作用显著,说明南北植物在不同二氧化碳的浓度下对于二氧化碳的吸收变化幅度是不同的。
使用图示法,可以看得更清楚。
图上可以看出,Quebec的植物二氧化碳吸收值高于密西西比州的植物,随着二氧化碳浓度的升高,这种差距也在逐渐加大。
■ 多因素方差分析
多因素方差分析,即对一个独立变量是否受一个或多个因素或变量影响而进行的方差分析。
调用函数
aov(formula, data)
参数解释:formula表示var~var1+var2+……,var表示因变量,var1,var2,……表示自变量,data数据在R中的名称。
示例
使用R中自带npk数据集,它记录了实验田中氮磷钾对产量的影响。数据如下
Q:分析三种元素产量的影响。
A:由于这里试验田也可能存在影响,因此也应把它考虑在内。
图中可以看出,氮的含量对产量影响显著,钾的重要性次于氮,而磷相对来说,则没那么显著,除此之外,实验田也有较为显著的影响,但是实验田的不同的可能原因很多,无法明确。
拓展延伸:
关注我们—官方网站—
—官方QQ群—
R语言中文论坛-2(1000人群):427060123
R语言中文论坛(2000人群,已满):74076289
Biostatistician(500):186701945
—官方微博—
新浪微博:@R语言中文网官网
—官方微信—
微信名:R语言中文网 微信号:rchinanet
点击“阅读原文”温习上期“双因素方差分析及结果可视化”内容!喜欢就点个赞鼓励一下~