|
有幸学习了吧友分享数据分析与R语言,其中有一个关于MINE分析的课程,感觉挺好的,就用MINE做了一个简单地分析了一个数据集。数据集为R自带的state.x77。
(1)这是MINE分析及结果:
> MINE("states.csv",1.)
X var Y var MIC (strength) MIC-p^2 (nonlinearity)
Murder Frost 0.45173 0.16133463
Murder Illiteracy 0.41321 -0.08096415
Murder Population 0.3212 0.20310968
Murder Income 0.27765 0.22471428
以上是截取的部分结果。以上MIC结果显示Frost与Illiteracy是与Murder联系较大的变量
(2)用简单地线性回归做了以下分析及结果:
> summary(lm(Murder~Illiteracy+Population+Frost+Income,data=states))
Call:
lm(formula = Murder ~ Illiteracy + Population + Frost + Income,
data = states)
Residuals:
Min 1Q Median 3Q Max
-4.7960 -1.6495 -0.0811 1.4815 7.6210
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.235e+00 3.866e+00 0.319 0.7510
Illiteracy 4.143e+00 8.744e-01 4.738 2.19e-05 ***
Population 2.237e-04 9.052e-05 2.471 0.0173 *
Frost 5.813e-04 1.005e-02 0.058 0.9541
Income 6.442e-05 6.837e-04 0.094 0.9253
> step(lm(Murder~Illiteracy+Population+Frost+Income,data=states),direction="backward")
Call:
lm(formula = Murder ~ Illiteracy + Population, data = states)
Coefficients:
(Intercept) Illiteracy Population
1.6515497 4.0807366 0.0002242
最后Illiteracy和Population是入选的因变量。与MINE结果有不同。
请问大家,这是为什么呢?是不是MINE虽是广义线性回归但是仍有应用条件?还是因为其他什么原因?
|
|