找回密码
 立即注册
查看: 2579|回复: 2

Biostatistics with R下载

[复制链接]
发表于 2013-2-15 13:44:28 | 显示全部楼层 |阅读模式
1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Statistical Methods in the Context of Scientific Studies . . . . . . . 1
1.2 Sampling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Observational Studies and Experiments . . . . . . . . . . . . . . . 4
1.4 DataExplorationandAnalysis . . . . . . . . . . . . . . . . . . . 5
1.5 Statistical Inference . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.6 Computation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.6.1 Using R-Commander . . . . . . . . . . . . . . . . . . . . 6
1.6.2 UsingR . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.7.1 MoreonSampling . . . . . . . . . . . . . . . . . . . . . . 11
1.7.2 More on Observational Studies . . . . . . . . . . . . . . . 12
1.7.3 More on Experiments . . . . . . . . . . . . . . . . . . . . 13
1.7.4 Cross-Sectional, Longitudinal, and Time Series Data . . . . 14
1.8 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2 Data Exploration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1 DataVisualizationandSummaryStatistics . . . . . . . . . . . . . 17
2.2 Variable Types . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 ExploringCategoricalVariables . . . . . . . . . . . . . . . . . . . 20
2.3.1 Relative Frequency and Percentage . . . . . . . . . . . . . 21
2.3.2 BarGraph . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3.3 PieChart . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4 ExploringNumericalVariables . . . . . . . . . . . . . . . . . . . 25
2.4.1 Histograms . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.4.2 MeanandMedian . . . . . . . . . . . . . . . . . . . . . . 32
2.4.3 Variance and Standard Deviation . . . . . . . . . . . . . . 34
2.4.4 Quantiles . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.5 Boxplots . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.5 DataPreprocessing . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.5.1 MissingData . . . . . . . . . . . . . . . . . . . . . . . . . 40
xi
xii Contents
2.5.2 Outliers . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.5.3 DataTransformation . . . . . . . . . . . . . . . . . . . . . 43
2.5.4 Creating New Variable Based on Two or More Existing
Variables . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5.5 CreatingCategories forNumericalVariables . . . . . . . . 45
2.6 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.6.1 CoefficientofVariation . . . . . . . . . . . . . . . . . . . 46
2.6.2 ScalingandShiftingVariables . . . . . . . . . . . . . . . . 48
2.6.3 Variable Standardization . . . . . . . . . . . . . . . . . . . 50
2.6.4 DataExplorationwithRProgramming . . . . . . . . . . . 51
2.7 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3 Exploring Relationships . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.1 Visualizing and Summarizing Relationships Between Variables . . 61
3.2 Relationships Between Two Numerical Random Variables . . . . . 61
3.3 RelationshipsBetweenCategoricalVariables . . . . . . . . . . . . 69
3.4 RelationshipsBetweenNumerical andCategoricalVariables . . . . 73
3.5 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.6 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4 Probability . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.1 Probability as a Measure of Uncertainty . . . . . . . . . . . . . . . 83
4.2 SomeCommonlyUsedGeneticTerms . . . . . . . . . . . . . . . 83
4.3 The Sample Space . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.4 Probability Measure . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.5 Complement,Union, andIntersection . . . . . . . . . . . . . . . . 87
4.5.1 Complement . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.5.2 Union . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.5.3 Intersection . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.5.4 Joint vs. Marginal Probability . . . . . . . . . . . . . . . . 91
4.6 DisjointEvents . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
4.7 Conditional Probabilities . . . . . . . . . . . . . . . . . . . . . . 93
4.8 The Law of Total Probability . . . . . . . . . . . . . . . . . . . . 95
4.9 Independent Events . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.10 Bayes’ Theorem . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.10.1 Application of Bayes’ Theorem in Medical Diagnosis . . . 99
4.10.2 Bayesian Statistics . . . . . . . . . . . . . . . . . . . . . . 101
4.11 Interpretation of Probability as the Relative Frequency . . . . . . . 101
4.12 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.12.1 Using Tree Diagrams to Obtain Joint Probabilities . . . . . 103
4.12.2 Making Decisions under Uncertainty . . . . . . . . . . . . 105
4.13 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5 Random Variables and Probability Distributions . . . . . . . . . . . 109
5.1 Random Variables . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.2 Discrete vs. Continuous . . . . . . . . . . . . . . . . . . . . . . . 110
5.3 Probability Distributions . . . . . . . . . . . . . . . . . . . . . . . 111
Contents xiii
5.4 Discrete Probability Distributions . . . . . . . . . . . . . . . . . . 112
5.4.1 BernoulliDistribution . . . . . . . . . . . . . . . . . . . . 113
5.4.2 BinomialDistribution . . . . . . . . . . . . . . . . . . . . 115
5.4.3 PoissonDistribution . . . . . . . . . . . . . . . . . . . . . 119
5.5 Continuous Probability Distributions . . . . . . . . . . . . . . . . 121
5.5.1 Probability Density Curves and Density Histograms . . . . 124
5.5.2 NormalDistribution . . . . . . . . . . . . . . . . . . . . . 125
5.5.3 Student’s t-distribution . . . . . . . . . . . . . . . . . . . . 130
5.6 Cumulative Distribution Function and Quantiles . . . . . . . . . . 131
5.7 Scaling and Shifting Random Variables . . . . . . . . . . . . . . . 134
5.8 Sum of Two Random Variables . . . . . . . . . . . . . . . . . . . 135
5.9 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
5.9.1 More on Probability Distributions . . . . . . . . . . . . . . 137
5.9.2 Some Other Commonly Used Probability Distributions . . 138
5.9.3 Quantile–Quantile Plots . . . . . . . . . . . . . . . . . . . 142
5.9.4 Probability Distributions with R Programming . . . . . . . 143
5.10 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
6 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
6.1 ParameterEstimation . . . . . . . . . . . . . . . . . . . . . . . . 151
6.2 PointEstimation . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
6.2.1 Population Mean . . . . . . . . . . . . . . . . . . . . . . . 152
6.2.2 Population Variance . . . . . . . . . . . . . . . . . . . . . 154
6.3 SamplingDistribution . . . . . . . . . . . . . . . . . . . . . . . . 156
6.4 Confidence Intervals for the Population Mean . . . . . . . . . . . 158
6.5 Confidence Interval When the Population Variance Is Unknown . . 162
6.6 Using Central Limit Theorem for Confidence Interval . . . . . . . 163
6.7 Confidence Intervals for the Population Proportion . . . . . . . . . 166
6.8 MarginofError . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
6.9 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
6.9.1 Deriving Confidence Intervals . . . . . . . . . . . . . . . . 168
6.9.2 SampleSizeEstimation . . . . . . . . . . . . . . . . . . . 169
6.10 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
7 Hypothesis Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
7.2 Hypothesis Testing for the Population Mean . . . . . . . . . . . . 174
7.3 Statistical Significance . . . . . . . . . . . . . . . . . . . . . . . . 176
7.3.1 z-Tests of the Population Mean . . . . . . . . . . . . . . . 177
7.3.2 Interpretation of p-value . . . . . . . . . . . . . . . . . . . 178
7.3.3 One-Sided Hypothesis Testing . . . . . . . . . . . . . . . 181
7.3.4 Two-Sided Hypothesis Testing . . . . . . . . . . . . . . . 183
7.4 Hypothesis Testing Using t-tests . . . . . . . . . . . . . . . . . . 184
7.5 Hypothesis Testing for Population Proportion . . . . . . . . . . . . 186
7.6 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
7.6.1 Test of Normality . . . . . . . . . . . . . . . . . . . . . . 188
xiv Contents
7.6.2 Hypothesis Testing with R Programming . . . . . . . . . . 188
7.7 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
8 Statistical Inference for the Relationship Between Two Variables . . 193
8.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
8.2 Relationship Between a Numerical Variable and a Binary Variable . 193
8.2.1 Two-Sample t -tests for Comparing the Means . . . . . . . 197
8.2.2 Pooled t-test . . . . . . . . . . . . . . . . . . . . . . . . . 203
8.2.3 Paired t-test . . . . . . . . . . . . . . . . . . . . . . . . . 203
8.3 Inference about the Relationship Between Two Binary Variables . . 208
8.4 Inference Regarding the Linear Relationship Between Two
NumericalVariables . . . . . . . . . . . . . . . . . . . . . . . . . 211
8.5 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
8.5.1 Two-Sample t-testUsingR . . . . . . . . . . . . . . . . . 216
8.5.2 CorrelationTestUsingR . . . . . . . . . . . . . . . . . . 217
8.6 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
9 Analysis of Variance (ANOVA) . . . . . . . . . . . . . . . . . . . . . 221
9.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
9.2 Analysis of Variance (ANOVA) . . . . . . . . . . . . . . . . . . . 221
9.3 TheAssumptionsofANOVA . . . . . . . . . . . . . . . . . . . . 228
9.4 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
9.4.1 Two-WayANOVA . . . . . . . . . . . . . . . . . . . . . . 230
9.4.2 ANOVAUsingR . . . . . . . . . . . . . . . . . . . . . . 232
9.5 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
10 Analysis of Categorical Variables . . . . . . . . . . . . . . . . . . . . 235
10.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235
10.2 Pearson’s χ2 Test forOneCategoricalVariable . . . . . . . . . . . 236
10.2.1 BinaryVariables . . . . . . . . . . . . . . . . . . . . . . . 236
10.2.2 Categorical Variables with Multiple Categories . . . . . . . 239
10.3 Pearson’s χ2 Test of Independence . . . . . . . . . . . . . . . . . 240
10.4 Entering Contingency Tables into R-Commander . . . . . . . . . . 245
10.5 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
10.5.1 Fisher’s Exact Test . . . . . . . . . . . . . . . . . . . . . . 246
10.5.2 Pearson’s χ2 TestUsingR. . . . . . . . . . . . . . . . . . 248
10.6 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
11 Regression Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
11.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
11.2 Linear Regression Models with One Binary Explanatory Variable . 254
11.3 Statistical Inference Using Simple Linear Regression Models . . . 259
11.3.1 Confidence Interval for Regression Coefficients . . . . . . 261
11.3.2 Hypothesis Testing with Simple Linear Regression
Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263
11.4 Linear Regression Models with One Numerical Explanatory
Variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264
Contents xv
11.5 Goodness of Fit . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
11.6 Model Assumptions and Diagnostics . . . . . . . . . . . . . . . . 272
11.7 Multiple Linear Regression . . . . . . . . . . . . . . . . . . . . . 275
11.8 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
11.8.1 Interaction . . . . . . . . . . . . . . . . . . . . . . . . . . 282
11.8.2 Linear Regression Models in R . . . . . . . . . . . . . . . 285
11.9 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 288
12 Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
12.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
12.2 K-means Clustering . . . . . . . . . . . . . . . . . . . . . . . . . 293
12.3 HierarchicalClustering . . . . . . . . . . . . . . . . . . . . . . . 295
12.4 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297
12.4.1 Standardizing Variables Before Clustering . . . . . . . . . 297
12.4.2 ClusteringinR . . . . . . . . . . . . . . . . . . . . . . . . 298
12.5 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301
13 Bayesian Analysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
13.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
13.2 A Simple Case of Bayesian Analysis for Population Proportion . . 303
13.3 Prior and Posterior Probabilities . . . . . . . . . . . . . . . . . . . 305
13.4 The General Form of Bayesian Analysis for Population Proportion 306
13.5 Bayesian Inference . . . . . . . . . . . . . . . . . . . . . . . . . . 310
13.5.1 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . 310
13.5.2 Hypothesis Testing . . . . . . . . . . . . . . . . . . . . . . 311
13.6 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
13.7 Exercises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314
Appendix A Installing R and R-Commander . . . . . . . . . . . . . . . 317
A.1 Installing R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317
A.2 Installing R-Commander . . . . . . . . . . . . . . . . . . . . . . . 317
A.2.1 FromtheCommandLine . . . . . . . . . . . . . . . . . . 317
A.2.2 FromtheMenuBar . . . . . . . . . . . . . . . . . . . . . 318
A.3 Starting R-Commander . . . . . . . . . . . . . . . . . . . . . . . 319
Appendix B Basic R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
B.1 StartingwithR . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
B.2 CreatingObjects inR . . . . . . . . . . . . . . . . . . . . . . . . 324
B.3 Vectors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
B.4 Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332
B.5 DataFrames . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
B.5.1 Creating Data Frames Using a Spreadsheet-Like
Environment . . . . . . . . . . . . . . . . . . . . . . . . . 337
B.5.2 ImportingData fromTextFiles . . . . . . . . . . . . . . . 337
B.6 Lists . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
B.7 Loading Add-on Packages . . . . . . . . . . . . . . . . . . . . . . 340
B.8 Conditional Statements . . . . . . . . . . . . . . . . . . . . . . . 341

下载:
Biostatistics with R.rar (4.77 MB, 下载次数: 0, 售价: 5 )

备注:
很多人都有收集一堆资料而不看的习惯。为了有效利用资源,养成下载一本看一本的习惯,特设置了积分下载,请见谅。
多参加论坛的活动、多帮助别人,会很容易凑够积分的!
祝大家使用愉快!
回复

使用道具 举报

发表于 2014-5-19 14:20:44 | 显示全部楼层
大家免费多好啊
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-24 23:08 , Processed in 0.038166 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表