找回密码
 立即注册
查看: 2078|回复: 0

DNA microarray data analysis using R Bioconductor下载

[复制链接]
发表于 2013-2-15 08:25:40 | 显示全部楼层 |阅读模式
目录
I Introduction 15
1 Installation of R and Bioconductor 17
1.1 What are R and Bioconductor? . . . . . . . . . . . . . . 17
1.2 Downloading R . . . . . . . . . . . . . . . . . . . . . . 17
1.2.1 R installation instructions for Windows . . . . . . . 17
1.2.2 R installation instructions for UNIX and Linux . . . 18
1.2.3 Installation instructions for Bioconductor . . . . . . 19
1.2.4 Installing extra packages on any system . . . . . . . 20
1.2.5 Installing extra packages from ZIP files . . . . . . . 20
1.3 Graphical user interfaces . . . . . . . . . . . . . . . . . 21
1.3.1 TinnR . . . . . . . . . . . . . . . . . . . . . . . . . 21
2 Introduction to R language 23
2.1 Basics of R language and environment . . . . . . . . . . 23
2.1.1 Starting and closing R . . . . . . . . . . . . . . . . 23
2.1.2 Prompt . . . . . . . . . . . . . . . . . . . . . . . . 23
2.1.3 Help! . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.1.4 Commands . . . . . . . . . . . . . . . . . . . . . . 25
2.1.5 Environment . . . . . . . . . . . . . . . . . . . . . 27
2.1.6 Packages . . . . . . . . . . . . . . . . . . . . . . . 27
2.1.7 Changing the working directory . . . . . . . . . . . 28
2.2 R is an expanded calculator . . . . . . . . . . . . . . . . 28
2.2.1 Arithmetic . . . . . . . . . . . . . . . . . . . . . . 29
2.2.2 Mathematical functions . . . . . . . . . . . . . . . . 29
2.2.3 Logical arithmetic . . . . . . . . . . . . . . . . . . 29
2.2.4 Number of decimals . . . . . . . . . . . . . . . . . 30
10 DNA microarray data analysis using Bioconductor
2.3 Data input and output . . . . . . . . . . . . . . . . . . . 30
2.3.1 Allocation . . . . . . . . . . . . . . . . . . . . . . . 30
2.3.2 Typing in the data . . . . . . . . . . . . . . . . . . . 31
2.3.3 Reading tabular data . . . . . . . . . . . . . . . . . 31
2.3.4 Writing tabular data . . . . . . . . . . . . . . . . . 32
2.3.5 Saving output to a file . . . . . . . . . . . . . . . . 32
2.4 Calculations with vectors . . . . . . . . . . . . . . . . . 32
2.4.1 Arithmetic on vectors . . . . . . . . . . . . . . . . . 32
2.4.2 Mathematical operators for vectors . . . . . . . . . 32
2.5 Object types . . . . . . . . . . . . . . . . . . . . . . . . 33
2.5.1 Vector . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.5.2 Factor . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.5.3 Matrix . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.5.4 Data frame . . . . . . . . . . . . . . . . . . . . . . 36
2.5.5 S3/S4 class . . . . . . . . . . . . . . . . . . . . . . 37
2.6 Data manipulation . . . . . . . . . . . . . . . . . . . . . 37
2.6.1 Generating sequences of numbers . . . . . . . . . . 37
2.6.2 Generating repeats . . . . . . . . . . . . . . . . . . 37
2.6.3 Searching and replacing . . . . . . . . . . . . . . . 38
2.6.4 Merging tables . . . . . . . . . . . . . . . . . . . . 38
2.6.5 Transposition . . . . . . . . . . . . . . . . . . . . . 39
2.6.6 Sorting and ordering . . . . . . . . . . . . . . . . . 40
2.6.7 Missing values . . . . . . . . . . . . . . . . . . . . 41
2.7 Loops and conditional execution . . . . . . . . . . . . . 42
2.7.1 for-loop . . . . . . . . . . . . . . . . . . . . . . . . 42
2.7.2 if . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.7.3 if...else . . . . . . . . . . . . . . . . . . . . . . . . 43
2.8 Graphics . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.8.1 Plot, a general command . . . . . . . . . . . . . . . 45
2.8.2 Changing colors and symbols . . . . . . . . . . . . 47
2.8.3 Histogram . . . . . . . . . . . . . . . . . . . . . . . 49
2.8.4 Boxplot . . . . . . . . . . . . . . . . . . . . . . . . 49
2.8.5 Scatter plot . . . . . . . . . . . . . . . . . . . . . . 50
2.8.6 Panel plots . . . . . . . . . . . . . . . . . . . . . . 50
2.8.7 Other graphical settings . . . . . . . . . . . . . . . 51
2.8.8 Adding new objects to the plots . . . . . . . . . . . 55
Contents 11
2.8.9 Saving images . . . . . . . . . . . . . . . . . . . . 59
2.9 More information . . . . . . . . . . . . . . . . . . . . . 60
II Preprocessing 61
3 Importing DNA microarray data 63
3.1 Affymetrix data . . . . . . . . . . . . . . . . . . . . . . 63
3.1.1 Reading CEL-files . . . . . . . . . . . . . . . . . . 63
3.2 Agilent data . . . . . . . . . . . . . . . . . . . . . . . . 64
3.2.1 Reading two-color data files . . . . . . . . . . . . . 64
3.2.2 Reading one-color data files . . . . . . . . . . . . . 65
3.3 Illumina data . . . . . . . . . . . . . . . . . . . . . . . 66
3.3.1 Reading BeadStudio v1 data . . . . . . . . . . . . . 66
3.3.2 Reading BeadStudio v3 data . . . . . . . . . . . . . 67
4 Normalizing DNA microarray data 69
4.1 Normalizing Affymetrix data . . . . . . . . . . . . . . . 69
4.2 Normalizing Agilent data . . . . . . . . . . . . . . . . . 70
4.2.1 Two-color data . . . . . . . . . . . . . . . . . . . . 71
4.2.2 One-color data . . . . . . . . . . . . . . . . . . . . 71
4.3 Normalizing Illumina data . . . . . . . . . . . . . . . . 72
4.4 Getting the raw data . . . . . . . . . . . . . . . . . . . . 72
4.5 Saving the expression values . . . . . . . . . . . . . . . 73
5 Quality control 75
5.1 Checking Affymetrix data . . . . . . . . . . . . . . . . . 75
5.2 Checking Agilent data . . . . . . . . . . . . . . . . . . . 78
5.2.1 Two-color data . . . . . . . . . . . . . . . . . . . . 79
5.2.2 One-color data . . . . . . . . . . . . . . . . . . . . 81
5.3 Checking Illumina data . . . . . . . . . . . . . . . . . . 82
6 Filtering and differential expression 87
6.1 Why filtering? . . . . . . . . . . . . . . . . . . . . . . . 87
6.2 Filtering tools . . . . . . . . . . . . . . . . . . . . . . . 88
6.2.1 Standard deviation filter . . . . . . . . . . . . . . . 88
6.2.2 Expression filter . . . . . . . . . . . . . . . . . . . 88
6.3 Filtering after statistical testing . . . . . . . . . . . . . . 89
12 DNA microarray data analysis using Bioconductor
III Analysis 91
7 Statistical analyses 93
7.1 Key concepts . . . . . . . . . . . . . . . . . . . . . . . 93
7.1.1 Model matrix for a two-group comparison . . . . . . 93
7.1.2 Model matrix for a three-group comparison . . . . . 95
7.2 Analysis using a linear model . . . . . . . . . . . . . . . 96
7.2.1 Differential expression and p-values . . . . . . . . . 97
7.2.2 Extracting the genes from the original data . . . . . 98
8 Gene set enrichment analysis 99
8.1 Gene set enrichment analysis for GO categories . . . . . 99
8.2 Gene set enrichment analysis for KEGG pathways . . . . 101
8.3 Performing the gene set test . . . . . . . . . . . . . . . . 102
8.3.1 KEGG pathways . . . . . . . . . . . . . . . . . . . 102
8.3.2 GO categories . . . . . . . . . . . . . . . . . . . . . 104
8.3.3 Extracting the genes from a particular pathway . . . 105
9 Annotating a genelist 107
9.1 Generating the report . . . . . . . . . . . . . . . . . . . 107
10 Clustering and visualization 109
10.1 Heatmap . . . . . . . . . . . . . . . . . . . . . . . . . . 109
10.1.1 Constructing a heatmap . . . . . . . . . . . . . . . . 109
10.2 K-means clustering . . . . . . . . . . . . . . . . . . . . 111
10.2.1 Performing the K-means clustering . . . . . . . . . 112
10.2.2 How to find the optimal number of clusters? . . . . . 113
10.2.3 Visualizing the K-means clustering . . . . . . . . . 114
IV Extras 117
11 Estimating the sample size 119
11.1 Current knowledge . . . . . . . . . . . . . . . . . . . . 119
11.2 How to estimate the sample size? . . . . . . . . . . . . . 120
12 R at CSC 123
12.1 R is available in Murska . . . . . . . . . . . . . . . . . . 123
12.1.1 R versions . . . . . . . . . . . . . . . . . . . . . . . 123
12.2 Available libraries . . . . . . . . . . . . . . . . . . . . . 123
12.2.1 The default selection . . . . . . . . . . . . . . . . . 123
Contents 13
12.2.2 Installing new packages . . . . . . . . . . . . . . . 123
12.3 Scripting on CSC server Murska . . . . . . . . . . . . . 124

下载
DNA microarray data analysis using Bioconductor.rar (1.79 MB, 下载次数: 0, 售价: 5 )
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-24 23:06 , Processed in 0.026127 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表