找回密码
 立即注册
查看: 28006|回复: 19

R语言读取EXCEL文件的各种方法,非常实用

[复制链接]
发表于 2013-2-13 09:31:36 | 显示全部楼层 |阅读模式
R语言读取EXCEL文件的各种方法
最近初学R语言,在R语言读入EXCEL数据格式文件的问题上遇到了困难,经过在网上搜索解决了这一问题,下面归纳几种方法,供大家分享:

第一:R中读取excel文件中的数据的路径:

      假定在您的电脑有一个excel文件,原始的文件路径是:D:\work\data\1
      如果直接把这个路径拷贝到R中,就会出现错误,原因是:
    \是escape character(转义符),\\才是真正的\字符,或者用/
      因此,在R中有两种方法读取该路径:
      1:在R中输入一下路径:D:\\work\\data\\1
      2:在R中输入一下路径:D:\\work\\data\\1
第二:R中读取excel文件中的数据的方法:
      read.table(),read.csv(),read.delim()直接读取EXCEl文件时,都会遇到一下问题:“在读取‘.xls’的TableHeader时遇到不完全的最后一行”。解决的方法有以下几种:假如文件1.1中是一个6乘以2的矩阵,元素为:
  
1 23
2 24
3 25
4 26
5 27
6 28


      方法1:xls另存为csv格式然后用read.csv:
具体过程如下:


> data<-read.csv("D:\\work\\data\\1.csv")
> data
  X1 X23
1  2    24
2  3    25
3  4    26
4  5    27
5  6    28
> data<-read.csv("D:\\work\\data\\1.csv",header = F)
> data
  V1    V2
1  1 23333
2  2    24
3  3    25
4  4    26
5  5    27
6  6    28
> data<-read.csv("D:\\work\\data\\1.csv",header = T)
> data
  X1 X23333
1  2    24
2  3    25
3  4    26
4  5    27
5  6    28
也就是说header = T(TURE)是默认的状态,在这默认状态下,输出的data矩阵是一个5乘以2的矩阵,第一行作为了data的名字,如果header = F(FALSE),则会现实原始的矩阵结果。
  
  方法2:xls另存为txt格式然后用read.table:
如例子所示:
> data<-read.table("D:\\work\\data\\1.txt",header = T)
> data
  X1 X23
1  2  24
2  3  25
3  4  26
4  5  27
5  6  28
> data<-read.table("D:\\work\\data\\1.txt",header = F)
> data
  V1 V2
1  1 23
2  2 24
3  3 25
4  4 26
5  5 27
6  6 28


  方法3:打开EXCEL,全选里面的内容,点击复制,然后在R中输入一下命令:

data <- read.table("clipboard", header = T, sep = '\t')
结果如下所示:


> data <- read.table("clipboard", header = T, sep = '\t')
> data
  X1 X23
1  2  24
2  3  25
3  4  26
4  5  27
5  6  28
> data <- read.table("clipboard", header = F, sep = '\t')
> data
  V1 V2
1  1 23
2  2 24
3  3 25
4  4 26
5  5 27
6  6 28
使用这种方法的时候一定要注意复制!剪切板里面没有内容是无法运行的!以上是三种方法,如果还有别的更好的,请大家补充,谢谢!



回复

使用道具 举报

发表于 2013-2-19 19:50:13 | 显示全部楼层
本帖最后由 千年 于 2013-2-19 19:51 编辑

我给补充点儿:
个人感觉打开此类文件简洁的方法就是加载xlsx数据包后用read.xlsx打开,如下:
  1. > setwd("e:/r")
  2. > library(xlsx) #加载这个数据包,先下载安装.
  3. > data<-read.xlsx(file="1.xlsx",header=T,sheetIndex=1) #打开后缀为.xlsx的excel文件,注意sheetIndex里面有个大写字母.
  4. > data
  5.   X1 X23
  6. 1  1  23
  7. 2  2  24
  8. 3  3  25
  9. 4  4  26
  10. 5  5  27
  11. 6  6  28

  12. > data<-read.xlsx(file="1.xls",header=T,sheetIndex=1) #打开后缀为.xls的excel文件
  13. > data
  14.   X1 X23
  15. 1  1  23
  16. 2  2  24
  17. 3  3  25
  18. 4  4  26
  19. 5  5  27
  20. 6  6  28
复制代码

点评

成功导入excel文件,为啥library(xlsx)不出错了?而install.packages("xlsx") library("xlsx")老出错  发表于 2015-11-6 19:20
好,来学习一下  发表于 2014-3-8 22:56
回复 2 0

使用道具 举报

发表于 2013-2-19 11:02:04 | 显示全部楼层
I like using read.csv
much faster
回复

使用道具 举报

发表于 2013-2-22 08:02:49 | 显示全部楼层
本帖最后由 Tilly 于 2013-2-22 08:48 编辑

it doesn't work now... wholly chrisy....

see the error message below:
> library(xlsx)
> vic1<-read.xlsx(file="S:\\DataManagement-ICT\\NDS DATA RELEASE V1\\FINAL\\Final with Comments_NDS_V1\\NDS_VIC_G.xlsm",header=T,sheetIndex=3)
Error in .jcall("RJavaTools", "Ljava/lang/Object;", "invokeMethod", cl,  :
  org.apache.poi.POIXMLException: java.lang.reflect.InvocationTargetException


回复

使用道具 举报

发表于 2013-2-22 22:29:48 | 显示全部楼层
Tilly 发表于 2013-2-22 08:02
it doesn't work now... wholly chrisy....

see the error message below:

我之前也遇到过类似问题,
需要安装JAVA.如果你是64位版本的系统,需要把JAVA升级到最新.
回复

使用道具 举报

发表于 2013-2-25 05:59:31 | 显示全部楼层
如何升级java到最新呢
回复

使用道具 举报

发表于 2013-7-5 09:50:36 | 显示全部楼层
程辑包‘xlsxjars’是在R版本3.0.0之前建的:你得重新安装,要重新安装R吗,要安装到低版本吗
回复

使用道具 举报

发表于 2013-7-16 11:11:44 | 显示全部楼层
谢谢分享:)
回复

使用道具 举报

发表于 2013-11-11 15:55:39 | 显示全部楼层
最后一招读取clipboard很有意思
去试验一下
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-22 14:35 , Processed in 0.031680 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表