R 亟待解决！循环导入2G大小的大量txt文本，整合成一个表格时内存超载报错！

thesea · 发表于 2015-5-26 13:37:26

新手请教高手们～
最近处理一个2G大小左右的txt文件系列（有2000多个txt文件，记录的都是气象数据），想要循环读入到一个表格里，再对数据进行统计分析。处理少量txt文件是没有问题，但是一旦到了大量文件时，读入数据很慢，最后系统还报错！内存不足了。网上找了半天攻略，有建议建立数据库处理，或者用ff包，但是还是没弄明白，看起来好难，在此请教高手们，有具体的解决办法么？最好能给出有参考价值的代码！太谢谢了！下面是我原先读入少量txt文件时写的代码：

files_tg <- list.files(pattern=”.txt$”)
DailyTG.40J <- data.frame()
for(j in files_tg){
tg <-read.table(j, header=TRUE, skip=19, sep=”,”,dec=”,”);
tg.1<-tg[which(tg$DATE>=19740101&tg$DATE<=20131231),];
DailyTG.40J <- rbind(DailyTG.40J, tg.1)
}

附件是其中一个txt文件的截图内容

Smiles · 发表于 2015-5-27 16:14:27

可不可以边整合边输出呢用sink()这个函数试试

Smiles · 发表于 2015-5-27 16:15:24

输出后的内容把他们从内存清理掉

thesea · 发表于 2015-5-30 09:03:47

Smiles 发表于 2015-5-27 16:14
可不可以边整合边输出呢用sink()这个函数试试

哦，前几天用了data.table()包，用这个包读取数据速度快了很多，然后win系统换了mac系统，我的问题就解决了，下次再试试sink()

		自动登录	找回密码
密码			立即注册

R 亟待解决！ 循环导入2G大小的大量txt文本，整合成一个表格时内存超载报错！

R 亟待解决！循环导入2G大小的大量txt文本，整合成一个表格时内存超载报错！