找回密码
 立即注册
查看: 4656|回复: 4

关于读取TXT文档的问题

[复制链接]
发表于 2017-9-27 14:16:38 | 显示全部楼层 |阅读模式
txt文档的内容如图片,7个字段:ID1,ID2,时间,X1,X2,X3,备注。问题在于这个txt文档不是规则地排成7列,而是全部接在一块,上一条记录的备注后面又连着新的ID,没有回车分行。

所以,我在导入R的时候执行以下代码会报错:
> read.table("train_data.txt")
Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec,  :
  2行没有8元素
求助:我要怎么才能把上面的txt文档导进R里,成N*7列的数据框或列表都行。txt文档很大,100来M,手动给文档分行是不现实的。希望大家能帮忙解答一下,非常感谢~~

1506482341.jpg
回复

使用道具 举报

发表于 2017-9-27 23:41:51 | 显示全部楼层
新手一枚,也刚刚学习,没法帮助你,默默的顶一下,
回复

使用道具 举报

发表于 2017-9-28 09:34:35 | 显示全部楼层
看下来没有明显的分割特征,所以预处理似乎是必须的。
回复

使用道具 举报

发表于 2017-9-28 15:12:43 | 显示全部楼层
似乎可以使用以下方法一试
text<-scan("文件名",what=character(0))
通过该语句可以生成一个字符串向量,然后再对字符串向量进行分割成构造一个矩阵
回复

使用道具 举报

发表于 2017-9-28 15:32:41 | 显示全部楼层
text<-scan("文件名”,what=list("","","","","","",""))
使用这条语句,运气好的话就能解决问题,看人品啦!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-22 14:33 , Processed in 0.031602 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表