找回密码
 立即注册
查看: 3938|回复: 0

R语言的数据缺失值处理

[复制链接]
发表于 2015-4-30 12:09:27 | 显示全部楼层 |阅读模式
在对Kaggle网上面泰坦尼克号乘客生存率分析的时候,在训练数据中有很多缺失值,对这些数据不知道怎么处理,用多重插补法mice函数运行时候直接卡死,891个数据也不多啊,我把缺失数据最多的Cabin那一列删除,还是不行。   用missForest这个方法时候 出现这个error:
missForest iteration 1 in progress...Error in randomForest.default(x = obsX, y = obsY, ntree = ntree, mtry = mtry,  :

  Can not handle categorical predictors with more than 53 categories.
    还有没有其他处理缺失值数据的方法?真心求助!!!!

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-25 20:51 , Processed in 0.024224 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表