在对Kaggle网上面泰坦尼克号乘客生存率分析的时候,在训练数据中有很多缺失值,对这些数据不知道怎么处理,用多重插补法mice函数运行时候直接卡死,891个数据也不多啊,我把缺失数据最多的Cabin那一列删除,还是不行。 用missForest这个方法时候 出现这个error:
missForest iteration 1 in progress...Error in randomForest.default(x = obsX, y = obsY, ntree = ntree, mtry = mtry, :
Can not handle categorical predictors with more than 53 categories.
还有没有其他处理缺失值数据的方法?真心求助!!!!
|