小编在此,给出两种方式,就算抛砖引玉了。下面还请各位高手给出其他方式
1 当这组数据不大的时候,比如百万级以下的时候,可以用table()来实现。
x<-sample(1:10,size=1e+6,replace=T);
table(x);
x
1 2 3 4 5 6 7 8 9 10
99867 100014 100410 100139 100164 100035 99898 100183 100043 99247
2 当数据量比较大的时候,比如数量级在百万之上,达到千万的时候。大家可以用tabulate()处理
x<-sample(1:10,size=1e+7,replace=T);
b<-tabulate(x);
names(b)<-1:10
b
1 2 3 4 5 6 7 8 9 10
998164 999179 1001283 1002016 998593 999229 1002417 1000089 999750 999280
注释:
tabulate()
##tabulate takes the integer-valued vector bin and counts the number of times each integer occurs in it.
bin a numeric vector (of positive integers), or a factor. Long vectors are supported.
nbins the number of bins to be used.
|