找回密码
 立即注册
查看: 4119|回复: 6

求助,关于垃圾邮件分类

[复制链接]
发表于 2013-6-29 21:00:56 | 显示全部楼层 |阅读模式
     在用R进行垃圾邮件分类的时候,如果希望用SVM,KNN,神经网络等方法的时候,需要对邮件进行怎样的量化处理或者预处理才能顺利地运用到相应的程序包里面进行分类器的训练,求高人解答,感激不尽!
回复

使用道具 举报

发表于 2013-7-1 09:00:12 | 显示全部楼层
可以看下topicmodels和RTextTools  用tfitf的办法转化成一个document-term-matrix  
回复

使用道具 举报

发表于 2013-7-1 09:00:56 | 显示全部楼层
但你要先分词才能转
回复

使用道具 举报

 楼主| 发表于 2013-7-1 20:55:29 | 显示全部楼层
月下清风 发表于 2013-7-1 09:00
但你要先分词才能转

谢谢解答,但分词是不是针对中文分类的?英文的话也需要分词吗?
回复

使用道具 举报

 楼主| 发表于 2013-7-1 20:56:35 | 显示全部楼层
月下清风 发表于 2013-7-1 09:00
可以看下topicmodels和RTextTools  用tfitf的办法转化成一个document-term-matrix

好的好的,十分感谢!
回复

使用道具 举报

发表于 2013-7-2 09:17:09 | 显示全部楼层
笨wallace 发表于 2013-7-1 20:55
谢谢解答,但分词是不是针对中文分类的?英文的话也需要分词吗?

都可以把 只要词库里有 都可以分出来 英文不需要吧 英文有自然空格
回复

使用道具 举报

 楼主| 发表于 2013-7-2 14:36:07 | 显示全部楼层
月下清风 发表于 2013-7-2 09:17
都可以把 只要词库里有 都可以分出来 英文不需要吧 英文有自然空格

哦哦,好的明白,谢谢啦!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-25 10:08 , Processed in 0.023496 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表