找回密码
 立即注册
查看: 1609|回复: 0

请问R如何自定词库对汉字进行分词

[复制链接]
发表于 2014-3-27 19:23:47 | 显示全部楼层 |阅读模式
淘宝网
淘宝商城
淘宝买的
淘宝123456
!淘宝天猫
我有一列这样的数据,想通过自定词库(淘宝,京东...),对这样的数据进行分词,对名称规范化,并统计词频,由于Rwordseg包分不了,不知哪位大哥能指点下小弟.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-28 16:08 , Processed in 0.027728 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表