R语言爬虫

6爷 · 发表于 2017-5-27 15:47:04

本帖最后由 6爷于 2017-5-27 15:53 编辑

使用R语言爬虫，使用xml包里的htmlparse函数，返回的结果里原本中文的地方都显示为乱码了，怎么解决？？
后来在网上找说，用encoding参数把编码调为utf-8，还是不行，请问应该怎么办

代码如下：
> ur11<-"http://www.creprice.cn/rank/cityforsale.html?type=11&citylevel=1&y=2011&m=09"
> a1<-htmlParse(file=ur11,encoding = "utf-8")

xiaorouer1 · 发表于 2017-6-3 11:38:25

换成别的编码试试。比如GBK

248411282 · 发表于 2017-6-4 16:23:46

.......................................................................................................

		自动登录	找回密码
密码			立即注册