找回密码
 立即注册
查看: 6157|回复: 2

R语言爬虫

[复制链接]
发表于 2017-5-27 15:47:04 | 显示全部楼层 |阅读模式
本帖最后由 6爷 于 2017-5-27 15:53 编辑

使用R语言爬虫,使用xml包里的htmlparse函数,返回的结果里原本中文的地方都显示为乱码了,怎么解决??
后来在网上找说,用encoding参数把编码调为utf-8,还是不行,请问应该怎么办

代码如下:
> ur11<-"http://www.creprice.cn/rank/cityforsale.html?type=11&citylevel=1&y=2011&m=09"
> a1<-htmlParse(file=ur11,encoding = "utf-8")



aaaa.jpg aaaa.jpg
回复

使用道具 举报

发表于 2017-6-3 11:38:25 | 显示全部楼层
换成别的编码试试。比如GBK
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-25 06:28 , Processed in 0.022096 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表