找回密码
 立即注册
查看: 1969|回复: 0

求助 Rvest网页数据抓取问题

[复制链接]
发表于 2017-9-12 19:15:57 | 显示全部楼层 |阅读模式
加载rvest包library(rvest)保存搜索链接到对象gurl,链接的拼接方式挺有规律的gurl <- "https://list.tmall.com/search_product.htm?q=%C9%AD%B1%C8%B0%C2&type=p&vmarket=&spm=875.7931836%2FB.a2227oh.d100&from=mallfp..pc_1_searchbutton"抓取数据保存到对象md中%>%是管道操作符,意思是把左边的操作结果作为参数传递给右边的命令div.product-iWrap 是CSS选择器的语法,即是 div class="div.product-iWarp"md <- gurl %>%       read_html(encoding="GBK") %>% # 读取gurl的链接,指定编码为gbk      html_nodes("div.product-iWrap")  # 筛选出所有包含在<div class="product-iWrap">...</d





按照网上给的步骤,进行到给md赋值这一步的时候,一直报错如下
> md<-gurl%>%
+     read_html(gurl,encoding="GBK")%>%
+     html_nodes("div.product-iWrap")
Error in read_connection_(x, n) :
  Not compatible with requested type: [type=character; target=integer].



有米有好心人解答以下

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-22 13:54 , Processed in 0.033595 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表