找回密码
 立即注册
查看: 3480|回复: 7

求教:如何读取一个网址上的非默认XML数据

[复制链接]
发表于 2017-1-1 23:07:59 | 显示全部楼层 |阅读模式
比如在网址“http://f10.eastmoney.com/f10_v2/ ... .aspx?code=sz000897”下默认的XML是“按报告期”的三个表格,我只能读出这三个表格,但是后面的“按年度”,“按单季度”我不知如何用R语言读出,哪位大侠能指教一下,交一个非默认的表格读出就行。
回复

使用道具 举报

发表于 2017-1-9 15:38:47 | 显示全部楼层
用chrome开发者模式,跟踪网页访问地址。

年度主要指标: [其他指标类似]
http://f10.eastmoney.com/f10_v2/ ... sz000897&spstr=&n=1

季度主要指标:
http://f10.eastmoney.com/f10_v2/ ... sz000897&spstr=&n=2

然后解析数据

R代码:
library(XML)
test <- readLines("http://f10.eastmoney.com/f10_v2/BackOffice.aspx?command=RptF10MainTarget&code=00089702&num=9&code1=sz000897&spstr=&n=2",encoding="UTF-8")
testTable <- readHTMLTable(test,,encoding="UTF-8")

希望有用

点评

太感谢了  发表于 2017-1-9 23:26
回复 1 0

使用道具 举报

发表于 2017-1-10 09:44:28 | 显示全部楼层
按照楼上大神的程序,我也试了一下,code如下:
install.packages("XML")
library(XML)
test <- readLines("http://f10.eastmoney.com/f10_v2/FinanceAnalysis.aspx?code=sz000897",encoding="UTF-8")
testTable <- readHTMLTable(test,,encoding="UTF-8")
testTable
证明是work 的,谢谢大神,学习了!
另外同时问一下如果想把这个抓取出的table再导出excel 文件,什么R 代码呢?
回复

使用道具 举报

发表于 2017-1-10 14:20:05 | 显示全部楼层
zhs2016 发表于 2017-1-10 09:44
按照楼上大神的程序,我也试了一下,code如下:
install.packages("XML")
library(XML)

我也是菜鸟,也是来学习的。其实你的问题,网上搜下答案很多。看到就顺手回了一下。
write.csv()可以保存到excel。
回复

使用道具 举报

发表于 2017-1-11 09:14:09 | 显示全部楼层
好的,谢谢!
祝生活愉快!
回复

使用道具 举报

 楼主| 发表于 2017-1-12 02:34:54 | 显示全部楼层
huhaohoo 发表于 2017-1-9 15:38
用chrome开发者模式,跟踪网页访问地址。

年度主要指标: [其他指标类似]

我想再问个问题。“报表明细”的“按年度”实现了,非常感谢您的方法。可我却无法找到“报表明细”的“按年度”的数据。大神能不能再指点一下。
主要是BackOffice.aspx我不了解,还有RptF10MainTarget在网页中找不到,对应的BBMX_table如何应用,还有参数的this如何表达等。
确实比较菜,见笑!再次希望得到您的指点。
回复

使用道具 举报

发表于 2017-1-13 09:26:08 | 显示全部楼层
希望有用。另外"http://f10.eastmoney.com/f10_v2/FinanceAnalysis.aspx?code=sz000897"网址是可以访问的
> testTable$'NULL'
> testTable$'NULL'["16-03-31"]

testTable$'NULL'

testTable$'NULL'
Untitled1.png
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-23 01:38 , Processed in 0.035105 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表