[R-br] Extração de dados html

classic Classic list List threaded Threaded
1 message Options
Reply | Threaded
Open this post in threaded view
|

[R-br] Extração de dados html

R-br mailing list
OI gente.

Talvez alguém possa me ajudar na extração de dados web. 

Objetivo: extrair de cada página a tabela que aparece. 

Meu problema: Não consigo achar o css certo que me permita colocar o botão "Next" de mudança de página que vem no site da web. Na primeira página tenho de extrair a tabela, depois, no next , mudar a pagina e extrair a segunda tabela que aparece, e assim vai...

 Não consigo achar o css ou xpath que me possibilite mudar de pagina. Já tentei vários css abaixo:

“button.a-Button.a-IRR-button.a-IRR-button—pagination”

“li.a-IRR-pagination-item”



Segue um resuminho do código que tenho

library(rvest)
library(xml2)


u<-"http://transparencia.pi.gov.br/apex/f?p=101:SERVIDORES::::::"

ht<-read_html(u) %>%
  html_nodes("span.a-Icon.icon-right-chevron") %>%
  html_nodes("table") %>%
  html_table()
ht


## ou até mesmo esse código


ht<-html_session(u) %>%
  follow_link("span.a-Icon.icon-right-chevron") %>%
  html_nodes("table") %>%
  html_table()





## Obrigada!

_______________________________________________
R-br mailing list
[hidden email]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.