Ir para conteúdo


Foto

Usar o Extjs para simular um browser e manipula-lo


  • Por favor, faça o login para responder
5 respostas neste tópico

#1 Link

Link

    Member Avançado

  • Membros
  • PipPipPip
  • 736 posts

Postado 20 April 2015 - 20:19

Olá pessoal,

 

     Eu necessito criar um robot que possa fazer as seguintes ações:

 

  1. acessar um determinado site
  2. converter uma página desse site em PDF
  3. tirar screenshots
  4. pesquisar uma informação no site

    Gostaria de saber se com o Extjs é possível atingir esses objetivos?

 

Abraços



#2 fabiovilas

fabiovilas

    Member Avançado

  • Membros
  • PipPipPip
  • 51 posts

Postado 20 April 2015 - 20:41

Use http://wkhtmltopdf.org/

 

Com o extjs vc apenas mostra o resultado.



#3 Link

Link

    Member Avançado

  • Membros
  • PipPipPip
  • 736 posts

Postado 20 April 2015 - 21:25

Use http://wkhtmltopdf.org/

 

Com o extjs vc apenas mostra o resultado.

 

Boa noite fabiovilas,

 

     Muito obrigado por responder a minha questão.

 

     Eu dei uma olhada no link que você me passou, mas pelo que entendi essas biblioteca só gera o html em pdf. Eu gostaria de buscar uma determinada informação na página HTML, exemplo:  número de pedido, datas, nomes de pessoas e etc.  Isso é possível ?



#4 fabiovilas

fabiovilas

    Member Avançado

  • Membros
  • PipPipPip
  • 51 posts

Postado 21 April 2015 - 09:04

Você pode usar a libcurl para pegar as infos do site.

 

Dae para pesquisar você usa alguma função da linguagem que vc usa para pesquisar dentro deste html.

 

 

O extjs é apenas acessório e não entre em nada disto.



#5 Link

Link

    Member Avançado

  • Membros
  • PipPipPip
  • 736 posts

Postado 21 April 2015 - 15:21

Você pode usar a libcurl para pegar as infos do site.

 

Dae para pesquisar você usa alguma função da linguagem que vc usa para pesquisar dentro deste html.

 

 

O extjs é apenas acessório e não entre em nada disto.

 

Obrigado fabiovilas pelas dicas.

 

Já percebi que tenho um longo trabalho pela frente, já que eu uso o asp.net mvc 4 como server no desenvolvimento.

 

Percebi também que vou ter que aprender como decifrar os CAPTCHAS que vem nos sites, caso contrário não conseguirei obter êxito na busca de informações dentro do html.

 

Um abraço



#6 fabiovilas

fabiovilas

    Member Avançado

  • Membros
  • PipPipPip
  • 51 posts

Postado 22 April 2015 - 18:51

CAPTCHA?

Usa tesseract! É muito top.

Apenas trabalho em ambientes unix-line.




0 usuário(s) está(ão) lendo este tópico

0 membros, 0 visitantes, 0 membros anônimos