Portal    Foro    Buscar    FAQ    Registrarse    Conectarse


Publicar nuevo tema  Responder al tema 
Página 1 de 2
Ir a la página 1, 2  Siguiente
 
Extraer Datos HTML
Autor Mensaje
Responder citando   Descargar mensaje  
Mensaje Extraer Datos HTML 
 
Buenas tardes a todos,
tengo una consulta que no se como enfocar. Necesito poder obtener los datos de una web (www.filmaffinity.com).
Os detallo el enfoque de la aplicación. tengo una app en Java que lo que realiza es una lectura por buffer de la web anteriormente dicha y desglosa los datos a pasar a la base de datos.
Tengo una película y pulsando sobre el botón DESCARGAR FICHA analizo la web la cargo en un buffer Reader la recorro en buscar de determinados tags de la estructura y saco los datos, director, año, titulo original, reparto bla bla bla. y los paso a la DB.
Ahora bien esto mismo lo hice en su día para VBA de una forma quizás más compleja pero era efectivo.
Bien esta automatización, ¿cómo se realizaría en gambas? (ya no pregunto si se puede hacer porque estoy seguro al 100% de que esto se puede realizar, o con lectura de buffer o con otro método.
Saludos y gracias.
 



 
calcena - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Extraer Datos HTML 
 
calcena escribió:  
tengo una consulta que no se como enfocar. Necesito poder obtener los datos de una web (www.filmaffinity.com).


Tienes al menos dos modalidades:
http://www.gambas-it.org/wiki/index..._una_pagina_web
 



 
vuott - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Extraer Datos HTML 
 
Hola

Creo que la forma correcta de acometer ese proyecto es usando (una vez más) las clases nativas de gambas. Para ello existe el componente gb.xml.html,
que habrá de ser activado de la manera habitual en las propiedades del proyecto y leer su documentación para entender su funcionamiento.

http://gambaswiki.org/wiki/comp/gb.xml.html

Es muy potente y permite analizar páginas web con mucha facilidad. Para descargar el buffer de la página, se puede usar preferentemente el primer método descrito en el wiki italiano y cargar el contenido en una variable. No es necesario escribir un fichero, porque HtmlDocument dispone del método HtmlFromString que admite una variable tipo string.

La documentación no está muy completa, pero es muy similar a la de gb.xml, que es desde la que hereda el componente, por lo que se puede recurrir a dicha documentación.

Saludos
 




===================
Jesús Guardón

Por favor, usemos el corrector ortográfico antes de pulsar el botón "Enviar".

"uo ǝs ʇɐu pıɟıɔıן ɐdɹǝupǝɹ ɐ dɹoƃɹɐɯɐɹ, soןo ɥɐʎ bnǝ dɹodouǝɹsǝןo"
 
jguardon - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Extraer Datos HTML 
 
calcena:

Hace tiempo  hice algo parecido, y use mucho la función between, que hizo otro compañero del foro  Juan Luis Lopez


PRIVATE FUNCTION Between(Datos AS String, Cadena1 AS String, Cadena2 AS String) AS String
DIM iinf AS Integer
DIM isup AS Integer
iinf = InStr(Datos, Cadena1) + Len(Cadena1)
isup = InStr(Datos, Cadena2, iinf)
RETURN Mid(Datos, iinf, isup - iinf)
END



https://www.gambas-es.org/1-vf5-vt1...et+curl&start=0

Para que veas un ejemplo de uso:
http://jsbsan.blogspot.com.es/2011/...der-buscar.html

Aunque, como dice jguardon, lo mejor es usar el componente gb.xml.html
 




===================
Blog personal
Web: SoloGambas seleccion de articulos dedicados a Gambas
Visita el Curso de Gambas3 ¡¡¡Gratuito!!!
 
jsbsan - Ver perfil del usuarioEnviar mensaje privadoVisitar sitio web del usuario 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Extraer Datos HTML 
 
Yo para este tipo de aplicaciones usaría python con Beautifulsoup.
En 3 lineas a máximo 6 haces lo que necesitas
 



 
arubioc - Ver perfil del usuarioEnviar mensaje privadoVisitar sitio web del usuario 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Extraer Datos HTML 
 
arubioc escribió: [Ver mensaje]
Yo para este tipo de aplicaciones usaría python con Beautifulsoup.
En 3 lineas a máximo 6 haces lo que necesitas


Buenas compañero, con python la verdad he hecho muy poco, como no domino aunque me gustaría saber más en profundidad ¿con qué realizas la interfaz gráfica para python?

Saludos
 



 
calcena - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Extraer Datos HTML 
 
arubioc escribió: [Ver mensaje]
... usaría python


calcena escribió: [Ver mensaje]
¿con qué realizas la interfaz gráfica para python?


.....py...py...python ???


 



 
última edición por vuott el Lunes, 16 Octobre 2017, 21:36; editado 1 vez 
vuott - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Extraer Datos HTML 
 
jsbsan escribió: [Ver mensaje]
...y use mucho la función between, que hizo otro compañero del foro  Juan Luis Lopez...

Me la apunto, que hace unos días buscaba esta función.

Saludos.
 



 
tincho - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Extraer Datos HTML 
 
Aaaarrghhh... Python... el lado oscuro fuerte es


Link

 




===================
No podemos regresar
 
shordi - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Extraer Datos HTML 
 
Pues a mi me funciona de maravilla, como ejecutables externos, es fácil pasar parámetros de gambas a python y viceversa.
 



 
arubioc - Ver perfil del usuarioEnviar mensaje privadoVisitar sitio web del usuario 
Volver arribaPágina inferior
Mostrar mensajes anteriores:    
 
Ocultar¡Este tema fue útil?

 

Elegir valoración:                       

Media de valoración Valoración mínima Valoración máxima Número de valoraciones
0.00 0 0 0
 
OcultarTemas parecidos
Tema Autor Foro Respuestas último mensaje
No hay nuevos mensajes Reporte HTML Base Datos chen_08 Aplicaciones/Fragmentos de Código 12 Viernes, 26 Marzo 2010, 18:44 Ver último mensaje
Cubel
No hay nuevos mensajes ¿Como Extraer Datos De Un Datagrid? mber Bases de Datos 3 Viernes, 06 Abril 2012, 20:01 Ver último mensaje
jguardon
No hay nuevos mensajes Impresión HTML: Generador De Listados HTM... shordi Aplicaciones/Fragmentos de Código 7 Martes, 02 Julio 2013, 09:50 Ver último mensaje
shordi
No hay nuevos mensajes Extraer Datos A Excel LibreOffice calcena General 10 Viernes, 13 Octobre 2017, 09:57 Ver último mensaje
shordi
 

Publicar nuevo tema  Responder al tema  Página 1 de 2
Ir a la página 1, 2  Siguiente

Usuarios navegando en este tema: 0 registrados, 0 ocultos y 1 invitado
Usuarios registrados conectados: Ninguno


 
Lista de permisos
No puede crear mensajes
No puede responder temas
No puede editar sus mensajes
No puede borrar sus mensajes
No puede votar en encuestas
No puede adjuntar archivos
No puede descargar archivos
No puede publicar eventos en el calendario