Portal    Foro    Buscar    FAQ    Registrarse    Conectarse


Publicar nuevo tema  Responder al tema 
Página 1 de 1
 
 
Analizar La Información Contenida En Un Archivo PDF
Autor Mensaje
Responder citando   Descargar mensaje  
Mensaje Analizar La Información Contenida En Un Archivo PDF 
 
Para "parsear" o "analizar sintacticamente", un archivo xmlm por ejemplo de alguna factura electróonica, las reglas serían: impuestos, montos, cliente, proveedor, códigos, etc. si lo hacemos con un html algunas reglas serían si cuenta con la declaración del BODY, DOCUMENT TYPE, HEAD etc.

Bueno para los archivos PDF, en primera instancia ¿Existe una estructura? u por seguir como se puede leer esta información?

Alguien ha hecho algún programa que indague un PDF para buscar algunos datos ?

Saludos.
 



 
tincho - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Responder citando   Descargar mensaje  
Mensaje Re: Analizar La Información Contenida En Un Archivo PDF 
 
Citar:
Alguien ha hecho algún programa que indague un PDF para buscar algunos datos ?

Sí, aparte del programa pdfman, que ya has visto basado en la librería pdftk, tengo unas rutinas que buscan datos en pdf.
Se parte siempre de convertir a texto el pdf. En este caso tienes que tener instalado el paquete poppler-utils, que viene en los repositorios de ubuntu (no recuerdo si viene instalado por defecto) y ahí utilizas el siguiente código:


   Shell "pdftotext -layout -nopgbrk \"" & fichpdf.text & "\" " & ftxtpath
 

Donde fichpdf.text es el fichero de texto a generar y ftxtpath es el fichero .pdf

A partir de ese fichero de texto, buscas lo que quieras.

Saludos.
 




===================
No podemos regresar
 
shordi - Ver perfil del usuarioEnviar mensaje privado 
Volver arribaPágina inferior
Mostrar mensajes anteriores:    
 
Ocultar¡Este tema fue útil?

 

Elegir valoración:                       

Media de valoración Valoración mínima Valoración máxima Número de valoraciones
0.00 0 0 0
 
OcultarTemas parecidos
Tema Autor Foro Respuestas último mensaje
No hay nuevos mensajes Información del sistema jguardon General 1 Jueves, 17 Septiembre 2009, 22:54 Ver último mensaje
CanihoJR
No hay nuevos mensajes Aprender SQL.Información Shell Bases de Datos 7 Lunes, 05 Septiembre 2011, 21:17 Ver último mensaje
codificador
No hay nuevos mensajes Extraer Información De Un Archivo Midi Co... vuott Aplicaciones/Fragmentos de Código 2 Miercoles, 03 Septiembre 2014, 23:07 Ver último mensaje
vuott
No hay nuevos mensajes Analizar El Valor RMS, El Pico Y El Decay ... vuott Aplicaciones/Fragmentos de Código 1 Domingo, 27 Agosto 2017, 10:24 Ver último mensaje
Shell
 

Publicar nuevo tema  Responder al tema  Página 1 de 1
 

Usuarios navegando en este tema: 0 registrados, 0 ocultos y 1 invitado
Usuarios registrados conectados: Ninguno


 
Lista de permisos
No puede crear mensajes
No puede responder temas
No puede editar sus mensajes
No puede borrar sus mensajes
No puede votar en encuestas
No puede adjuntar archivos
No puede descargar archivos
No puede publicar eventos en el calendario