(434) 218-3009
Automatización
Automatización Python

Factura PDF→CSV Pipeline

Proceso de automatización Python de dos etapas alojado en Synology NAS que supervisa los correos electrónicos en busca de facturas PDF, las descarga, extrae los datos utilizando pdfplumber y genera archivos CSV para importarlos sin problemas al sistema de contabilidad.

Descripción general del proyecto

En un esfuerzo innovador por optimizar el procesamiento de facturas, este proceso de automatización Python de dos etapas, que comprende los componentes jmf-UrltoPDF y excel-scraper, revoluciona la forma en que se procesan las facturas, eliminando horas de trabajo manual y mejorando significativamente la eficiencia del flujo de trabajo.

La primera etapa, jmf-UrltoPDF, supervisa continuamente los archivos de correo electrónico en busca de enlaces a facturas de relay.cash, descarga los PDF correspondientes y les cambia el nombre para que se ajusten al formato THINKPRINT. Este proceso automatizado garantiza que las facturas se capturen de forma rápida y precisa, sentando las bases para una extracción de datos perfecta.

La segunda etapa, excel-scraper, aprovecha la potente biblioteca pdfplumber para extraer los datos relevantes de los PDF descargados. Esta etapa genera archivos CSV, perfectamente formateados para su importación a los sistemas de contabilidad, completando así el proceso de automatización. Alojado como un servicio systemd en un NAS de Synology, este proceso de automatización funciona de forma continua, lo que garantiza que las facturas se procesen en tiempo real, sin interrupciones, liberando recursos y personal valiosos para tareas más estratégicas.

Características principales

Proceso de dos etapas

Flujo de trabajo automatizado que combina la supervisión del correo electrónico, la descarga de PDF, la extracción de datos y la generación de CSV en un proceso fluido.

Supervisión del correo electrónico

Supervisión continua de archivos .eml y .msg en busca de enlaces a facturas de relay.cash mediante el observador del sistema de archivos watchdog.

Extracción de PDF

Integración avanzada de pdfplumber para la extracción precisa de datos de facturas en PDF con diseños complejos.

Generación de CSV

Salida CSV formateada lista para su importación directa a sistemas de contabilidad, lo que elimina la introducción manual de datos.

Funcionamiento continuo

Se ejecuta como servicio systemd en Synology NAS para un procesamiento automatizado 24/7 sin interrupciones.

Ahorro de tiempo

Elimina horas de procesamiento manual de facturas cada semana, lo que mejora drásticamente la eficiencia y la precisión del flujo de trabajo.

Pila tecnológica

Python pdfplumber watchdog extract-msg Synology NAS systemd Bash

Impacto de la automatización

Este proceso ahorra horas de procesamiento manual de facturas cada semana, lo que mejora drásticamente la eficiencia del flujo de trabajo, minimiza los errores humanos y permite al equipo centrarse en tareas estratégicas de mayor valor.

Mr. Botsworth

Mr. Botsworth

Hey! I'm Mr. Botsworth, Greg's search bot. Ask me about his projects, skills, or services.