En la mayoría de las empresas medianas, el proceso de procesar una factura de proveedor tiene estos pasos: alguien recibe el PDF por email, lo descarga, abre el sistema contable, extrae manualmente el RUT, el número de factura, el monto neto, el IVA y el total, lo digita en el sistema, lo archiva en una carpeta y lo marca como procesado.
Multiplicado por 30, 50 o 100 facturas al mes, eso son entre 3 y 8 horas de trabajo administrativo puramente manual, propenso a errores y que no agrega ningún valor real al negocio.
El OCR con inteligencia artificial automatiza todo ese proceso. Una factura llega por email, el sistema la lee, extrae todos los datos relevantes, los valida y los registra en tu sistema contable, en menos de 30 segundos y sin que nadie haya tenido que tocar el documento.
En este artículo te explico cómo construir ese sistema.
Qué es OCR y por qué la IA lo cambió todo
OCR (Optical Character Recognition) es la tecnología que convierte imágenes de texto — como documentos escaneados o fotos de facturas — en texto digital editable.
El OCR tradicional existe desde los años 90. Su problema: funcionaba bien con documentos perfectamente formateados, pero fallaba constantemente con facturas del mundo real: diferentes diseños, formatos de fecha distintos, columnas alineadas de formas variables, sellos y firmas superpuestos.
OCR con IA — como Google Document AI, Amazon Textract o Azure Form Recognizer — usa modelos de visión por computadora entrenados específicamente en millones de facturas. No solo lee el texto, sino que entiende la estructura del documento: sabe que "fecha de emisión" y "fecha de documento" son lo mismo, que el monto con IVA está después del monto neto, que el RUT del proveedor está en la parte superior.
La tasa de precisión de los sistemas modernos es del 95-99% en facturas estándar. Para la mayoría de los negocios, eso equivale a eliminar el trabajo manual casi por completo.
El flujo completo del sistema
Antes de entrar a la configuración técnica, el panorama completo:
Factura llega por email (PDF o imagen)
↓
n8n detecta el email nuevo con adjunto
↓
Envía el documento a Google Document AI
↓
OCR extrae: número de factura, fecha, RUT proveedor,
descripción, monto neto, IVA, total
↓
Validación automática: ¿Los montos cuadran? ¿El RUT existe?
↓
Si válido → Registra en sistema contable / Google Sheets
Si hay error → Notifica al equipo para revisión manual
↓
Archiva el PDF en Google Drive con nombre estandarizado
↓
Marca el email como procesado
El proceso completo toma entre 15 y 45 segundos por factura. Sin que nadie haya tocado nada.
Herramientas del stack
| Herramienta | Función | Costo |
|---|---|---|
| n8n | Motor de automatización y orquestación | $20 USD/mes |
| Gmail | Recepción de facturas | Gratis |
| Google Document AI | OCR e inteligencia de documentos | Pay-per-use: ~$1.50 USD/1.000 páginas |
| Google Drive | Archivo de documentos | Gratis hasta 15GB |
| Google Sheets o tu sistema contable | Registro de datos | Gratis (Sheets) |
Costo estimado para 200 facturas/mes: menos de $1 USD en Document AI + $20 USD de n8n = menos de $21 USD/mes para eliminar 5-8 horas de trabajo manual.
Paso 1: Configura Google Document AI
Google Document AI tiene un procesador específico para facturas llamado "Invoice Parser" que funciona bien para documentos en español y con el formato habitual de países latinoamericanos.
1.1 Activa la API en Google Cloud
- Ve a console.cloud.google.com
- Crea un proyecto nuevo o usa uno existente
- Activa la API de Document AI
- En el menú de Document AI, crea un nuevo procesador de tipo "Invoice Parser"
- Anota el Project ID y el Processor ID — los necesitarás en n8n
1.2 Configura las credenciales de servicio
Crea una cuenta de servicio con permisos de Document AI. Descarga el archivo JSON de credenciales. En n8n, crea una nueva credencial de tipo "Google" y sube este archivo.
Paso 2: Configura el trigger de email en n8n
2.1 Nodo Gmail Trigger
En n8n, crea el nodo "Gmail Trigger" configurado para revisar la bandeja de entrada cada 5 minutos en busca de emails nuevos que:
- Vengan de direcciones de proveedores conocidos (opcional pero recomendado)
- Tengan adjuntos en formato PDF o imagen
Si usas una dirección de email específica para recibir facturas (por ejemplo facturas@tuempresa.com), configura el trigger para monitorear esa bandeja exclusivamente.
2.2 Extrae el adjunto
Usa el nodo "Gmail" para descargar el adjunto del email. n8n puede manejar el archivo como binario y pasarlo directamente a Document AI.
Paso 3: Procesa el documento con Document AI
3.1 Nodo HTTP Request para Document AI
Document AI se llama mediante una API REST. Configura el nodo "HTTP Request" en n8n:
- Método: POST
- URL:
https://documentai.googleapis.com/v1/projects/{{PROJECT_ID}}/locations/us/processors/{{PROCESSOR_ID}}:process - Autenticación: Google OAuth2 (las credenciales que configuraste)
- Body: El documento en base64 con el MIME type correspondiente
La respuesta de Document AI incluye todos los campos extraídos con su valor y el nivel de confianza de cada extracción.
3.2 Mapeo de campos
Document AI devuelve los campos con nombres estándar en inglés. Usa el nodo "Set" de n8n para mapearlos a los campos de tu sistema:
invoice_id → numero_factura
invoice_date → fecha_emision
supplier_name → nombre_proveedor
supplier_tax_id → rut_proveedor
net_amount → monto_neto
tax_amount → iva
total_amount → total_factura
line_items → detalle_lineas
Paso 4: Validación automática
Antes de registrar cualquier dato en el sistema contable, el sistema debe validar que los números tienen sentido. Un error aquí puede crear problemas contables difíciles de corregir.
Nodo "Code" en n8n para las validaciones:
const neto = parseFloat(items[0].json.monto_neto);
const iva = parseFloat(items[0].json.iva);
const total = parseFloat(items[0].json.total_factura);
const ivaCalculado = neto * 0.19; // 19% IVA en Chile; ajusta según tu país
const errores = [];
// Validación 1: El IVA cuadra con el neto
if (Math.abs(ivaCalculado - iva) > 1) {
errores.push(`IVA no coincide. Calculado: ${ivaCalculado.toFixed(0)}, Extraído: ${iva}`);
}
// Validación 2: El total cuadra
if (Math.abs((neto + iva) - total) > 1) {
errores.push(`Total no coincide. Suma: ${(neto + iva).toFixed(0)}, Extraído: ${total}`);
}
// Validación 3: La confianza del OCR es suficiente
const confianza = items[0].json.confidence;
if (confianza < 0.85) {
errores.push(`Confianza OCR baja: ${(confianza * 100).toFixed(0)}%`);
}
return [{
json: {
...items[0].json,
es_valida: errores.length === 0,
errores: errores
}
}];
Si hay errores de validación, el workflow toma el camino de notificación al equipo en lugar del registro automático.
Paso 5: Registro y archivo
5.1 Si la factura es válida → Registra en Google Sheets
Usa el nodo "Google Sheets" para agregar una fila con todos los datos extraídos:
| Fecha | N° Factura | Proveedor | RUT | Neto | IVA | Total | Estado | Archivo |
|---|---|---|---|---|---|---|---|---|
| 2026-10-15 | 003241 | Proveedor X | 12.345.678-9 | $100.000 | $19.000 | $119.000 | Procesada | [link] |
Si tu sistema contable tiene API (como Bsale, Nubox, Xero u otros), puedes conectarlo directamente y crear el registro contable sin pasar por Google Sheets.
5.2 Archiva el PDF con nombre estandarizado
Usa el nodo "Google Drive" para subir el PDF a la carpeta correspondiente con un nombre que incluya: fecha, número de factura y proveedor.
2026-10-15_factura-003241_ProveedorX.pdf
Esta convención de nombres hace que buscar cualquier factura sea instantáneo.
5.3 Si hay errores → Notifica al equipo
Usa el nodo "Gmail" o "WhatsApp Business" para enviar una notificación al equipo de contabilidad con:
- El nombre del archivo
- Los errores detectados
- Un link directo al PDF para revisión manual
Manejo de formatos no estándar
Algunas facturas — especialmente de proveedores extranjeros o de sistemas tributarios muy antiguos — pueden tener formatos que Document AI no reconoce bien.
Estrategia para estos casos:
- Configura un umbral de confianza (por ejemplo, 80%). Facturas por debajo de ese umbral van siempre a revisión humana
- Mantén un registro de los proveedores cuyas facturas fallan frecuentemente
- Para esos proveedores, considera crear un template personalizado en Document AI que aprende el formato específico de sus documentos
Con el tiempo, el sistema mejora porque Document AI permite entrenar el modelo con ejemplos de tus documentos específicos.
Cumplimiento tributario y consideraciones legales
Chile: El SII tiene requisitos específicos para el archivo digital de facturas electrónicas (DTE). Si ya recibes facturas en formato XML-DTE, considera usar directamente la API del SII para validación en lugar de OCR.
México: El CFDI (Comprobante Fiscal Digital por Internet) tiene un formato XML estándar. Puedes extraer los datos directamente del XML sin necesitar OCR, lo que mejora la precisión al 100%.
Colombia, Perú, Argentina: Los formatos de factura electrónica varían. Consulta con tu contador si el archivo digital que genera este sistema cumple con los requisitos de conservación de documentos de tu país.
ROI del sistema
Para una empresa que procesa 150 facturas al mes:
| Concepto | Antes (manual) | Después (automático) |
|---|---|---|
| Tiempo por factura | 5-8 minutos | 30 segundos |
| Tiempo total mensual | 12-20 horas | 1 hora (revisión) |
| Errores de digitación | 2-5% de facturas | < 0.5% |
| Costo del sistema | $0 | $21 USD/mes |
| Horas recuperadas | — | 11-19 horas/mes |
Si el trabajo de digitación lo hace alguien a $15 USD/hora, el sistema se paga solo con la primera semana de ahorro.
¿Necesitas implementar esto en tu empresa?
El sistema que describí es exactamente lo que implemento para empresas medianas que procesan facturas manualmente. El proceso de implementación toma entre 1 y 2 semanas dependiendo de cuántos sistemas contables necesitamos conectar.
Si tu empresa maneja más de 50 facturas al mes, la inversión se recupera en el primer mes.
Agenda una llamada de diagnóstico y te digo si este sistema aplica para tu situación específica y qué modificaciones requeriría para tu país y sistema contable.