Compresión de PDF: equilibrio entre calidad y tamaño de archivo

Fundamentos de la compresión de PDF

La compresión en documentos PDF opera en múltiples niveles. A diferencia de formatos de archivo simples donde se aplica un único algoritmo de compresión a todo el archivo, los PDF permiten diferentes métodos de compresión para diferentes flujos de contenido dentro del mismo documento. El contenido de texto, los gráficos vectoriales y las imágenes ráster tienen características diferentes que responden de manera distinta a los algoritmos de compresión, y el formato PDF aprovecha esto permitiendo opciones de compresión por flujo.

En el nivel más básico, la compresión de PDF reduce el tamaño del archivo eliminando la redundancia. La compresión sin pérdida identifica patrones en los datos y los representa de manera más eficiente, permitiendo la reconstrucción perfecta de los datos originales. La compresión con pérdida va más allá descartando información que se considera menos importante, logrando una mayor reducción de tamaño a costa de cierta pérdida de calidad. El arte de la optimización de PDF radica en elegir el método y la configuración de compresión adecuados para cada tipo de contenido.

La especificación PDF admite varios filtros de compresión que pueden aplicarse a los flujos de contenido: Flate (zlib/deflate), LZW, JPEG (DCT), JPEG2000 (JPX), CCITT Grupo 3 y 4, JBIG2 y codificación de longitud de ejecución. Estos filtros incluso pueden encadenarse, aplicando múltiples pasadas de compresión al mismo flujo. Comprender qué hace bien cada filtro y dónde falla es esencial para una optimización eficaz de PDF.

Métodos de compresión sin pérdida en PDF

La compresión sin pérdida preserva cada bit de los datos originales y es esencial para contenido donde la precisión importa, como texto, arte lineal y documentos destinados a impresión o archivo. El método de compresión sin pérdida principal en los PDF modernos es la compresión Flate, basada en el algoritmo deflate (el mismo algoritmo utilizado en archivos ZIP e imágenes PNG). La compresión Flate generalmente logra una relación de compresión de 2:1 a 10:1 en flujos de contenido con mucho texto, dependiendo de la redundancia en los datos.

La compresión LZW (Lempel-Ziv-Welch) es un método sin pérdida más antiguo que se utilizó ampliamente antes de que las preocupaciones sobre patentes llevaran a su reemplazo por Flate en la mayoría de las aplicaciones. LZW todavía es compatible con la especificación PDF y puede encontrarse en documentos antiguos, pero Flate generalmente logra relaciones de compresión iguales o mejores y es universalmente recomendado para documentos nuevos.

Para imágenes monocromáticas (1 bit), la compresión CCITT Grupo 4 es altamente efectiva. Diseñada originalmente para la transmisión de fax, CCITT Grupo 4 aprovecha el hecho de que la mayoría de los píxeles en una página de documento típica son blancos, y los píxeles negros tienden a agruparse en patrones predecibles (caracteres de texto, dibujos lineales). Un escaneo monocromático de 300 DPI de una página de texto puede comprimirse de aproximadamente 1 MB sin comprimir a 30-50 KB con CCITT Grupo 4, una relación de 20:1 o mejor.

Compresión con pérdida: JPEG y JPEG2000

La compresión JPEG (basada en DCT) es el método de compresión con pérdida más común para contenido fotográfico en PDF. JPEG funciona transformando los datos de imagen al dominio de frecuencia usando la Transformada Discreta del Coseno, luego cuantificando los coeficientes de frecuencia, descartando detalles de alta frecuencia que son menos perceptibles para el ojo humano. La configuración de calidad (generalmente de 1 a 100) controla cuán agresivamente la cuantificación descarta datos.

Las configuraciones de calidad JPEG exhiben una relación no lineal tanto con el tamaño del archivo como con la calidad visual. Reducir la calidad de 100 a 85 generalmente reduce el tamaño del archivo entre un 50-70% sin prácticamente ninguna pérdida de calidad visible. Reducir de 85 a 60 produce otra reducción significativa de tamaño con una degradación sutil de calidad visible solo en una inspección detallada. Por debajo de calidad 40, los artefactos de compresión (bloques, anillos y bandas de color) se vuelven claramente visibles. Para documentos PDF destinados a visualización en pantalla, calidad 60-75 suele ser el punto óptimo. Para documentos que pueden imprimirse, se recomienda calidad 75-85.

JPEG2000 es un estándar de compresión más moderno que utiliza transformadas wavelet en lugar de DCT. Logra mejores relaciones de compresión que JPEG a calidad visual equivalente, particularmente a altas relaciones de compresión. JPEG2000 también admite compresión sin pérdida, decodificación progresiva (permitiendo una vista previa borrosa que se aclara a medida que se cargan más datos) y codificación de región de interés. Sin embargo, JPEG2000 tiene mayores requisitos computacionales y no es compatible con todos los visores de PDF. Se utiliza en los formatos de archivo PDF/A-2 y PDF/A-3.

Compresión JBIG2 para documentos escaneados

JBIG2 es un estándar de compresión especializado diseñado para imágenes de dos niveles (monocromáticas), particularmente páginas de documentos escaneados. Logra una compresión drásticamente mejor que CCITT Grupo 4 al usar coincidencia de patrones y diccionarios de símbolos. JBIG2 identifica formas repetidas en una página (generalmente caracteres), almacena una plantilla única para cada forma y luego registra la posición de cada instancia. Dado que una página de documento típica reutiliza los mismos caracteres cientos de veces, este enfoque puede comprimir una página escaneada a 300 DPI a solo 5-15 KB.

JBIG2 opera en dos modos: sin pérdida y con pérdida. En modo sin pérdida, cada forma única se almacena exactamente, preservando cada píxel. En modo con pérdida, las formas similares se fusionan en una única plantilla representativa, mejorando aún más la compresión pero potencialmente sustituyendo caracteres. Este comportamiento con pérdida ganó notoriedad en 2013 cuando se descubrió que ciertos escáneres Xerox que usaban JBIG2 con pérdida estaban reemplazando silenciosamente caracteres en documentos escaneados, por ejemplo cambiando «6» por «8» en un plano de construcción.

A pesar de los riesgos del modo con pérdida, JBIG2 sigue siendo uno de los métodos de compresión más efectivos para documentos escaneados. Si utiliza JBIG2, asegúrese de que sus herramientas usen modo sin pérdida o un modo con pérdida con umbrales de similitud estrictos que impidan la sustitución de caracteres. Algunas herramientas de optimización de PDF le permiten configurar el umbral de similitud de JBIG2. Para documentos donde la precisión textual es crítica (legales, financieros, médicos), use JBIG2 sin pérdida o CCITT Grupo 4 en su lugar.

Estrategias de optimización de contenido mixto

Los PDF del mundo real generalmente contienen una mezcla de texto, gráficos vectoriales, fotografías y contenido escaneado. Optimizar estos documentos requiere aplicar la compresión apropiada a cada tipo de contenido. El concepto de Contenido Ráster Mixto (MRC) formalizó este enfoque: una página se segmenta en capas, generalmente una capa de primer plano (texto y arte lineal), una capa de fondo (contenido fotográfico) y una capa de máscara (que define qué partes de cada capa son visibles).

La segmentación MRC permite que el texto se comprima con JBIG2 o CCITT Grupo 4 a alta resolución (300+ DPI) mientras que las fotografías se comprimen con JPEG a menor resolución (150 DPI). Esta combinación logra resultados mucho mejores que aplicar un único método de compresión a toda la página. Una página a color escaneada que podría ocupar 2 MB como una sola imagen JPEG podría reducirse a 100-200 KB con segmentación MRC, con texto más nítido y calidad fotográfica aceptable.

No todas las herramientas de optimización de PDF admiten MRC. Las que lo hacen incluyen ABBYY FineReader, Kofax y ciertas configuraciones de Ghostscript. Cuando MRC no está disponible, aún puede optimizar contenido mixto asegurándose de que el proceso de creación del PDF use compresión apropiada por tipo de contenido: incrustar fotografías como JPEG mientras se mantiene el texto y el arte vectorial en su forma nativa con compresión Flate en el flujo de contenido.

Artefactos de compresión y evaluación de calidad

Comprender los artefactos de compresión le ayuda a elegir las configuraciones apropiadas y evaluar los resultados de optimización. Los artefactos JPEG incluyen bloqueo (patrones de cuadrícula de píxeles de 8x8 visibles a alta compresión), anillos (halos alrededor de bordes nítidos), bandas de color (gradientes suaves que se vuelven escalonados) y ruido de mosquito (patrones parpadeantes alrededor de los bordes en áreas de alto contraste). Estos artefactos son más visibles en áreas de color sólido adyacentes a detalles finos, que es exactamente el patrón que se encuentra en texto renderizado como imágenes.

La evaluación de calidad puede ser objetiva o subjetiva. Las métricas objetivas incluyen PSNR (Relación Señal-Ruido de Pico), SSIM (Índice de Similitud Estructural) y métricas más modernas como VMAF. El PSNR mide la relación de señal a ruido en decibelios; valores superiores a 40 dB generalmente indican pérdida de calidad imperceptible. El SSIM opera en una escala de 0 a 1 donde 1,0 significa idéntico; valores superiores a 0,95 se consideran típicamente excelentes. Sin embargo, estas métricas no siempre se correlacionan con la calidad percibida, ya que no modelan completamente el sistema visual humano.

Para fines prácticos, la mejor evaluación de calidad es la inspección visual en las condiciones de visualización previstas. Vea el PDF comprimido al 100% de zoom en una pantalla típica para documentos optimizados para pantalla. Para documentos impresos, imprima una página de prueba y compárela con la versión sin comprimir. Preste especial atención a la legibilidad del texto (especialmente texto pequeño), al detalle fotográfico en las áreas de interés y a los gradientes suaves. Si los artefactos son visibles en condiciones normales de visualización, reduzca el nivel de compresión hasta que desaparezcan.

Cómo elegir la configuración de compresión adecuada

La configuración de compresión óptima depende del propósito, el contenido y el método de distribución del documento. Para adjuntos de correo electrónico de documentos empresariales (texto con algunos gráficos y fotos), use compresión Flate para flujos de texto, JPEG calidad 65-75 para fotografías y reduzca la resolución de las imágenes a 150 DPI. Esto generalmente produce archivos de menos de 2 MB para un documento de 10-20 páginas.

Para documentos alojados en la web destinados a lectura en pantalla, se aplican configuraciones similares, con la adición de linealización para vista web rápida. Si el PDF se verá en dispositivos móviles, una reducción de resolución de imagen más agresiva a 96-120 DPI es aceptable, ya que las pantallas móviles rara vez superan los 150 DPI efectivos a distancias de visualización típicas.

Para documentos destinados a impresión profesional, preserve la resolución completa de la imagen (300 DPI para fotografías, 1200 DPI para arte lineal) y use compresión JPEG mínima (calidad 85-95) o compresión sin pérdida. Para documentos de archivo bajo estándares PDF/A, use solo los métodos de compresión permitidos por el nivel de conformidad PDF/A objetivo. PDF/A-1 prohíbe JPEG2000 y LZW, mientras que PDF/A-2 y PDF/A-3 permiten JPEG2000.

Como regla general, comprima una vez y en la etapa más tardía posible. Comprimir y descomprimir repetidamente imágenes JPEG causa pérdida de calidad generacional, donde los artefactos se acumulan con cada ciclo. Mantenga sus documentos maestros a plena calidad y produzca versiones comprimidas para canales de distribución específicos.