Volver a todas las guías

Cómo optimizar PDF para distribución por correo electrónico y web

Técnicas prácticas para reducir el tamaño de archivos PDF sin sacrificar la calidad, incluyendo compresión de imágenes, subconjuntos de fuentes y optimización web.

Matthias Baertschi
Founder & Lead Engineer
8 min

Por qué importa el tamaño de archivo PDF para la distribución

El tamaño de archivo PDF afecta directamente la eficacia con la que puede compartir documentos por correo electrónico y la web. La mayoría de los proveedores de correo electrónico imponen límites de adjuntos: Gmail limita los adjuntos a 25 MB, Outlook a 20 MB, y muchos servidores de correo corporativos establecen umbrales aún más bajos de 10 MB. Cuando un PDF excede estos límites, el remitente debe recurrir a servicios de intercambio de archivos, lo que añade fricción a la comunicación y puede generar preocupaciones de seguridad para el destinatario.

En la web, el tamaño del archivo afecta el tiempo de carga de la página, lo que a su vez impacta la participación del usuario y las clasificaciones en motores de búsqueda. Google ha confirmado repetidamente que la velocidad de la página es un factor de clasificación, y esto se extiende a los documentos PDF enlazados desde páginas web. Un estudio de Google descubrió que a medida que el tiempo de carga de la página aumenta de 1 a 3 segundos, la probabilidad de que un usuario abandone la página aumenta un 32%. Para PDF incrustados en páginas web o servidos como descargas, cada megabyte importa.

Más allá de los límites técnicos, los PDF grandes crean una mala experiencia de usuario en dispositivos móviles. Los usuarios con conexiones celulares pueden tener planes de datos limitados, y descargar un PDF de 50 MB con una conexión 3G puede llevar varios minutos. Optimizar los PDF en tamaño garantiza que sus documentos sean accesibles para la audiencia más amplia posible, independientemente de su velocidad de conexión, proveedor de correo electrónico o capacidades del dispositivo.

Comprender qué hace que los PDF sean grandes

Para reducir eficazmente el tamaño de un PDF, necesita comprender qué contribuye al aumento de tamaño del archivo. El mayor contribuyente son casi siempre las imágenes. Una sola fotografía de alta resolución incrustada a 300 DPI a todo color puede consumir varios megabytes. Los PDF creados a partir de documentos escaneados son esencialmente colecciones de imágenes grandes y pueden alcanzar fácilmente cientos de megabytes para documentos de múltiples páginas.

Las fuentes son el segundo mayor contribuyente. Cuando un PDF incrusta un archivo de fuente completo, incluye todos los glifos de la tipografía, incluso los que no se usan en el documento. Una sola fuente OpenType puede ocupar 500 KB o más, y los documentos que usan múltiples familias de fuentes pueden acumular varios megabytes solo en datos de fuentes. El subconjunto de fuentes, que incluye solo los glifos realmente utilizados, puede reducir esto drásticamente.

Otros contribuyentes incluyen multimedia incrustado (audio, video, modelos 3D), datos de campos de formulario, JavaScript, metadatos del documento, miniaturas y la propia estructura del documento. Los PDF que han sido editados repetidamente pueden contener objetos huérfanos, datos de guardado incremental de versiones anteriores y recursos duplicados. Un PDF que ha pasado por muchas rondas de edición puede ser significativamente más grande que uno creado desde cero con el mismo contenido, simplemente debido a la sobrecarga acumulada del proceso de edición.

Estrategias de compresión de imágenes

Dado que las imágenes son el principal factor del tamaño de archivo PDF, la compresión de imágenes ofrece la mayor oportunidad de reducción. PDF admite varios métodos de compresión de imágenes: JPEG (con pérdida), JPEG2000 (con y sin pérdida), Flate/ZIP (sin pérdida), CCITT (para imágenes monocromáticas) y JBIG2 (para monocromáticas, con modo de pérdida opcional). La elección del método de compresión depende del contenido de la imagen y del compromiso de calidad aceptable.

Para contenido fotográfico, la compresión JPEG con una configuración de calidad de 60-75% generalmente produce archivos visualmente indistinguibles del original a distancias de visualización normales, reduciendo el tamaño entre un 80-90% en comparación con imágenes sin comprimir. Si el PDF está destinado a visualización en pantalla en lugar de impresión, reducir la resolución de imagen a 150 DPI (desde los típicos 300 DPI) reduce a la mitad la cantidad de píxeles en cada dimensión, reduciendo los datos de imagen en aproximadamente un 75%.

Para documentos que contienen principalmente texto y arte lineal (como documentos escaneados después de OCR), la compresión monocromática usando CCITT Grupo 4 o JBIG2 es mucho más eficiente que JPEG. Convertir un escaneo en color a monocromático y aplicar compresión CCITT puede reducir una página de 5 MB a menos de 50 KB. Para páginas de contenido mixto con fotos y texto, algunas herramientas pueden segmentar la página y aplicar diferente compresión a diferentes regiones, usando JPEG para las áreas fotográficas y CCITT para las regiones de texto.

Optimización y subconjuntos de fuentes

El subconjunto de fuentes es el proceso de eliminar glifos no utilizados de las fuentes incrustadas. Si su documento usa la palabra «Hola» en Arial, solo necesita los glifos para H, o, l y a, no el conjunto completo de caracteres de Arial de más de 3.000 glifos. La mayoría de las herramientas de creación de PDF realizan el subconjunto automáticamente, pero los documentos editados en ciertas aplicaciones pueden acumular incrustaciones de fuentes completas.

Para verificar el uso de fuentes en un PDF, examine las propiedades del documento en Adobe Acrobat o use una herramienta de línea de comandos como pdffonts (parte de las utilidades Poppler). Esto mostrará cada fuente, si está incrustada o en subconjunto, y la codificación utilizada. Busque fuentes etiquetadas como «Incrustada» en lugar de «Subconjunto incrustado» como candidatas para optimización.

Otra técnica de optimización de fuentes es convertir el texto a contornos (trazados vectoriales) para documentos que no necesitan extracción de texto ni capacidad de búsqueda. Esto elimina la incrustación de fuentes por completo y reemplaza cada carácter con su representación geométrica. Sin embargo, esto aumenta el tamaño del archivo para documentos con mucho texto porque los trazados vectoriales requieren más datos que las referencias de fuentes para grandes cantidades de texto. Es más útil para documentos con texto mínimo, como archivos de diseño o logotipos. Para documentos donde la capacidad de búsqueda es importante, mantenga las fuentes incrustadas y en subconjunto en lugar de convertirlas a contornos.

Linealización: vista web rápida

La linealización, también conocida como «Vista web rápida» u «optimización web», reestructura un PDF para que la primera página pueda mostrarse antes de que se haya descargado el archivo completo. En un PDF no linealizado, la tabla de referencias cruzadas que mapea las ubicaciones de los objetos está al final del archivo. Un navegador web debe descargar el archivo completo antes de poder localizar y renderizar cualquier página. En un PDF linealizado, la información de referencias cruzadas para la primera página se coloca al principio, junto con todos los objetos necesarios para renderizar esa primera página.

Esta reorganización no tiene efecto en el tamaño del archivo pero mejora drásticamente el rendimiento percibido para PDF alojados en la web. Cuando un usuario hace clic en un enlace a un PDF linealizado, su navegador puede comenzar a renderizar la primera página casi de inmediato mientras el resto del archivo continúa descargándose en segundo plano. Para un documento de 10 MB, esto significa que el usuario ve contenido en segundos en lugar de esperar la descarga completa.

La linealización es especialmente importante para PDF servidos desde servidores web que admiten solicitudes de rango de bytes HTTP. Con soporte de rango de bytes, un visor de PDF puede solicitar porciones específicas del archivo, permitiendo a los usuarios saltar a cualquier página sin descargar el documento completo. La opción «Guardar como» de Adobe Acrobat incluye una configuración de «Vista web rápida». Herramientas de línea de comandos como QPDF pueden linealizar PDF existentes. Si publica PDF regularmente en un sitio web, incorpore la linealización en su flujo de trabajo de publicación.

Eliminación de elementos PDF innecesarios

Los PDF a menudo contienen elementos que aumentan el tamaño del archivo sin proporcionar valor al lector final. Eliminar estos elementos puede reducir significativamente el tamaño. Comience con los metadatos: los documentos PDF pueden contener extensos metadatos XMP, propiedades personalizadas, historial de revisiones del documento y miniaturas incrustadas. Aunque los metadatos son útiles para la gestión de documentos, a menudo son innecesarios para la distribución y pueden añadir decenas de kilobytes al tamaño del archivo.

Los campos de formulario, JavaScript y los elementos interactivos añaden sobrecarga. Si un formulario PDF rellenable ha sido completado y el destinatario no necesita editar las respuestas, aplanar el formulario (convertir los campos del formulario en contenido estático) reduce el tamaño y evita modificaciones accidentales. Del mismo modo, el JavaScript utilizado para la validación de formularios o el contenido dinámico puede eliminarse de la versión final distribuida.

Las anotaciones y marcas que formaron parte de un proceso de revisión deben aplanarse o eliminarse antes de la distribución. Cada comentario, resaltado o nota adhesiva es un objeto PDF separado que añade al tamaño del archivo. La información de producción de impresión como perfiles de color, intenciones de salida y marcas de impresora son importantes para la impresión comercial pero innecesarias para la distribución por correo electrónico y web. Eliminar solo los perfiles ICC puede ahorrar varios cientos de kilobytes. Finalmente, elimine cualquier archivo incrustado o adjunto que no sea esencial para el propósito del documento.

Flujos de trabajo de optimización automatizada

Para las organizaciones que producen y distribuyen PDF regularmente, la optimización manual es insostenible. Establecer flujos de trabajo automatizados asegura una calidad y tamaño de archivo consistentes en todos los documentos publicados. El enfoque más sencillo es configurar los ajustes de creación de PDF en su aplicación de creación. En Microsoft Word, las opciones de exportación a PDF le permiten establecer la resolución de imagen, la incrustación de fuentes y si incluir información que no es de impresión. Configurar esto correctamente en el momento de la creación evita la necesidad de optimización posterior.

Para el procesamiento posterior, herramientas como Ghostscript proporcionan optimización de PDF por línea de comandos que puede integrarse en scripts y sistemas de compilación. Los modos de salida PDF de Ghostscript (screen, ebook, printer, prepress) aplican compresión progresivamente menos agresiva, lo que facilita elegir el equilibrio adecuado para su caso de uso. La configuración «ebook», que apunta a imágenes de 150 DPI y subconjuntos de fuentes estándar, es un buen valor predeterminado para la distribución por correo electrónico y web.

Las herramientas de PDF basadas en navegador ofrecen optimización sin instalar software. El procesamiento del lado del cliente garantiza que los documentos sensibles nunca abandonen su dispositivo. Para entornos de equipo, establezca directrices de tamaño de PDF (por ejemplo, menos de 5 MB para adjuntos de correo electrónico, menos de 2 MB para descargas web) y proporcione a los miembros del equipo procedimientos de optimización fáciles de seguir. Las plantillas de documentos deben estar preconfiguradas con ajustes optimizados para que la salida predeterminada ya sea adecuada para la distribución.

Medición y validación de los resultados de optimización

Después de optimizar un PDF, valide que la optimización logró la reducción de tamaño deseada sin pérdida de calidad inaceptable. Compare el tamaño del archivo optimizado con sus umbrales objetivo. Un PDF bien optimizado de un documento empresarial típico de 10 páginas con algunas imágenes debería ocupar menos de 2 MB. Los documentos de solo texto deberían estar muy por debajo de 500 KB.

La calidad visual debe verificarse al tamaño de visualización previsto. Si el PDF se verá en pantalla, haga zoom al 100% e inspeccione las imágenes y el texto en busca de artefactos. Los artefactos de compresión JPEG son más visibles en áreas de color sólido adyacentes a áreas detalladas, y en texto renderizado como imágenes. Si el PDF podría imprimirse, haga zoom al 200-300% para verificar problemas de calidad que serían visibles en la impresión.

Verifique que el texto siga siendo seleccionable y buscable después de la optimización. Algunas herramientas de optimización agresivas pueden convertir inadvertidamente el texto en imágenes. Compruebe que los hipervínculos, marcadores y la tabla de contenidos sigan funcionando correctamente. Para documentos accesibles, ejecute una verificación de accesibilidad para asegurar que las etiquetas, el orden de lectura y el texto alternativo sobrevivieron al proceso de optimización. Conserve una copia del archivo original sin optimizar en caso de que necesite volver a optimizar con diferentes configuraciones o extraer imágenes de alta calidad posteriormente.

Matthias Baertschi
Founder & Lead Engineer

Matthias es el fundador e ingeniero principal de PDF Tools y trabaja en la canalización de procesamiento de PDF en el navegador con pdf-lib y pdfjs-dist. Su enfoque es la privacidad del lado del cliente: los documentos se procesan localmente y nunca se suben a un servidor. Ver perfil del autor