Volver a todas las guías

Solución de Problemas Comunes de PDF y Cómo Resolverlos

Soluciones prácticas para los problemas más frecuentes de PDF, incluyendo errores de renderizado, problemas de fuentes, enlaces rotos y recuperación de archivos dañados.

Matthias Baertschi
Founder & Lead Engineer
10 min

Problemas de Visualización de Fuentes

Los problemas de fuentes se encuentran entre los problemas de PDF más comunes. Cuando un PDF se muestra con fuentes incorrectas, caracteres ilegibles o texto faltante, la causa raíz está casi siempre relacionada con la incrustación de fuentes. Un PDF que no incrusta sus fuentes depende de que el sistema del visor tenga las mismas fuentes instaladas. Si las fuentes no están disponibles, el visor sustituye una fuente diferente, que puede tener métricas diferentes (anchos y alturas de caracteres), causando que el texto se superponga, desborde cuadros de texto o se muestre incorrectamente.

Para diagnosticar problemas de fuentes, verifique el estado de incrustación de fuentes del documento. En Adobe Acrobat, vaya a Archivo > Propiedades > Fuentes para ver una lista de todas las fuentes utilizadas y si cada una está incrustada, incrustada como subconjunto o no incrustada. Las fuentes listadas como "No Incrustadas" son las probables culpables. Si el PDF debe corregirse, la reincrustación de las fuentes es la solución. Esto requiere acceso a los archivos de fuentes y una herramienta que pueda incrustarlas (la herramienta Preflight de Acrobat, Ghostscript o una biblioteca PDF).

Los problemas de codificación de caracteres producen un síntoma diferente: texto que se ve correcto en pantalla pero se copia como caracteres ilegibles. Esto sucede cuando la fuente del PDF no incluye un mapeo ToUnicode adecuado, que indica al visor qué carácter representa cada código de glifo. Sin este mapeo, el visor puede renderizar el glifo (porque tiene las instrucciones de dibujo de la fuente) pero no puede determinar el carácter para la selección y copia de texto. Recrear el PDF desde el documento de origen con un productor de PDF moderno generalmente resuelve este problema.

Diferencias de Renderizado Entre Visores

Un PDF que se ve perfecto en un visor puede mostrarse de manera diferente en otro. Aunque la especificación PDF es detallada, diferentes visores la implementan de manera diferente, lo que lleva a variaciones de renderizado. Las áreas comunes de inconsistencia incluyen el manejo de transparencia (los visores más antiguos pueden no admitir la transparencia correctamente), la gestión del color (los visores sin gestión de color ICC pueden mostrar colores de manera diferente) y el renderizado de fuentes (el hinting y el antialiasing varían entre visores y sistemas operativos).

La transparencia es una fuente frecuente de diferencias de renderizado. PDF 1.4 introdujo la transparencia (mezcla alfa), y aunque los visores modernos la manejan bien, algunos visores más antiguos o más simples renderizan la transparencia incorrectamente o la ignoran por completo. Los documentos con efectos de transparencia (sombras paralelas, marcas de agua semitransparentes, modos de mezcla) pueden verse diferentes en diferentes visores. El aplanamiento de la transparencia, que convierte los elementos transparentes en opacos que se ven igual, resuelve estos problemas a costa de la editabilidad.

Para minimizar las diferencias de renderizado, evite funciones avanzadas cuando se necesita amplia compatibilidad. Utilice fuentes incrustadas exclusivamente. Evite la transparencia si el documento puede visualizarse en visores básicos. Especifique un perfil de salida (perfil de color ICC) para un color consistente. Pruebe el PDF en múltiples visores: Adobe Acrobat (la implementación de referencia), el visor de PDF integrado del navegador web (Chrome usa PDFium, Firefox usa PDF.js) y al menos otro visor (Foxit, Sumatra o Vista Previa en macOS). Si se encuentra un problema de renderizado específico, determine si es un error del visor o un problema de estructura del documento, y ajuste en consecuencia.

Enlaces Rotos y Navegación

Los hipervínculos rotos y los problemas de navegación degradan la utilidad de los PDF interactivos. Los enlaces internos (que apuntan a otras páginas dentro del mismo documento) se rompen cuando se agregan, eliminan o reordenan páginas. Los enlaces externos (que apuntan a URL) se rompen cuando la página web de destino se mueve o se elimina. Ambos son comunes en documentos que han sido editados después de su creación inicial.

Para corregir enlaces internos rotos, primero necesita identificarlos. Adobe Acrobat puede listar todos los enlaces en un documento a través de Editar > Preferencias > Visualización de Página > Mostrar Todos los Enlaces, o usando la herramienta de edición de enlaces en cada página. Los enfoques programáticos usando bibliotecas como PyPDF o pdf-lib pueden extraer todas las anotaciones de enlace y sus destinos, marcando cualquiera que haga referencia a páginas inexistentes o destinos inválidos.

Los enlaces externos rotos son más difíciles de detectar sin probar realmente cada URL. Un script puede extraer todas las URL de un PDF y probar cada una usando solicitudes HTTP, marcando cualquiera que devuelva errores 404, redirecciones o fallos de conexión. Para documentos que se publicarán, ejecutar esta verificación de enlaces antes de la publicación previene que los usuarios encuentren enlaces rotos. Para documentos de larga vida, considere usar URL estables (DOI para referencias académicas, enlaces permanentes para recursos gubernamentales) en lugar de URL directas que pueden cambiar. Cuando se encuentren enlaces rotos, actualícelos en el PDF usando una herramienta de edición de enlaces o reemplácelos con versiones archivadas de la Wayback Machine.

PDF Corruptos y Dañados

La corrupción de PDF puede variar desde problemas estructurales menores hasta ilegibilidad completa. Las causas comunes incluyen descargas incompletas (el archivo no se transfirió completamente), errores de disco (corrupción de datos en el medio de almacenamiento), bloqueos de software durante el guardado (el archivo no se cerró correctamente) y modificaciones del sistema de correo electrónico (algunos sistemas alteran los adjuntos binarios). Los síntomas van desde un mensaje de error al abrir el archivo hasta páginas faltantes, páginas en blanco o contenido ilegible.

Las herramientas de reparación de PDF intentan reconstruir la estructura del archivo a partir de los datos sobrevivientes. Adobe Acrobat intenta automáticamente la reparación al abrir un archivo dañado e informará lo que pudo recuperar. QPDF puede intentar reparar problemas estructurales usando su modo "--replace-input" con recuperación de errores. Ghostscript puede reprocesar un PDF dañado, creando efectivamente un nuevo archivo a partir de cualquier contenido que pueda leer del dañado.

Para archivos severamente corruptos donde la reparación automatizada falla, las técnicas de recuperación manual pueden rescatar algo de contenido. Los archivos PDF contienen tablas de referencias cruzadas que mapean las ubicaciones de los objetos; si estas están dañadas pero los objetos mismos están intactos, herramientas como mutool (de MuPDF) pueden intentar reconstruir la tabla de referencias cruzadas. Si solo páginas específicas están corruptas, extraer las páginas buenas en un nuevo documento preserva el contenido recuperable. Como prevención, mantenga copias de seguridad de PDF importantes, verifique la integridad de los archivos después de las transferencias usando sumas de verificación y evite guardar PDF en medios de almacenamiento poco confiables.

Problemas de Impresión

Los problemas de impresión de PDF incluyen páginas en blanco, escalado incorrecto, gráficos faltantes, cambios de color e impresión lenta. Las páginas en blanco al imprimir normalmente indican un problema de transparencia o fuente que el controlador de impresión no puede manejar. Intente aplanar el documento (convertir todo el texto a contornos y aplanar la transparencia) antes de imprimir. Si páginas específicas están en blanco, pueden contener contenido en un espacio de color que la impresora no admite.

Los problemas de escalado son comunes: el documento se imprime demasiado grande, demasiado pequeño o con contenido cortado en los bordes. La mayoría de los visores de PDF establecen por defecto el escalado de la página para ajustarla al papel, lo que reduce la salida si el tamaño de página del PDF es mayor que el papel. Para documentos donde el tamaño exacto importa (planos arquitectónicos, plantillas con dimensiones precisas), imprima al 100% de escala ("Tamaño real" en el diálogo de impresión) y verifique que el tamaño del papel coincida o exceda el tamaño de página del PDF.

La impresión lenta a menudo indica que el PDF contiene gráficos vectoriales complejos o imágenes de alta resolución que sobrecargan el procesador de la impresora. Rasterizar el PDF a una resolución fija (300 DPI para impresión estándar) antes de enviarlo a la impresora puede acelerar drásticamente la impresión al trasladar la carga de renderizado de la impresora a la computadora. En el diálogo de impresión de Adobe Acrobat, la opción "Imprimir como imagen" hace esto automáticamente. Para problemas recurrentes de rendimiento de impresión con documentos específicos, volver a guardar el PDF con gráficos optimizados e imágenes submuestreadas puede ser una solución más permanente.

Problemas de Tamaño de Archivo

Los archivos PDF inesperadamente grandes son una preocupación frecuente. Un documento de 10 páginas no debería ser de 100 MB, pero varios factores pueden causar el inflado del archivo. La causa más común son las imágenes de alta resolución incrustadas. Una sola fotografía sin comprimir de 300 DPI puede ser de más de 25 MB. Verifique las imágenes en el documento usando Archivo > Propiedades > Fuentes (que también lista los recursos de imagen en algunos visores) o extrayendo imágenes con pdfimages.

Otras causas de gran tamaño de archivo incluyen fuentes incrustadas (particularmente múltiples incrustaciones de fuentes completas en lugar de subconjuntos), objetos duplicados (la misma imagen incrustada múltiples veces en lugar de referenciada), datos de guardado incremental (historial de edición acumulado) y archivos o adjuntos incrustados. Un PDF que ha pasado por muchas rondas de edición puede acumular una sobrecarga significativa de los guardados incrementales, donde cada guardado añade nuevos datos sin eliminar los antiguos.

Para reducir el tamaño del archivo, utilice las técnicas de optimización descritas en los artículos de compresión y optimización: comprima imágenes, haga subconjuntos de fuentes, elimine objetos duplicados y guarde como un nuevo archivo para eliminar la sobrecarga de guardado incremental. La función "Reducir tamaño de archivo" de Adobe Acrobat y el "Optimizador de PDF" más detallado aplican estas técnicas con configuraciones ajustables. Para una reducción rápida, guardar con "Guardar como" (en lugar de "Guardar") en la mayoría de las herramientas PDF crea un archivo limpio sin sobrecarga de actualización incremental. Para la máxima reducción, reprocese el archivo a través de Ghostscript con la configuración de calidad apropiada.

Problemas de Formularios y Elementos Interactivos

Los elementos interactivos de PDF frecuentemente causan problemas en diferentes visores y plataformas. Los campos de formulario que funcionan en Adobe Acrobat pueden no funcionar en los visores de PDF integrados de los navegadores web, que tienen soporte limitado para formularios. Los cálculos y validaciones JavaScript pueden no ejecutarse en visores que no son de Adobe. Los menús desplegables pueden mostrarse de manera diferente y los campos de fecha pueden comportarse de manera inconsistente entre plataformas.

Para maximizar la compatibilidad de formularios, utilice solo funciones básicas de formulario: campos de texto, casillas de verificación, botones de opción y listas desplegables simples. Evite la validación y los cálculos dependientes de JavaScript si el formulario se completará en visores que no son de Adobe. Pruebe el formulario en el entorno de cumplimentación previsto antes de distribuirlo. Si debe usar funciones avanzadas de formulario, especifique en las instrucciones del formulario que se requiere Adobe Acrobat o Adobe Reader.

Los problemas de validación de firmas digitales son comunes. Una firma puede mostrarse como "Desconocida" o "Inválida" en un visor que no confía en la Autoridad de Certificación del certificado de firma. Esto no significa necesariamente que la firma sea fraudulenta; puede significar simplemente que el visor no tiene la CA en su almacén de confianza. Para resolver esto, el destinatario puede agregar manualmente la CA a su almacén de confianza, o el firmante puede usar un certificado de una CA ampliamente confiable (una en la Lista de Confianza Aprobada de Adobe). Las firmas también pueden mostrarse como inválidas después de cualquier modificación del documento, incluso modificaciones permitidas como completar otros campos de formulario. Comprender la diferencia entre una firma que es criptográficamente inválida (el documento fue manipulado) y una que es inverificable (el certificado no es de confianza) es importante para el manejo adecuado.

Matthias Baertschi
Founder & Lead Engineer

Matthias es el fundador e ingeniero principal de PDF Tools y trabaja en la canalización de procesamiento de PDF en el navegador con pdf-lib y pdfjs-dist. Su enfoque es la privacidad del lado del cliente: los documentos se procesan localmente y nunca se suben a un servidor. Ver perfil del autor