About this tool
Extrae cada hipervínculo de un PDF — cada URL, cada referencia entre documentos, cada enlace clickable — en una lista limpia. Útil para auditar a qué enlaza un PDF antes de publicar, archivar las referencias en un artículo de investigación, o migrar la estructura de enlaces de un PDF a una hoja de cálculo o base de datos.
When to use it
- Auditar un contrato o informe en busca de enlaces externos antes de publicar
- Archivar la lista de URLs de un artículo de investigación para verificación de referencias
- Migrar la estructura de enlaces de un informe PDF a una hoja de cálculo
- Verificar que todos los enlaces de un PDF aún resuelven (necesitarás un comprobador de enlaces aparte)
- Producir una bibliografía de referencias online a partir de un documento de investigación
What to expect
Solo se extraen las anotaciones de enlace del PDF (las áreas clickables). Las URLs en texto plano que no estén formateadas como hipervínculos reales no se detectarán — esas las extraerías con la herramienta Extraer Texto y luego un regex de URLs. Las referencias internas (p. ej., a figuras) se incluyen junto con las URLs externas.
Frequently asked questions
¿Las URLs en texto plano del cuerpo del documento se extraerán?
Solo si están con hipervínculo — es decir, son clickables. Las URLs escritas en el cuerpo sin hacerlas enlaces reales no se detectan. Para esas, usa Extraer Texto y luego un regex de URLs.
¿Esto incluye referencias internas?
Sí. Los enlaces internos (p. ej., una referencia clickable a un capítulo o figura) se incluyen junto con las URLs externas, con una etiqueta indicando que son internas.
¿Puedo comprobar si los enlaces siguen activos?
No desde esta herramienta — eso requiere peticiones HTTP a cada URL, que no hacemos. Una vez tengas la lista, usa un comprobador de enlaces o un script rápido para verificarlas.