About this tool
Extrayez chaque hyperlien d'un PDF — chaque URL, chaque référence inter-document, chaque lien clickable — dans une liste propre. Utile pour auditer ce vers quoi un PDF pointe avant publication, archiver les références d'un article de recherche, ou migrer la structure de liens d'un PDF dans un tableur ou une base.
When to use it
- Auditer un contrat ou un rapport pour les liens externes avant publication
- Archiver la liste des URLs d'un article de recherche pour vérifier les références
- Migrer la structure de liens d'un rapport PDF dans un tableur
- Vérifier que tous les liens d'un PDF répondent encore (il faudra un vérificateur de liens à part)
- Produire une bibliographie de références en ligne à partir d'un document de recherche
What to expect
Seules les annotations de lien du PDF sont extraites (les zones clickables). Les URLs en texte brut qui ne sont pas formatées comme de vrais hyperliens ne seront pas détectées — pour celles-là, extrayez via l'outil Extraire le Texte, puis appliquez une regex sur les URLs. Les renvois internes (par exemple vers une figure) sont inclus à côté des URLs externes.
Frequently asked questions
Les URLs en texte brut dans le corps du document seront-elles extraites ?
Seulement si elles sont liées — c'est-à-dire clickables. Les URLs tapées dans le corps sans être transformées en liens réels ne sont pas détectées par l'extraction de liens. Pour celles-là, utilisez Extraire le Texte puis une regex d'URL.
Cela inclut-il les renvois internes ?
Oui. Les liens internes (par exemple un renvoi clickable de chapitre ou de figure) sont inclus à côté des URLs externes, avec une étiquette indiquant qu'ils sont internes.
Puis-je vérifier si les liens sont toujours actifs ?
Pas depuis cet outil — cela nécessite des requêtes HTTP vers chaque URL, ce que nous ne faisons pas. Une fois la liste obtenue, utilisez un vérificateur de liens ou un script rapide.