About this conversion
Convertissez HTML en TXT pour retirer chaque balise et n'obtenir que le texte. Idéal quand il vous faut du contenu brut pour de l'indexation, du comptage de mots, des aperçus email ou des outils d'accessibilité — partout où le balisage HTML serait du bruit.
When this conversion is useful
- Générer une version texte brut d'un email HTML
- Produire des extraits lisibles par moteur de recherche depuis une page HTML
- Compter les mots réels d'une page web sans gonfler le compte avec le balisage
- Injecter le contenu d'une page dans un script ou outil qui ne parse pas l'HTML
Quality and tradeoffs
Les balises sont retirées, mais l'ordre du texte suit la structure DOM de la source. Les éléments de bloc (paragraphes, titres, items de liste) sont séparés par des sauts de ligne ; les éléments inline restent inline. Le contenu rendu par JavaScript n'est pas capturé — uniquement le HTML source statique.
Frequently asked questions
Les hyperliens seront-ils préservés ?
Le texte du lien est préservé tel quel. Les URLs sont supprimées — en texte brut, les destinations de lien ne sont pas représentables inline.
Et les images et médias ?
Les images sont retirées. Leur `alt` n'est pas substitué automatiquement, vu qu'il manque souvent ou est de basse qualité.
L'ordre correspond-il à la lecture visuelle ?
Il correspond à l'ordre du DOM (source), qui correspond habituellement à l'ordre de lecture. Les pages qui s'appuient sur le CSS pour l'agencement (grilles réordonnées) peuvent produire des séquences surprenantes.