Een PDF naar HTML converteren

zet een PDF om in een zelfstandige HTML-pagina met een selecteerbare tekstlaag, zonder dat er een bestand wordt verzonden; de conversie gebeurt volledig in uw browser

Sleep hier een PDF naartoe, of klik om er een te kiezen

Uw bestand verlaat nooit uw browser.

Weergavekwaliteit

Waarvoor dient de conversie van PDF naar HTML?

Deze tool zet een PDF-bestand om in een zelfstandige HTML-pagina die het uiterlijk van het origineel getrouw weergeeft, pagina voor pagina, terwijl de tekst selecteerbaar en kopieerbaar blijft.

De geproduceerde HTML is één enkel, op zichzelf staand document: elke pagina van de PDF wordt een gepositioneerd blok, met de afbeelding van de pagina als achtergrond en een transparante tekstlaag eroverheen. U kunt het voorvertonen, downloaden of kopiëren met één klik.

Hoe werkt de tool?

De volledige conversie verloopt in uw browser, dankzij de renderengine pdf.js (dezelfde als die van Firefox). Uw bestand wordt nooit naar een server verzonden: dat is een doorslaggevend voordeel voor vertrouwelijke, contractuele of wettelijke documenten.

Elke pagina wordt weergegeven als een afbeelding in hoge resolutie (u kiest de kwaliteit), waarna een onzichtbare tekstlaag wordt geplaatst om selecteren en zoeken mogelijk te maken. U kunt deze laag uitschakelen als u alleen een visuele weergave wilt.

Veelvoorkomende toepassingen

  • Een PDF in een webpagina integreren met behoud van selecteerbare tekst.
  • Een document archiveren of delen in een raadpleegbare vorm zonder PDF-lezer.
  • De tekst van een PDF pagina voor pagina uittrekken en kopiëren.
  • De inhoud van een PDF snel voorvertonen zonder speciale software.

Welke getrouwheid kunt u verwachten?

De visuele weergave is zeer getrouw, want elke pagina is een afbeelding die door de PDF-engine zelf wordt geproduceerd: lettertypen, opmaak, kleuren en grafieken verschijnen zoals in het origineel.

Het is echter geen « semantische », herbewerkbare HTML: vectorafbeeldingen worden als afbeelding weergegeven, en de tekstlaag dient vooral voor de selectie, waarbij de positionering bij benadering is. Voor een gescande PDF (afbeelding zonder tekst) kan geen tekstlaag worden gegenereerd zonder optische tekenherkenning (OCR).

Veelgestelde vragen

Wordt mijn bestand ergens naartoe verzonden?

Nee. De conversie wordt volledig in uw browser uitgevoerd; de PDF verlaat nooit uw apparaat en wordt naar geen enkele server verzonden.

Is de tekst van de HTML selecteerbaar?

Ja, zolang de PDF echte tekst bevat. Een transparante tekstlaag wordt over de afbeelding van elke pagina geplaatst om selecteren, kopiëren en zoeken mogelijk te maken.

Waarom lijkt de tekst bij het selecteren licht verschoven?

De zichtbare weergave komt van de afbeelding van de pagina; de tekstlaag wordt bij benadering gepositioneerd. Een eventuele verschuiving treft alleen het selectiegebied, niet het uiterlijk van het document.

Werken gescande PDF's?

De afbeelding van elke pagina wordt correct gereproduceerd, maar er kan geen tekst worden geselecteerd: een gescande PDF bevat geen tekst, alleen een afbeelding. Optische tekenherkenning (OCR) zou nodig zijn.

Worden documenten met meerdere pagina's ondersteund?

Ja. Alle pagina's worden geconverteerd en samengevoegd in één enkel HTML-bestand, in de volgorde van het oorspronkelijke document.

Voorbeeldverzoek

curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
  -F "file=@/path/to/file"

Invoerschema

Veld Type Vereist Standaard
file file

deze tool verwacht een bestand - gebruik Content-Type multipart/form-data in plaats van application/json

Endpoints

  • GET https://cdrn.fr/api/v1/tools - toont alle beschikbare tools
  • GET https://cdrn.fr/api/v1/tools/pdf-to-html-converter - geeft het schema van deze tool terug
  • POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute - voert deze tool uit met een JSON-payload