Konverter en PDF til HTML

konverterer en PDF til en selvstændig HTML-side med et tekstlag, der kan markeres, uden at nogen fil uploades; konverteringen sker udelukkende i din browser

Træk en PDF hertil, eller klik for at vælge

Din fil forlader aldrig din browser.

Gengivelseskvalitet

Hvad bruges konvertering af PDF til HTML til?

Dette værktøj omdanner en PDF-fil til en selvstændig HTML-side, der trofast gengiver originalens udseende, side for side, samtidig med at teksten bevares, så den kan markeres og kopieres.

Den producerede HTML er et enkelt og selvstændigt dokument: hver side i PDF-en bliver en placeret blok, med billedet af siden som baggrund og et gennemsigtigt tekstlag ovenpå. Du kan forhåndsvise, downloade eller kopiere det med et enkelt klik.

Hvordan fungerer værktøjet?

Hele konverteringen foregår i din browser takket være gengivelsesmotoren pdf.js (den samme som i Firefox). Din fil sendes aldrig til en server: det er en afgørende fordel for fortrolige, kontraktmæssige eller regulatoriske dokumenter.

Hver side gengives som et billede i høj opløsning (du vælger kvaliteten), hvorefter et usynligt tekstlag lægges ovenpå for at muliggøre markering og søgning. Du kan deaktivere dette lag, hvis du kun ønsker en visuel gengivelse.

Almindelige anvendelser

  • Integrere en PDF på en webside og samtidig bevare tekst, der kan markeres.
  • Arkivere eller dele et dokument i en form, der kan læses uden en PDF-læser.
  • Udtrække og kopiere teksten fra en PDF side for side.
  • Hurtigt forhåndsvise indholdet af en PDF uden dedikeret software.

Hvilken troværdighed kan man forvente?

Den visuelle gengivelse er meget tro, fordi hver side er et billede, der er fremstillet af selve PDF-motoren: skrifttyper, layout, farver og grafik fremstår som i originalen.

Til gengæld er det ikke en „semantisk" HTML, der kan redigeres igen: vektorgrafik gengives som billede, og tekstlaget tjener først og fremmest til markering, idet dets placering er tilnærmet. For en scannet PDF (billede uden tekst) kan der ikke genereres noget tekstlag uden optisk tegngenkendelse (OCR).

Ofte stillede spørgsmål

Bliver min fil sendt et eller andet sted hen?

Nej. Konverteringen udføres udelukkende i din browser; PDF-en forlader aldrig din enhed og overføres ikke til nogen server.

Kan teksten i HTML-en markeres?

Ja, så længe PDF-en indeholder rigtig tekst. Et gennemsigtigt tekstlag lægges over billedet af hver side for at muliggøre markering, kopiering og søgning.

Hvorfor virker teksten en smule forskudt ved markering?

Den synlige gengivelse kommer fra billedet af siden; tekstlaget er placeret tilnærmet. En eventuel forskydning påvirker kun markeringsområdet, ikke dokumentets udseende.

Fungerer scannede PDF-filer?

Billedet af hver side gengives korrekt, men ingen tekst kan markeres: en scannet PDF indeholder ikke tekst, kun et billede. Optisk tegngenkendelse (OCR) ville være nødvendig.

Understøttes dokumenter med flere sider?

Ja. Alle sider konverteres og samles i en enkelt HTML-fil i det oprindelige dokuments rækkefølge.

Anmodningseksempel

curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
  -F "file=@/path/to/file"

Inputskema

Felt Type Påkrævet Standard
file file

dette værktøj forventer en fil - brug Content-Type multipart/form-data i stedet for application/json

Endpoints

  • GET https://cdrn.fr/api/v1/tools - lister alle tilgængelige værktøjer
  • GET https://cdrn.fr/api/v1/tools/pdf-to-html-converter - henter skemaet for dette værktøj
  • POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute - udfører dette værktøj med et JSON-payload