Konverter en PDF til HTML
- Dashboard
- Dokumentation
- API
Træk en PDF hertil, eller klik for at vælge
Din fil forlader aldrig din browser.
Forhåndsvisning
Hvad bruges konvertering af PDF til HTML til?
Dette værktøj omdanner en PDF-fil til en selvstændig HTML-side, der trofast gengiver originalens udseende, side for side, samtidig med at teksten bevares, så den kan markeres og kopieres.
Den producerede HTML er et enkelt og selvstændigt dokument: hver side i PDF-en bliver en placeret blok, med billedet af siden som baggrund og et gennemsigtigt tekstlag ovenpå. Du kan forhåndsvise, downloade eller kopiere det med et enkelt klik.
Hvordan fungerer værktøjet?
Hele konverteringen foregår i din browser takket være gengivelsesmotoren pdf.js (den samme som i Firefox). Din fil sendes aldrig til en server: det er en afgørende fordel for fortrolige, kontraktmæssige eller regulatoriske dokumenter.
Hver side gengives som et billede i høj opløsning (du vælger kvaliteten), hvorefter et usynligt tekstlag lægges ovenpå for at muliggøre markering og søgning. Du kan deaktivere dette lag, hvis du kun ønsker en visuel gengivelse.
Almindelige anvendelser
- Integrere en PDF på en webside og samtidig bevare tekst, der kan markeres.
- Arkivere eller dele et dokument i en form, der kan læses uden en PDF-læser.
- Udtrække og kopiere teksten fra en PDF side for side.
- Hurtigt forhåndsvise indholdet af en PDF uden dedikeret software.
Hvilken troværdighed kan man forvente?
Den visuelle gengivelse er meget tro, fordi hver side er et billede, der er fremstillet af selve PDF-motoren: skrifttyper, layout, farver og grafik fremstår som i originalen.
Til gengæld er det ikke en „semantisk" HTML, der kan redigeres igen: vektorgrafik gengives som billede, og tekstlaget tjener først og fremmest til markering, idet dets placering er tilnærmet. For en scannet PDF (billede uden tekst) kan der ikke genereres noget tekstlag uden optisk tegngenkendelse (OCR).
Ofte stillede spørgsmål
Bliver min fil sendt et eller andet sted hen?
Nej. Konverteringen udføres udelukkende i din browser; PDF-en forlader aldrig din enhed og overføres ikke til nogen server.
Kan teksten i HTML-en markeres?
Ja, så længe PDF-en indeholder rigtig tekst. Et gennemsigtigt tekstlag lægges over billedet af hver side for at muliggøre markering, kopiering og søgning.
Hvorfor virker teksten en smule forskudt ved markering?
Den synlige gengivelse kommer fra billedet af siden; tekstlaget er placeret tilnærmet. En eventuel forskydning påvirker kun markeringsområdet, ikke dokumentets udseende.
Fungerer scannede PDF-filer?
Billedet af hver side gengives korrekt, men ingen tekst kan markeres: en scannet PDF indeholder ikke tekst, kun et billede. Optisk tegngenkendelse (OCR) ville være nødvendig.
Understøttes dokumenter med flere sider?
Ja. Alle sider konverteres og samles i en enkelt HTML-fil i det oprindelige dokuments rækkefølge.
Anmodningseksempel
curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
-F "file=@/path/to/file"
Inputskema
| Felt | Type | Påkrævet | Standard |
|---|---|---|---|
file |
file | – |
dette værktøj forventer en fil - brug Content-Type multipart/form-data i stedet for application/json
Endpoints
GET https://cdrn.fr/api/v1/tools- lister alle tilgængelige værktøjerGET https://cdrn.fr/api/v1/tools/pdf-to-html-converter- henter skemaet for dette værktøjPOST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute- udfører dette værktøj med et JSON-payload