Konvertera en PDF till HTML
- Panel
- Dokumentation
- API
Dra en PDF hit, eller klicka för att välja den
Din fil lämnar aldrig din webbläsare.
Förhandsvisning
Vad används konvertering från PDF till HTML till?
Det här verktyget förvandlar en PDF-fil till en fristående HTML-sida som troget återger originalets utseende, sida för sida, samtidigt som texten förblir markerbar och kopierbar.
Den HTML som skapas är ett enda självständigt dokument: varje sida i PDF-filen blir ett positionerat block, med sidans bild i bakgrunden och ett transparent textlager ovanpå. Du kan förhandsvisa det, ladda ner det eller kopiera det med ett klick.
Hur fungerar verktyget?
Hela konverteringen sker i din webbläsare, tack vare renderingsmotorn pdf.js (samma som i Firefox). Din fil skickas aldrig till en server: det är en avgörande fördel för konfidentiella, avtalsmässiga eller regulatoriska dokument.
Varje sida återges som en högupplöst bild (du väljer kvaliteten), och därefter läggs ett osynligt textlager ovanpå för att möjliggöra markering och sökning. Du kan inaktivera detta lager om du bara vill ha ett visuellt återgivande.
Vanliga användningsfall
- Bädda in en PDF på en webbsida samtidigt som texten förblir markerbar.
- Arkivera eller dela ett dokument i en läsbar form utan PDF-läsare.
- Extrahera och kopiera texten från en PDF sida för sida.
- Snabbt förhandsvisa innehållet i en PDF utan särskild programvara.
Vilken trohet kan man förvänta sig?
Det visuella återgivandet är mycket troget, eftersom varje sida är en bild som skapas av PDF-motorn själv: teckensnitt, layout, färger och grafik visas precis som i originalet.
Däremot är det inte en «semantisk» HTML som går att redigera på nytt: vektorgrafiken återges som bild, och textlagret är framför allt till för markering, med en ungefärlig positionering. För en skannad PDF (bild utan text) kan inget textlager skapas utan optisk teckenigenkänning (OCR).
Vanliga frågor
Skickas min fil någonstans?
Nej. Konverteringen utförs helt i din webbläsare; PDF-filen lämnar aldrig din enhet och skickas inte till någon server.
Är texten i HTML-filen markerbar?
Ja, så länge PDF-filen innehåller verklig text. Ett transparent textlager läggs ovanpå varje sidas bild för att möjliggöra markering, kopiering och sökning.
Varför verkar texten något förskjuten vid markering?
Det synliga återgivandet kommer från sidans bild; textlagret är positionerat på ett ungefärligt sätt. Den eventuella förskjutningen påverkar bara markeringsområdet, inte dokumentets utseende.
Fungerar skannade PDF-filer?
Varje sidas bild återges korrekt, men ingen text kan markeras: en skannad PDF innehåller ingen text, bara en bild. Optisk teckenigenkänning (OCR) skulle krävas.
Hanteras dokument med flera sidor?
Ja. Alla sidor konverteras och samlas i en enda HTML-fil, i samma ordning som i originaldokumentet.
Exempelförfrågan
curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
-F "file=@/path/to/file"
Indatasschema
| Fält | Typ | Obligatorisk | Standard |
|---|---|---|---|
file |
file | – |
detta verktyg förväntar sig en fil - använd Content-Type multipart/form-data istället för application/json
Slutpunkter
GET https://cdrn.fr/api/v1/tools- listar alla tillgängliga verktygGET https://cdrn.fr/api/v1/tools/pdf-to-html-converter- hämtar schemat för detta verktygPOST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute- kör detta verktyg med en JSON-payload