Konvertera en PDF till HTML

konverterar en PDF till en fristående HTML-sida med ett markerbart textlager, utan att någon fil skickas; konverteringen sker helt i din webbläsare

Dra en PDF hit, eller klicka för att välja den

Din fil lämnar aldrig din webbläsare.

Återgivningskvalitet

Vad används konvertering från PDF till HTML till?

Det här verktyget förvandlar en PDF-fil till en fristående HTML-sida som troget återger originalets utseende, sida för sida, samtidigt som texten förblir markerbar och kopierbar.

Den HTML som skapas är ett enda självständigt dokument: varje sida i PDF-filen blir ett positionerat block, med sidans bild i bakgrunden och ett transparent textlager ovanpå. Du kan förhandsvisa det, ladda ner det eller kopiera det med ett klick.

Hur fungerar verktyget?

Hela konverteringen sker i din webbläsare, tack vare renderingsmotorn pdf.js (samma som i Firefox). Din fil skickas aldrig till en server: det är en avgörande fördel för konfidentiella, avtalsmässiga eller regulatoriska dokument.

Varje sida återges som en högupplöst bild (du väljer kvaliteten), och därefter läggs ett osynligt textlager ovanpå för att möjliggöra markering och sökning. Du kan inaktivera detta lager om du bara vill ha ett visuellt återgivande.

Vanliga användningsfall

  • Bädda in en PDF på en webbsida samtidigt som texten förblir markerbar.
  • Arkivera eller dela ett dokument i en läsbar form utan PDF-läsare.
  • Extrahera och kopiera texten från en PDF sida för sida.
  • Snabbt förhandsvisa innehållet i en PDF utan särskild programvara.

Vilken trohet kan man förvänta sig?

Det visuella återgivandet är mycket troget, eftersom varje sida är en bild som skapas av PDF-motorn själv: teckensnitt, layout, färger och grafik visas precis som i originalet.

Däremot är det inte en «semantisk» HTML som går att redigera på nytt: vektorgrafiken återges som bild, och textlagret är framför allt till för markering, med en ungefärlig positionering. För en skannad PDF (bild utan text) kan inget textlager skapas utan optisk teckenigenkänning (OCR).

Vanliga frågor

Skickas min fil någonstans?

Nej. Konverteringen utförs helt i din webbläsare; PDF-filen lämnar aldrig din enhet och skickas inte till någon server.

Är texten i HTML-filen markerbar?

Ja, så länge PDF-filen innehåller verklig text. Ett transparent textlager läggs ovanpå varje sidas bild för att möjliggöra markering, kopiering och sökning.

Varför verkar texten något förskjuten vid markering?

Det synliga återgivandet kommer från sidans bild; textlagret är positionerat på ett ungefärligt sätt. Den eventuella förskjutningen påverkar bara markeringsområdet, inte dokumentets utseende.

Fungerar skannade PDF-filer?

Varje sidas bild återges korrekt, men ingen text kan markeras: en skannad PDF innehåller ingen text, bara en bild. Optisk teckenigenkänning (OCR) skulle krävas.

Hanteras dokument med flera sidor?

Ja. Alla sidor konverteras och samlas i en enda HTML-fil, i samma ordning som i originaldokumentet.

Exempelförfrågan

curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
  -F "file=@/path/to/file"

Indatasschema

Fält Typ Obligatorisk Standard
file file

detta verktyg förväntar sig en fil - använd Content-Type multipart/form-data istället för application/json

Slutpunkter

  • GET https://cdrn.fr/api/v1/tools - listar alla tillgängliga verktyg
  • GET https://cdrn.fr/api/v1/tools/pdf-to-html-converter - hämtar schemat för detta verktyg
  • POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute - kör detta verktyg med en JSON-payload