Convertiți un PDF în HTML

Panou de control
Documentație
API

convertește un PDF într-o pagină HTML autonomă cu un strat de text selectabil, fără a trimite niciun fișier; conversia se realizează integral în browserul dumneavoastră

Trageți un PDF aici sau faceți clic pentru a-l alege

Fișierul dumneavoastră nu părăsește niciodată browserul.

Includeți textul selectabil

Calitatea redării

Previzualizare

La ce folosește conversia din PDF în HTML?

Acest instrument transformă un fișier PDF într-o pagină HTML autonomă care reproduce fidel aspectul originalului, pagină cu pagină, păstrând totodată un text selectabil și care poate fi copiat.

HTML-ul generat este un document unic și autoportant: fiecare pagină a PDF-ului devine un bloc poziționat, cu imaginea paginii în fundal și un strat de text transparent deasupra. Îl puteți previzualiza, descărca sau copia dintr-un singur clic.

Cum funcționează instrumentul?

Întreaga conversie se desfășoară în browserul dumneavoastră, datorită motorului de redare pdf.js (același cu cel al Firefox). Fișierul dumneavoastră nu este niciodată trimis pe un server: este un avantaj decisiv pentru documente confidențiale, contractuale sau de reglementare.

Fiecare pagină este redată într-o imagine de înaltă definiție (alegeți calitatea), apoi un strat de text invizibil este suprapus pentru a permite selectarea și căutarea. Puteți dezactiva acest strat dacă doriți doar o redare vizuală.

Cazuri de utilizare frecvente

Integrarea unui PDF într-o pagină web păstrând un text selectabil.
Arhivarea sau partajarea unui document într-o formă consultabilă fără cititor PDF.
Extragerea și copierea textului dintr-un PDF pagină cu pagină.
Previzualizarea rapidă a conținutului unui PDF fără software dedicat.

La ce fidelitate să vă așteptați?

Redarea vizuală este foarte fidelă, deoarece fiecare pagină este o imagine produsă chiar de motorul PDF: fonturile, aspectul, culorile și graficele apar la fel ca în original.

În schimb, nu este un HTML „semantic" reeditabil: graficele vectoriale sunt redate ca imagine, iar stratul de text servește în primul rând la selectare, poziționarea sa fiind aproximativă. Pentru un PDF scanat (imagine fără text), niciun strat de text nu poate fi generat fără recunoaștere optică (OCR).

Întrebări frecvente

Fișierul meu este trimis undeva?

Nu. Conversia este realizată integral în browserul dumneavoastră; PDF-ul nu părăsește niciodată dispozitivul și nu este transmis către niciun server.

Textul din HTML este selectabil?

Da, atât timp cât PDF-ul conține text real. Un strat de text transparent este suprapus peste imaginea fiecărei pagini pentru a permite selectarea, copierea și căutarea.

De ce textul pare ușor decalat la selectare?

Redarea vizibilă provine din imaginea paginii; stratul de text este poziționat în mod aproximativ. Decalajul eventual afectează doar zona de selectare, nu aspectul documentului.

PDF-urile scanate funcționează?

Imaginea fiecărei pagini va fi reprodusă fidel, dar niciun text nu va putea fi selectat: un PDF scanat nu conține text, ci doar o imagine. Ar fi necesară o recunoaștere optică (OCR).

Documentele cu mai multe pagini sunt gestionate?

Da. Toate paginile sunt convertite și reunite într-un singur fișier HTML, în ordinea documentului original.

Exemplu de cerere

curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
  -F "file=@/path/to/file"

Schema de intrare

Câmp	Tip	Obligatoriu	Implicit
`file`	file		–

acest instrument așteaptă un fișier - utilizați Content-Type multipart/form-data în loc de application/json

Puncte de acces

GET https://cdrn.fr/api/v1/tools - listează toate instrumentele disponibile
GET https://cdrn.fr/api/v1/tools/pdf-to-html-converter - obține schema acestui instrument
POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute - execută acest instrument cu un payload JSON