Convertire un PDF in HTML
- Dashboard
- Documentazione
- API
Trascina qui un PDF, oppure clicca per sceglierlo
Il tuo file non lascia mai il tuo browser.
Anteprima
A cosa serve la conversione da PDF a HTML?
Questo strumento trasforma un file PDF in una pagina HTML autonoma che riproduce fedelmente l'aspetto dell'originale, pagina per pagina, mantenendo al contempo un testo selezionabile e copiabile.
L'HTML prodotto è un documento unico e autosufficiente: ogni pagina del PDF diventa un blocco posizionato, con l'immagine della pagina sullo sfondo e un livello di testo trasparente sopra. Puoi visualizzarne l'anteprima, scaricarlo o copiarlo con un clic.
Come funziona lo strumento?
Tutta la conversione si svolge nel tuo browser, grazie al motore di rendering pdf.js (lo stesso di Firefox). Il tuo file non viene mai inviato a un server: è un vantaggio decisivo per documenti riservati, contrattuali o normativi.
Ogni pagina viene resa come immagine ad alta definizione (scegli tu la qualità), poi un livello di testo invisibile viene sovrapposto per consentire la selezione e la ricerca. Puoi disattivare questo livello se desideri solo una resa visiva.
Casi d'uso comuni
- Integrare un PDF in una pagina web mantenendo un testo selezionabile.
- Archiviare o condividere un documento in una forma consultabile senza lettore PDF.
- Estrarre e copiare il testo di un PDF pagina per pagina.
- Visualizzare rapidamente l'anteprima del contenuto di un PDF senza software dedicato.
Quale fedeltà aspettarsi?
La resa visiva è molto fedele, perché ogni pagina è un'immagine prodotta dal motore PDF stesso: caratteri, impaginazione, colori e grafica appaiono come nell'originale.
Tuttavia non si tratta di un HTML « semantico » rieditabile: la grafica vettoriale viene resa come immagine, e il livello di testo serve soprattutto alla selezione, con un posizionamento approssimativo. Per un PDF scansionato (immagine senza testo), non è possibile generare alcun livello di testo senza riconoscimento ottico (OCR).
Domande frequenti
Il mio file viene inviato da qualche parte?
No. La conversione viene eseguita interamente nel tuo browser; il PDF non lascia mai il tuo dispositivo e non viene trasmesso ad alcun server.
Il testo dell'HTML è selezionabile?
Sì, purché il PDF contenga testo reale. Un livello di testo trasparente viene sovrapposto all'immagine di ogni pagina per consentire la selezione, la copia e la ricerca.
Perché il testo sembra leggermente sfalsato durante la selezione?
La resa visibile proviene dall'immagine della pagina; il livello di testo è posizionato in modo approssimativo. L'eventuale sfasamento riguarda solo l'area di selezione, non l'aspetto del documento.
I PDF scansionati funzionano?
L'immagine di ogni pagina verrà riprodotta correttamente, ma non sarà possibile selezionare alcun testo: un PDF scansionato non contiene testo, solo un'immagine. Sarebbe necessario un riconoscimento ottico (OCR).
I documenti di più pagine sono gestiti?
Sì. Tutte le pagine vengono convertite e raggruppate in un unico file HTML, nell'ordine del documento originale.
Esempio di richiesta
curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
-F "file=@/path/to/file"
Schema di input
| Campo | Tipo | Richiesto | Predefinito |
|---|---|---|---|
file |
file | – |
questo strumento si aspetta un file - utilizzare Content-Type multipart/form-data invece di application/json
Endpoint
GET https://cdrn.fr/api/v1/tools- elenca tutti gli strumenti disponibiliGET https://cdrn.fr/api/v1/tools/pdf-to-html-converter- recupera lo schema di questo strumentoPOST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute- esegue questo strumento con un payload JSON