Muunna PDF HTML-muotoon
- Hallintapaneeli
- Dokumentaatio
- API
Vedä PDF tähän tai napsauta valitaksesi sen
Tiedostosi ei poistu koskaan selaimestasi.
Esikatselu
Mihin PDF-HTML-muunnos on tarkoitettu?
Tämä työkalu muuntaa PDF-tiedoston itsenäiseksi HTML-sivuksi, joka toistaa tarkasti alkuperäisen ulkoasun sivu sivulta ja säilyttää samalla valittavan ja kopioitavan tekstin.
Tuotettu HTML on yksi itsenäinen asiakirja: jokaisesta PDF:n sivusta tulee sijoiteltu lohko, jonka taustana on sivun kuva ja sen päällä läpinäkyvä tekstikerros. Voit esikatsella, ladata tai kopioida sen yhdellä napsautuksella.
Miten työkalu toimii?
Koko muunnos tapahtuu selaimessasi pdf.js-renderöintimoottorin ansiosta (sama, jota Firefox käyttää). Tiedostoasi ei koskaan lähetetä palvelimelle: tämä on ratkaiseva etu luottamuksellisille, sopimusperäisille tai sääntelyn alaisille asiakirjoille.
Jokainen sivu renderöidään teräväpiirtokuvaksi (sinä valitset laadun), minkä jälkeen näkymätön tekstikerros asetetaan päälle valinnan ja haun mahdollistamiseksi. Voit poistaa tämän kerroksen käytöstä, jos haluat vain visuaalisen toiston.
Yleisiä käyttötapauksia
- Upota PDF verkkosivulle säilyttäen samalla valittavan tekstin.
- Arkistoi tai jaa asiakirja luettavassa muodossa ilman PDF-lukijaa.
- Pura ja kopioi PDF:n teksti sivu sivulta.
- Esikatsele PDF:n sisältö nopeasti ilman erillistä ohjelmistoa.
Millaista tarkkuutta odottaa?
Visuaalinen toisto on erittäin tarkka, koska jokainen sivu on PDF-moottorin itsensä tuottama kuva: fontit, asettelu, värit ja grafiikat näkyvät kuten alkuperäisessä.
Sen sijaan kyseessä ei ole „semanttinen" uudelleenmuokattava HTML: vektorigrafiikat renderöidään kuvaksi, ja tekstikerros palvelee ennen kaikkea valintaa, sen sijoittelu on likimääräinen. Skannatun PDF:n (kuva ilman tekstiä) osalta tekstikerrosta ei voi luoda ilman optista tunnistusta (OCR).
Usein kysytyt kysymykset
Lähetetäänkö tiedostoni jonnekin?
Ei. Muunnos tehdään kokonaan selaimessasi; PDF ei poistu koskaan laitteeltasi eikä sitä siirretä millekään palvelimelle.
Onko HTML:n teksti valittavissa?
Kyllä, kunhan PDF sisältää todellista tekstiä. Jokaisen sivun kuvan päälle asetetaan läpinäkyvä tekstikerros, joka mahdollistaa valinnan, kopioinnin ja haun.
Miksi teksti näyttää valittaessa hieman siirtyneeltä?
Näkyvä toisto tulee sivun kuvasta; tekstikerros on sijoiteltu likimääräisesti. Mahdollinen siirtymä vaikuttaa vain valinta-alueeseen, ei asiakirjan ulkoasuun.
Toimivatko skannatut PDF:t?
Jokaisen sivun kuva toistetaan kunnolla, mutta tekstiä ei voi valita: skannattu PDF ei sisällä tekstiä, vain kuvan. Tarvittaisiin optinen tunnistus (OCR).
Tuetaanko monisivuisia asiakirjoja?
Kyllä. Kaikki sivut muunnetaan ja kootaan yhteen HTML-tiedostoon alkuperäisen asiakirjan järjestyksessä.
Pyyntöesimerkki
curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
-F "file=@/path/to/file"
Syöteskeema
| Kenttä | Tyyppi | Pakollinen | Oletus |
|---|---|---|---|
file |
file | – |
tämä työkalu odottaa tiedostoa - käytä Content-Type multipart/form-data:a application/json:in sijaan
Päätepisteet
GET https://cdrn.fr/api/v1/tools- listaa kaikki saatavilla olevat työkalutGET https://cdrn.fr/api/v1/tools/pdf-to-html-converter- hakee tämän työkalun skeemanPOST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute- suorittaa tämän työkalun JSON-payloadilla