Muunna PDF HTML-muotoon

Hallintapaneeli
Dokumentaatio
API

muuntaa PDF:n itsenäiseksi HTML-sivuksi, jossa on valittava tekstikerros, lähettämättä yhtäkään tiedostoa; muunnos tapahtuu kokonaan selaimessasi

Vedä PDF tähän tai napsauta valitaksesi sen

Tiedostosi ei poistu koskaan selaimestasi.

Sisällytä valittava teksti

Toiston laatu

Esikatselu

Mihin PDF-HTML-muunnos on tarkoitettu?

Tämä työkalu muuntaa PDF-tiedoston itsenäiseksi HTML-sivuksi, joka toistaa tarkasti alkuperäisen ulkoasun sivu sivulta ja säilyttää samalla valittavan ja kopioitavan tekstin.

Tuotettu HTML on yksi itsenäinen asiakirja: jokaisesta PDF:n sivusta tulee sijoiteltu lohko, jonka taustana on sivun kuva ja sen päällä läpinäkyvä tekstikerros. Voit esikatsella, ladata tai kopioida sen yhdellä napsautuksella.

Miten työkalu toimii?

Koko muunnos tapahtuu selaimessasi pdf.js-renderöintimoottorin ansiosta (sama, jota Firefox käyttää). Tiedostoasi ei koskaan lähetetä palvelimelle: tämä on ratkaiseva etu luottamuksellisille, sopimusperäisille tai sääntelyn alaisille asiakirjoille.

Jokainen sivu renderöidään teräväpiirtokuvaksi (sinä valitset laadun), minkä jälkeen näkymätön tekstikerros asetetaan päälle valinnan ja haun mahdollistamiseksi. Voit poistaa tämän kerroksen käytöstä, jos haluat vain visuaalisen toiston.

Yleisiä käyttötapauksia

Upota PDF verkkosivulle säilyttäen samalla valittavan tekstin.
Arkistoi tai jaa asiakirja luettavassa muodossa ilman PDF-lukijaa.
Pura ja kopioi PDF:n teksti sivu sivulta.
Esikatsele PDF:n sisältö nopeasti ilman erillistä ohjelmistoa.

Millaista tarkkuutta odottaa?

Visuaalinen toisto on erittäin tarkka, koska jokainen sivu on PDF-moottorin itsensä tuottama kuva: fontit, asettelu, värit ja grafiikat näkyvät kuten alkuperäisessä.

Sen sijaan kyseessä ei ole „semanttinen" uudelleenmuokattava HTML: vektorigrafiikat renderöidään kuvaksi, ja tekstikerros palvelee ennen kaikkea valintaa, sen sijoittelu on likimääräinen. Skannatun PDF:n (kuva ilman tekstiä) osalta tekstikerrosta ei voi luoda ilman optista tunnistusta (OCR).

Usein kysytyt kysymykset

Lähetetäänkö tiedostoni jonnekin?

Ei. Muunnos tehdään kokonaan selaimessasi; PDF ei poistu koskaan laitteeltasi eikä sitä siirretä millekään palvelimelle.

Onko HTML:n teksti valittavissa?

Kyllä, kunhan PDF sisältää todellista tekstiä. Jokaisen sivun kuvan päälle asetetaan läpinäkyvä tekstikerros, joka mahdollistaa valinnan, kopioinnin ja haun.

Miksi teksti näyttää valittaessa hieman siirtyneeltä?

Näkyvä toisto tulee sivun kuvasta; tekstikerros on sijoiteltu likimääräisesti. Mahdollinen siirtymä vaikuttaa vain valinta-alueeseen, ei asiakirjan ulkoasuun.

Toimivatko skannatut PDF:t?

Jokaisen sivun kuva toistetaan kunnolla, mutta tekstiä ei voi valita: skannattu PDF ei sisällä tekstiä, vain kuvan. Tarvittaisiin optinen tunnistus (OCR).

Tuetaanko monisivuisia asiakirjoja?

Kyllä. Kaikki sivut muunnetaan ja kootaan yhteen HTML-tiedostoon alkuperäisen asiakirjan järjestyksessä.

Pyyntöesimerkki

curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
  -F "file=@/path/to/file"

Syöteskeema

Kenttä	Tyyppi	Pakollinen	Oletus
`file`	file		–

tämä työkalu odottaa tiedostoa - käytä Content-Type multipart/form-data:a application/json:in sijaan

Päätepisteet

GET https://cdrn.fr/api/v1/tools - listaa kaikki saatavilla olevat työkalut
GET https://cdrn.fr/api/v1/tools/pdf-to-html-converter - hakee tämän työkalun skeeman
POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute - suorittaa tämän työkalun JSON-payloadilla