Pārvērst PDF par HTML

Vadības panelis
Dokumentācija
API

pārvērš PDF par patstāvīgu HTML lapu ar atlasāmu teksta slāni, bez jebkādas failu augšupielādes; pārveidošana notiek pilnībā jūsu pārlūkprogrammā

Ievelciet PDF šeit vai noklikšķiniet, lai to izvēlētos

Jūsu fails nekad nepamet jūsu pārlūkprogrammu.

Iekļaut atlasāmu tekstu

Atveidojuma kvalitāte

Priekšskatījums

Kam noder PDF pārvēršana par HTML?

Šis rīks pārvērš PDF failu par patstāvīgu HTML lapu, kas precīzi atveido oriģināla izskatu, lapu pa lapai, vienlaikus saglabājot atlasāmu un kopējamu tekstu.

Izveidotais HTML ir vienots un pašpietiekams dokuments: katra PDF lapa kļūst par pozicionētu bloku, ar lapas attēlu fonā un caurspīdīgu teksta slāni virspusē. Jūs varat to priekšskatīt, lejupielādēt vai kopēt ar vienu klikšķi.

Kā rīks darbojas?

Visa pārveidošana notiek jūsu pārlūkprogrammā, pateicoties pdf.js atveidošanas dzinim (tas pats, kas Firefox). Jūsu fails nekad netiek nosūtīts uz serveri: tā ir izšķiroša priekšrocība konfidenciāliem, līgumiskiem vai normatīviem dokumentiem.

Katra lapa tiek atveidota kā augstas izšķirtspējas attēls (jūs izvēlaties kvalitāti), pēc tam virspusē tiek uzlikts neredzams teksta slānis, lai ļautu atlasi un meklēšanu. Jūs varat atspējot šo slāni, ja vēlaties tikai vizuālu atveidojumu.

Biežākie izmantošanas gadījumi

Iegult PDF tīmekļa lapā, vienlaikus saglabājot atlasāmu tekstu.
Arhivēt vai kopīgot dokumentu apskatāmā veidā bez PDF lasītāja.
Izvilkt un kopēt PDF tekstu lapu pa lapai.
Ātri priekšskatīt PDF saturu bez specializētas programmatūras.

Kādu precizitāti var sagaidīt?

Vizuālais atveidojums ir ļoti precīzs, jo katra lapa ir attēls, ko izveidojis pats PDF dzinis: fonti, izkārtojums, krāsas un grafika parādās tāpat kā oriģinālā.

Tomēr tas nav „semantisks", atkārtoti rediģējams HTML: vektorgrafika tiek atveidota kā attēls, un teksta slānis kalpo galvenokārt atlasei, tā novietojums ir aptuvens. Skenētam PDF (attēls bez teksta) nevar ģenerēt nevienu teksta slāni bez optiskās atpazīšanas (OCR).

Biežāk uzdotie jautājumi

Vai mans fails tiek kaut kur nosūtīts?

Nē. Pārveidošana pilnībā notiek jūsu pārlūkprogrammā; PDF nekad nepamet jūsu ierīci un netiek pārsūtīts uz nevienu serveri.

Vai HTML teksts ir atlasāms?

Jā, kamēr PDF satur īstu tekstu. Caurspīdīgs teksta slānis tiek uzlikts virs katras lapas attēla, lai ļautu atlasi, kopēšanu un meklēšanu.

Kāpēc atlases laikā teksts šķiet nedaudz nobīdīts?

Redzamais atveidojums nāk no lapas attēla; teksta slānis tiek novietots aptuveni. Iespējamā nobīde ietekmē tikai atlases zonu, nevis dokumenta izskatu.

Vai skenētie PDF darbojas?

Katras lapas attēls tiks precīzi atveidots, taču nekādu tekstu nevarēs atlasīt: skenēts PDF nesatur tekstu, tikai attēlu. Būtu nepieciešama optiskā atpazīšana (OCR).

Vai daudzlapu dokumenti tiek apstrādāti?

Jā. Visas lapas tiek pārveidotas un apvienotas vienā HTML failā, oriģinālā dokumenta secībā.

Pieprasījuma piemērs

curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
  -F "file=@/path/to/file"

Ievades shēma

Lauks	Tips	Obligāts	Noklusējums
`file`	file		–

šis rīks sagaida failu - izmantojiet Content-Type multipart/form-data application/json vietā

Endpoint

GET https://cdrn.fr/api/v1/tools - uzskaita visus pieejamos rīkus
GET https://cdrn.fr/api/v1/tools/pdf-to-html-converter - iegūst šī rīka shēmu
POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute - izpilda šo rīku ar JSON payload