Pārvērst PDF par HTML
- Vadības panelis
- Dokumentācija
- API
Ievelciet PDF šeit vai noklikšķiniet, lai to izvēlētos
Jūsu fails nekad nepamet jūsu pārlūkprogrammu.
Priekšskatījums
Kam noder PDF pārvēršana par HTML?
Šis rīks pārvērš PDF failu par patstāvīgu HTML lapu, kas precīzi atveido oriģināla izskatu, lapu pa lapai, vienlaikus saglabājot atlasāmu un kopējamu tekstu.
Izveidotais HTML ir vienots un pašpietiekams dokuments: katra PDF lapa kļūst par pozicionētu bloku, ar lapas attēlu fonā un caurspīdīgu teksta slāni virspusē. Jūs varat to priekšskatīt, lejupielādēt vai kopēt ar vienu klikšķi.
Kā rīks darbojas?
Visa pārveidošana notiek jūsu pārlūkprogrammā, pateicoties pdf.js atveidošanas dzinim (tas pats, kas Firefox). Jūsu fails nekad netiek nosūtīts uz serveri: tā ir izšķiroša priekšrocība konfidenciāliem, līgumiskiem vai normatīviem dokumentiem.
Katra lapa tiek atveidota kā augstas izšķirtspējas attēls (jūs izvēlaties kvalitāti), pēc tam virspusē tiek uzlikts neredzams teksta slānis, lai ļautu atlasi un meklēšanu. Jūs varat atspējot šo slāni, ja vēlaties tikai vizuālu atveidojumu.
Biežākie izmantošanas gadījumi
- Iegult PDF tīmekļa lapā, vienlaikus saglabājot atlasāmu tekstu.
- Arhivēt vai kopīgot dokumentu apskatāmā veidā bez PDF lasītāja.
- Izvilkt un kopēt PDF tekstu lapu pa lapai.
- Ātri priekšskatīt PDF saturu bez specializētas programmatūras.
Kādu precizitāti var sagaidīt?
Vizuālais atveidojums ir ļoti precīzs, jo katra lapa ir attēls, ko izveidojis pats PDF dzinis: fonti, izkārtojums, krāsas un grafika parādās tāpat kā oriģinālā.
Tomēr tas nav „semantisks", atkārtoti rediģējams HTML: vektorgrafika tiek atveidota kā attēls, un teksta slānis kalpo galvenokārt atlasei, tā novietojums ir aptuvens. Skenētam PDF (attēls bez teksta) nevar ģenerēt nevienu teksta slāni bez optiskās atpazīšanas (OCR).
Biežāk uzdotie jautājumi
Vai mans fails tiek kaut kur nosūtīts?
Nē. Pārveidošana pilnībā notiek jūsu pārlūkprogrammā; PDF nekad nepamet jūsu ierīci un netiek pārsūtīts uz nevienu serveri.
Vai HTML teksts ir atlasāms?
Jā, kamēr PDF satur īstu tekstu. Caurspīdīgs teksta slānis tiek uzlikts virs katras lapas attēla, lai ļautu atlasi, kopēšanu un meklēšanu.
Kāpēc atlases laikā teksts šķiet nedaudz nobīdīts?
Redzamais atveidojums nāk no lapas attēla; teksta slānis tiek novietots aptuveni. Iespējamā nobīde ietekmē tikai atlases zonu, nevis dokumenta izskatu.
Vai skenētie PDF darbojas?
Katras lapas attēls tiks precīzi atveidots, taču nekādu tekstu nevarēs atlasīt: skenēts PDF nesatur tekstu, tikai attēlu. Būtu nepieciešama optiskā atpazīšana (OCR).
Vai daudzlapu dokumenti tiek apstrādāti?
Jā. Visas lapas tiek pārveidotas un apvienotas vienā HTML failā, oriģinālā dokumenta secībā.
Pieprasījuma piemērs
curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
-F "file=@/path/to/file"
Ievades shēma
| Lauks | Tips | Obligāts | Noklusējums |
|---|---|---|---|
file |
file | – |
šis rīks sagaida failu - izmantojiet Content-Type multipart/form-data application/json vietā
Endpoint
GET https://cdrn.fr/api/v1/tools- uzskaita visus pieejamos rīkusGET https://cdrn.fr/api/v1/tools/pdf-to-html-converter- iegūst šī rīka shēmuPOST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute- izpilda šo rīku ar JSON payload