PDF átalakítása HTML-be
- Irányítópult
- Dokumentáció
- API
Húzzon ide egy PDF-et, vagy kattintson a kiválasztásához
A fájlja soha nem hagyja el a böngészőjét.
Előnézet
Mire szolgál a PDF-ből HTML-be átalakítás?
Ez az eszköz egy PDF-fájlt önálló HTML-oldallá alakít, amely hűségesen reprodukálja az eredeti megjelenését, oldalról oldalra, miközben a szöveg kijelölhető és másolható marad.
A létrehozott HTML egyetlen, önhordó dokumentum: a PDF minden oldala pozicionált blokká válik, háttérben az oldal képével és fölötte egy átlátszó szövegréteggel. Megtekintheti előnézetben, letöltheti vagy kimásolhatja egyetlen kattintással.
Hogyan működik az eszköz?
A teljes átalakítás a böngészőjében zajlik, a pdf.js megjelenítőmotornak köszönhetően (ugyanaz, mint a Firefoxé). A fájlja soha nem kerül szerverre: ez döntő előny bizalmas, szerződéses vagy szabályozott dokumentumok esetén.
Minden oldal nagy felbontású képként jelenik meg (Ön választja meg a minőséget), majd egy láthatatlan szövegréteg kerül föléje a kijelölés és a keresés lehetővé tételéhez. Ezt a réteget kikapcsolhatja, ha csak vizuális megjelenítést szeretne.
Gyakori felhasználási esetek
- PDF beágyazása egy weboldalba a kijelölhető szöveg megőrzése mellett.
- Dokumentum archiválása vagy megosztása PDF-olvasó nélkül is megtekinthető formában.
- Egy PDF szövegének kinyerése és másolása oldalról oldalra.
- Egy PDF tartalmának gyors előnézete dedikált szoftver nélkül.
Milyen hűségre számíthatunk?
A vizuális megjelenítés rendkívül hűséges, mert minden oldal egy kép, amelyet maga a PDF-motor állít elő: a betűtípusok, az elrendezés, a színek és a grafikák úgy jelennek meg, mint az eredetiben.
Ezzel szemben ez nem egy „szemantikus", újraszerkeszthető HTML: a vektoros grafikák képként jelennek meg, a szövegréteg pedig elsősorban a kijelölést szolgálja, pozicionálása közelítő. Egy beszkennelt PDF esetén (szöveg nélküli kép) szövegréteg nem hozható létre optikai felismerés (OCR) nélkül.
Gyakran ismételt kérdések
Elküldik valahova a fájlomat?
Nem. Az átalakítás teljes egészében a böngészőjében történik; a PDF soha nem hagyja el az eszközét, és semmilyen szerverre nem kerül továbbításra.
Kijelölhető a HTML szövege?
Igen, amennyiben a PDF valódi szöveget tartalmaz. Minden oldal képére átlátszó szövegréteg kerül, amely lehetővé teszi a kijelölést, a másolást és a keresést.
Miért tűnik a szöveg kissé eltolva a kijelöléskor?
A látható megjelenítés az oldal képéből származik; a szövegréteg pozicionálása közelítő. Az esetleges eltolódás csak a kijelölési területet érinti, a dokumentum megjelenését nem.
Működnek a beszkennelt PDF-ek?
Minden oldal képe hűségesen reprodukálódik, de szöveg nem lesz kijelölhető: egy beszkennelt PDF nem tartalmaz szöveget, csak képet. Optikai felismerésre (OCR) volna szükség.
Kezeli a több oldalas dokumentumokat?
Igen. Minden oldal átalakul és egyetlen HTML-fájlba kerül, az eredeti dokumentum sorrendjében.
Kérés példa
curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
-F "file=@/path/to/file"
Bemeneti séma
| Mező | Típus | Kötelező | Alapértelmezett |
|---|---|---|---|
file |
file | – |
ez az eszköz fájlt vár - használjon Content-Type multipart/form-data értéket application/json helyett
Végpontok
GET https://cdrn.fr/api/v1/tools- listázza az összes elérhető eszköztGET https://cdrn.fr/api/v1/tools/pdf-to-html-converter- lekéri ezen eszköz sémájátPOST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute- végrehajtja ezen eszközt JSON payloaddal