PDF átalakítása HTML-be

Irányítópult
Dokumentáció
API

önálló HTML-oldallá alakít egy PDF-et kijelölhető szövegréteggel, fájlfeltöltés nélkül; az átalakítás teljes egészében a böngészőjében történik

Húzzon ide egy PDF-et, vagy kattintson a kiválasztásához

A fájlja soha nem hagyja el a böngészőjét.

Kijelölhető szöveg beillesztése

Megjelenítés minősége

Előnézet

Mire szolgál a PDF-ből HTML-be átalakítás?

Ez az eszköz egy PDF-fájlt önálló HTML-oldallá alakít, amely hűségesen reprodukálja az eredeti megjelenését, oldalról oldalra, miközben a szöveg kijelölhető és másolható marad.

A létrehozott HTML egyetlen, önhordó dokumentum: a PDF minden oldala pozicionált blokká válik, háttérben az oldal képével és fölötte egy átlátszó szövegréteggel. Megtekintheti előnézetben, letöltheti vagy kimásolhatja egyetlen kattintással.

Hogyan működik az eszköz?

A teljes átalakítás a böngészőjében zajlik, a pdf.js megjelenítőmotornak köszönhetően (ugyanaz, mint a Firefoxé). A fájlja soha nem kerül szerverre: ez döntő előny bizalmas, szerződéses vagy szabályozott dokumentumok esetén.

Minden oldal nagy felbontású képként jelenik meg (Ön választja meg a minőséget), majd egy láthatatlan szövegréteg kerül föléje a kijelölés és a keresés lehetővé tételéhez. Ezt a réteget kikapcsolhatja, ha csak vizuális megjelenítést szeretne.

Gyakori felhasználási esetek

PDF beágyazása egy weboldalba a kijelölhető szöveg megőrzése mellett.
Dokumentum archiválása vagy megosztása PDF-olvasó nélkül is megtekinthető formában.
Egy PDF szövegének kinyerése és másolása oldalról oldalra.
Egy PDF tartalmának gyors előnézete dedikált szoftver nélkül.

Milyen hűségre számíthatunk?

A vizuális megjelenítés rendkívül hűséges, mert minden oldal egy kép, amelyet maga a PDF-motor állít elő: a betűtípusok, az elrendezés, a színek és a grafikák úgy jelennek meg, mint az eredetiben.

Ezzel szemben ez nem egy „szemantikus", újraszerkeszthető HTML: a vektoros grafikák képként jelennek meg, a szövegréteg pedig elsősorban a kijelölést szolgálja, pozicionálása közelítő. Egy beszkennelt PDF esetén (szöveg nélküli kép) szövegréteg nem hozható létre optikai felismerés (OCR) nélkül.

Gyakran ismételt kérdések

Elküldik valahova a fájlomat?

Nem. Az átalakítás teljes egészében a böngészőjében történik; a PDF soha nem hagyja el az eszközét, és semmilyen szerverre nem kerül továbbításra.

Kijelölhető a HTML szövege?

Igen, amennyiben a PDF valódi szöveget tartalmaz. Minden oldal képére átlátszó szövegréteg kerül, amely lehetővé teszi a kijelölést, a másolást és a keresést.

Miért tűnik a szöveg kissé eltolva a kijelöléskor?

A látható megjelenítés az oldal képéből származik; a szövegréteg pozicionálása közelítő. Az esetleges eltolódás csak a kijelölési területet érinti, a dokumentum megjelenését nem.

Működnek a beszkennelt PDF-ek?

Minden oldal képe hűségesen reprodukálódik, de szöveg nem lesz kijelölhető: egy beszkennelt PDF nem tartalmaz szöveget, csak képet. Optikai felismerésre (OCR) volna szükség.

Kezeli a több oldalas dokumentumokat?

Igen. Minden oldal átalakul és egyetlen HTML-fájlba kerül, az eredeti dokumentum sorrendjében.

Kérés példa

curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
  -F "file=@/path/to/file"

Bemeneti séma

Mező	Típus	Kötelező	Alapértelmezett
`file`	file		–

ez az eszköz fájlt vár - használjon Content-Type multipart/form-data értéket application/json helyett

Végpontok

GET https://cdrn.fr/api/v1/tools - listázza az összes elérhető eszközt
GET https://cdrn.fr/api/v1/tools/pdf-to-html-converter - lekéri ezen eszköz sémáját
POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute - végrehajtja ezen eszközt JSON payloaddal