Tiontaigh PDF go HTML

tiontaíonn sé PDF go leathanach HTML neamhspleách le sraith téacs inroghnaithe, gan aon uaslódáil comhaid; déantar an tiontú go hiomlán i do bhrabhsálaí

Tarraing PDF anseo, nó cliceáil chun é a roghnú

Ní fhágann do chomhad do bhrabhsálaí riamh.

Cáilíocht na rindreála

Cad chuige a bhfuil an tiontú PDF go HTML?

Athraíonn an uirlis seo comhad PDF go leathanach HTML neamhspleách a atáirgeann go dílis cuma an bhunchóip, leathanach ar leathanach, agus an téacs fós inroghnaithe agus inchóipeáilte.

Is doiciméad aonair féinchuimsitheach é an HTML a chruthaítear: éiríonn gach leathanach den PDF ina bhloc suite, le híomhá an leathanaigh sa chúlra agus sraith téacs thrédhearcach os a chionn. Is féidir leat réamhamharc a dhéanamh air, é a íoslódáil nó é a chóipeáil le cliceáil amháin.

Conas a oibríonn an uirlis?

Tarlaíonn an tiontú ar fad i do bhrabhsálaí, a bhuíochas leis an inneall rindreála pdf.js (an ceann céanna le Firefox). Ní sheoltar do chomhad chuig freastalaí riamh: buntáiste cinntitheach é seo do dhoiciméid rúnda, chonarthacha nó rialála.

Rindreáiltear gach leathanach mar íomhá ardtaifigh (roghnaíonn tú an cháilíocht), ansin forleagtar sraith téacs dofheicthe chun roghnú agus cuardach a cheadú. Is féidir leat an tsraith seo a dhíchumasú mura bhfuil uait ach rindreáil amhairc.

Cásanna úsáide coitianta

  • PDF a leabú i leathanach gréasáin agus an téacs inroghnaithe á choinneáil.
  • Doiciméad a chartlannú nó a roinnt i bhfoirm inléite gan léitheoir PDF.
  • Téacs PDF a bhaint amach agus a chóipeáil leathanach ar leathanach.
  • Réamhamharc tapa a dhéanamh ar ábhar PDF gan bogearraí tiomnaithe.

Cén dílseacht is féidir a bheith ag súil léi?

Tá an rindreáil amhairc an-dílis, mar gur íomhá é gach leathanach a tháirgeann an t-inneall PDF féin: taispeántar na clófhoirne, an leagan amach, na dathanna agus na graficí mar a bhí sa bhunchóip.

Ar an taobh eile, ní HTML „séimeantach", ineagarthóireachta é seo: rindreáiltear na graficí veicteoireacha mar íomhá, agus is don roghnú go príomha atá an tsraith téacs, agus a suíomh neas-mheasta. I gcás PDF scanáilte (íomhá gan téacs), ní féidir aon sraith téacs a ghiniúint gan aithint optúil (OCR).

Ceisteanna coitianta

An seoltar mo chomhad áit éigin?

Ní sheoltar. Déantar an tiontú go hiomlán i do bhrabhsálaí; ní fhágann an PDF do ghléas riamh agus ní tharchuirtear chuig aon fhreastalaí é.

An bhfuil téacs an HTML inroghnaithe?

Tá, fad is a bhfuil fíor-théacs sa PDF. Forleagtar sraith téacs thrédhearcach ar íomhá gach leathanaigh chun roghnú, cóipeáil agus cuardach a cheadú.

Cén fáth a bhfuil an chuma ar an téacs go bhfuil sé beagán aistrithe agus é á roghnú?

Tagann an rindreáil infheicthe ó íomhá an leathanaigh; suítear an tsraith téacs ar bhealach neas-mheasta. Ní bhaineann an t-aistriú féideartha ach leis an réimse roghnaithe, ní le cuma an doiciméid.

An n-oibríonn PDF scanáilte?

Atáirgfear íomhá gach leathanaigh go dílis, ach ní bheidh aon téacs inroghnaithe: ní bhíonn aon téacs i PDF scanáilte, íomhá amháin atá ann. Bheadh aithint optúil (OCR) riachtanach.

An láimhseáiltear doiciméid illeathanaigh?

Láimhseáiltear. Tiontaítear na leathanaigh ar fad agus grúpáiltear iad in aon chomhad HTML amháin, in ord an bhundoiciméid.

Sampla iarratais

curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
  -F "file=@/path/to/file"

Scéimre ionchuir

Réimse Cineál Riachtanach Réamhshocrú
file file

bíonn comhad ag teastáil ón uirlis seo - úsáid Content-Type multipart/form-data in ionad application/json

Críochphointí

  • GET https://cdrn.fr/api/v1/tools - liostaíonn na huirlisí go léir atá ar fáil
  • GET https://cdrn.fr/api/v1/tools/pdf-to-html-converter - faigh scéimre na huirlise seo
  • POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute - rith an uirlis seo le pálasta JSON