Pretvoriti HTML v LaTeX in generirati PDF
- Nadzorna plošča
- Dokumentacija
- API
Zakaj pretvoriti HTML v LaTeX?
Pretvarjanje HTML v LaTeX vam omogoča ustvarjanje PDF-jev profesionalne kakovosti iz vsebine, ki je že napisana v spletu: člankov iz CMS, lastno ustvarjene dokumentacije, objav v spletnih dnevnikih, izvozov wikijev ali zapiskov, posnetih v urejevalniku WYSIWYG. Namesto ročnega posredovanja ta pretvornik HTML v LaTeX vzame vaš vir HTML in ustvari datoteko .tex, ki jo je mogoče prevesti v PDF.
Tipične uporabe: preoblikovanje osnutka, napisanega na Notion ali Markdown (izvoženega v HTML), v znanstveni članek, preoblikovanje spletne strani v knjižico za tiskanje, ustvarjanje pisma ali življenjepisa iz urejevalnika HTML. Pretvorba html v lateks se izogne prepisovanju oblikovanja in zagotavlja homogeno tipografsko upodabljanje.
Zakaj LaTeX namesto neposrednega izvoza PDF?
Tiskanje strani HTML v PDF iz brskalnika je hitro, vendar je rezultat le redko tako dober kot publikacija. Uporaba LaTeXa prinaša več odločilnih prednosti:
- Profesionalna tipografija: zarezovanje, deljenje besed, utemeljitev, samodejno upravljanje vdov in sirot, bibliografija prek BibTeX/BibLaTeX, dosledno številčenje razdelkov, slik in enačb.
- Dokumenti, ki jih je mogoče reproducirati:
.texje besedilna datoteka z možnostjo različice, ki se ponovno prevede na enak način. Idealno za raziskave, dokumentacijo programske opreme ali kateri koli potek dela, kjer je ponovljivost pomembna. - Akademski standard: LaTeX ostaja format, ki ga pričakuje večina znanstvenih revij, konferenc in univerzitetnih nalog.
- Možno fino urejanje: če vam ustvarjena upodobitev ne ustreza 100%, odprite
.texv Overleaf, TeXstudio ali VS Code in prilagodite. Za razliko od zamrznjenega PDF-ja ohranite nadzor.
Tipični primeri uporabe
- Znanstveni članki: osnutek, napisan na spletu, pretvorite html v lateks, izboljšajte v Overleafu, oddajte v revijo.
- Pisma in življenjepisi: pojdite od urejevalnika HTML (bogatega, vizualnega) do brezhibno upodobljenega pisma LaTeX, pripravljenega za tiskanje.
- Tehnična dokumentacija: ustvarite referenčni PDF iz obstoječega dokumenta HTML (Sphinx, MkDocs, wiki) brez podvajanja vira.
- Notes Notion / Markdown: izvoz v HTML, nato skozi html2latex za pridobitev strukturiranega dokumenta za tiskanje.
- Korporativna poročila: preoblikujte poročilo, napisano v notranjem sistemu CMS, v natipkan dokument PDF.
Kako deluje naš pretvornik HTML v LaTeX?
Pretvornik razčleni vaš izvor HTML, identificira vsako oznako in jo preslika v enakovreden ukaz LaTeX. Konkretno:
- Naslovi
,,postanejo\section{},\subsection{},\subsubsection{}. - Vgrajeno oblikovanje (
,,,) je prevedeno vextbf{},extit{},\underline{},exttt{}. - Seznami (
,) postanejo okoljaitemizeinenumerate. - Povezave
so upodobljene s paketomhyperref. - Posebni znaki LaTeX (
%,&,$,#,_,{,}) so samodejno ubežni.
Izberete izhodni razred LaTeX: članek (privzeto za članke, kratka poročila), pismo (za korespondenco) ali knjigo (za dolge dokumente s poglavji). Preambula je ustvarjena z uporabnimi paketi: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.
Kako uporabljati orodje
Štirje koraki za pretvorbo HTML v LaTeX:
- Prilepite kodo HTML v predvideno polje.
- Izberite vrsto izhodnega dokumenta (članek, pismo, knjiga).
- Kliknite gumb za pretvorbo. Ustvari se datoteka
.texin njeno upodabljanje PDF. - Prenesite
.tex, da ga uredite v urejevalniku LaTeX, ali neposredno v PDF-ju.
Preslikave ključev HTML v LaTeX
Primer pretvorbe HTML v LaTeX
Vir HTML:
Glavni naslov
To je odstavek s krepkim in ležečim tiskom.
Pododdelek
- Element ena
- Drugi element s povezavo
LaTeX rezultat:
\documentclass{članek}
\usepackage[utf8]{inputenc}
\usepackage[francosko]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amsymb}
egin{dokument}
\section{Glavni naslov}
To je odstavek z extbf{krepko} in extit{ležeče}.
\subsection{Pododdelek}
egin{itemize}
\item Prvi element
\item Drugi element z \href{https://cdrn.fr}{povezavo}
nd{itemize}
nd{dokument}
pogosta vprašanja
Kateri razred LaTeX izbrati: članek, pismo ali knjigo?
članek je primeren za večino primerov (poročilo, članek, kratka opomba). pismo je namenjeno korespondenci (glava, podpis, vljudnostni izrazi). knjiga strukturira dolge dokumente v poglavja in vključuje podrobno kazalo vsebine. Če ste v dvomih, pojdite na članek.
Ali je ustvarjeni PDF zajamčeno mogoče prevesti?
Za standardni HTML (odstavki, naslovi, seznami, oblikovanje v vrstici, povezave) da. Če vaš HTML vsebuje eksotične oznake, vgrajeni JavaScript ali nestandardne ugnezdene strukture, bo morda treba pred prevajanjem ročno prilagoditi .tex.
Moj HTML uporablja slike: ali so vključene?
Oznake so pretvorjene v \includegraphics{} s paketom graphicx, vendar same slike niso vdelane v .tex (referenca lokalne datoteke LaTeX). Prenesite slike ločeno in jih pred prevajanjem postavite poleg .tex.
Zakaj ne Markdown neposredno v LaTeX?
Pandoc zelo dobro naredi Markdown za LaTeX. Naš pretvornik posebej cilja na HTML, ki pokriva vire, ki jih Markdown ne doseže: izvoze CMS, spletne strani, vsebino, napisano v urejevalnikih WYSIWYG, izpis generatorjev dokumentov. Če je vaš vir že v Markdownu, ga izvozite v HTML in pojdite sem ali neposredno uporabite Pandoc.
Ali upodabljanje LaTeX podpira UTF-8 in znake?
ja Preambula vključuje \usepackage[utf8]{inputenc} in \usepackage[french]{babel}, ki zagotavlja pravilno upodobitev naglasov, cedilla in francoskih tipografskih pravil (neprekinitveni presledki pred dvojnimi ločili, francoski narekovaji).
In nasprotno, LaTeX v HTML?
Pretvarjanje lateksa v html je še ena vaja (LaTeX je veliko bolj izrazit kot HTML, zlasti za enačbe). Za ta pomen si oglejte pandoc, htlatex ali LaTeXML. To orodje naredi samo html v lateks, samo v eno smer.
Pogosta vprašanja
Kateri razred LaTeX izbrati: članek, pismo ali knjigo?
članek je primeren za večino primerov (kratko poročilo, objava, zapis, znanstveni članek). pismo je namenjeno korespondenci z integrirano glavo, podpisom in vljudnimi izrazi. knjiga strukturira dolge dokumente v poglavja in vključuje podrobno kazalo vsebine. Če ste v dvomih, izberite article: to je najbolj univerzalen razred.
Ali so francoski naglasi in znaki upodobljeni pravilno?
ja Ustvarjena preambula vključuje \usepackage[utf8]{inputenc} in \usepackage[french]{babel}, ki zagotavlja pravilno upodobitev naglasov, cedilla in francoskih tipografskih pravil: neločljivi presledki pred dvojnimi ločili, francoski narekovaji, pravilno deljenje besed. Za besedilo v francoščini ni potreben ročni poseg.
Ali se posebni znaki LaTeX samodejno ubežijo?
ja Znaki, ki imajo pomen v LaTeXu (%, &, $, #, _, {, }, ~, ^, \), se med pretvorbo samodejno ubežijo. Besedilo HTML, ki vsebuje 50% popusta ali uporabniško ime, se pravilno prevede, ne da bi prekinili prevajanje.
Moj HTML uporablja slike: ali so vključene v .tex?
Oznake so pretvorjene v \includegraphics{} s paketom graphicx, vendar same slike niso vdelane v .tex, ker se LaTeX sklicuje na lokalne datoteke. Prenesite slike ločeno in jih postavite poleg .tex pred prevajanjem ali prilagodite pot v \graphicspath.
Kako obdelati HTML z matematičnimi enačbami?
Če so vaše enačbe že vstavljene v MathML ali LaTeX (na primer $E = mc^2$), jih pretvornik skoraj takšne, kot so, prenese na izhod. Enačbe, upodobljene kot slike (PNG, SVG), niso samodejno pretvorjene nazaj v LaTeX. Za brezhibno matematično upodabljanje napišite formule v LaTeXu v vir HTML, preambula že naloži amsmath in amssyb.
Ali je ustvarjeni .tex zagotovljeno prevedljiv?
Za standardni HTML (odstavki, naslovi, seznami, oblikovanje v vrstici, povezave, preproste tabele) da. Če vaš HTML vsebuje eksotične oznake, vgrajeni JavaScript, zapleten CSS ali nestandardne ugnezdene strukture, bo morda treba pred prevajanjem prilagoditi .tex. Odprite ga v Overleafu ali TeXstudio, da hitro opazite vsa opozorila.
Primer zahteve
curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
-H "Content-Type: application/json" \
-d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'
Vhodna shema
| Polje | Tip | Obvezno | Privzeto |
|---|---|---|---|
content |
string | ✓ | – |
type |
choice (letter, article) | ✓ | – |
city |
string | ✓ | – |
object |
string | ✓ | – |
opening |
string | ✓ | – |
closing |
string | ✓ | – |
sender_address |
text | ✓ | – |
recipient_address |
text | ✓ | – |
recipient_name |
string | ✓ | – |
sender_name |
string | ✓ | – |
sender_phone |
string | ✓ | – |
sender_mail |
string | ✓ | – |
Končne točke
GET https://cdrn.fr/api/v1/tools- izpiše vsa razpoložljiva orodjaGET https://cdrn.fr/api/v1/tools/html-to-latex-converter- pridobi shemo tega orodjaPOST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute- izvede to orodje s JSON payloadom