Pretvoriti HTML u LaTeX i generirati PDF
- Nadzorna ploča
- Dokumentacija
- API
Zašto pretvoriti HTML u LaTeX?
Pretvaranje HTML-a u LaTeX omogućuje vam izradu PDF-ova profesionalne kvalitete iz sadržaja koji je već napisan na webu: članaka iz CMS-a, vlastito generirane dokumentacije, postova na blogu, wiki izvoza ili bilješki snimljenih u WYSIWYG uređivaču. Umjesto ručnog prijenosa, ovaj pretvarač HTML-a u LaTeX uzima vaš HTML izvor i proizvodi .tex datoteku koja se može prevesti u PDF.
Uobičajene upotrebe: transformirajte nacrt napisan na Notionu ili Markdownu (izvezen u HTML) u znanstveni članak, transformirajte web stranicu u knjižicu za ispis, generirajte pismo ili životopis iz HTML editora. Pretvorbom html u latex izbjegava se ponovno pisanje formatiranja i jamči homogeno tipografsko iscrtavanje.
Zašto LaTeX umjesto izravnog izvoza u PDF?
Ispis HTML stranice u PDF iz preglednika je brz, ali rezultat je rijetko tako dobar kao publikacija. Korištenje LaTeX-a donosi nekoliko odlučujućih prednosti:
- Profesionalna tipografija: kerning, rastavljanje crtica, opravdanje, udovice i siročad kojima se upravlja automatski, bibliografija putem BibTeX/BibLaTeX, dosljedno numeriranje odjeljaka, slika i jednadžbi.
- Dokumenti koji se mogu reproducirati:
.texje tekstualna datoteka s mogućnošću verzije koja se ponovno kompajlira na identičan način. Idealno za istraživanje, softversku dokumentaciju ili bilo koji tijek rada gdje je ponovljivost važna. - Akademski standard: LaTeX ostaje format koji očekuje većina znanstvenih časopisa, konferencija i sveučilišnih radova.
- Moguće fino uređivanje: ako vam generirani prikaz ne odgovara 100%, otvorite
.texu Overleafu, TeXstudio ili VS Code i prilagodite. Vi zadržavate kontrolu, za razliku od zamrznutog PDF-a.
Tipični slučajevi upotrebe
- Znanstveni članci: nacrt napisan na webu, pretvoriti html u lateks, doraditi u Overleafu, poslati u časopis.
- Pisma i životopisi: prijeđite s HTML editora (bogatog, vizualnog) na besprijekorno prikazano LaTeX pismo, spremno za ispis.
- Tehnička dokumentacija: generirajte referentni PDF iz postojećeg HTML dokumenta (Sphinx, MkDocs, wiki), bez dupliciranja izvora.
- Notes Notion / Markdown: izvezite u HTML, zatim prođite kroz html2latex da biste dobili strukturirani dokument za ispis.
- Korporativna izvješća: transformirajte izvješće napisano u internom CMS-u u isporučeni PDF.
Kako radi naš pretvarač HTML-a u LaTeX?
Konverter analizira vaš HTML izvor, identificira svaku oznaku i preslikava je na ekvivalentnu LaTeX naredbu. Konkretno:
- Naslovi
,,postaju\section{},\subsection{},\subsubsection{}. - Umetnuto oblikovanje (
,,,) prevodi se uextbf{},extit{},\underline{},exttt{}. - Popisi (
,) postaju okruženjaitemizeienumerate. - Veze
prikazuju se paketomhyperref. - LaTeX posebni znakovi (
%,&,$,#,_,{,}) automatski se izlaze.
Vi birate izlaznu LaTeX klasu: članak (prema zadanim postavkama, za članke, kratke izvještaje), pismo (za korespondenciju) ili knjigu (za dugačke dokumente s poglavljima). Preambula je generirana pomoću korisnih paketa: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.
Kako koristiti alat
Četiri koraka za pretvaranje HTML-a u LaTeX:
- Zalijepite svoj HTML kod u predviđeno polje.
- Odaberite vrstu izlaznog dokumenta (članak, pismo, knjiga).
- Kliknite gumb za pretvaranje. Generiraju se
.texdatoteka i njezin PDF prikaz. - Preuzmite
.texda biste ga uredili u vašem LaTeX uređivaču ili izravno u PDF-u.
HTML u LaTeX preslikavanja ključeva
Primjer pretvorbe HTML-a u LaTeX
HTML izvor:
<šifra>Glavni naslov
Ovo je odlomak s podebljanim i kurzivom.
Pododjeljak
- Prvi element
- Drugi element s vezom
LaTeX rezultat:
<šifra>
\documentclass{članak}
\usepackage[utf8]{inputenc}
\usepackage[francuski]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amsymb}
egin{dokument}
\section{Glavni naslov}
Ovo je odlomak s extbf{podebljano} i extit{kurziv}.
\subsection{Pododjeljak}
egin{itemize}
\item Prvi element
\item Element dva s \href{https://cdrn.fr}{vezom}
nd{itemize}
nd{dokument}
FAQ
Koju LaTeX klasu odabrati: članak, pismo ili knjigu?
članak je prikladan za većinu slučajeva (izvješće, članak, kratki dopis). pismo je posvećeno dopisivanju (zaglavlje, potpis, uljudni izrazi). knjiga duge dokumente strukturira u poglavlja i uključuje detaljan sadržaj. Ako ste u nedoumici, idite na članak.
Je li zajamčeno da se generirani PDF može kompajlirati?
Za standardni HTML (odlomci, naslovi, popisi, inline oblikovanje, veze), da. Ako vaš HTML sadrži egzotične oznake, ugrađeni JavaScript ili nestandardne ugniježđene strukture, možda će biti potrebno ručno prilagoditi .tex prije kompajliranja.
Moj HTML koristi slike: jesu li uključene?
Oznake pretvaraju se u \includegraphics{} s paketom graphicx, ali same slike nisu ugrađene u .tex (LaTeX lokalna referenca datoteke). Preuzmite slike odvojeno i stavite ih pored .tex prije kompajliranja.
Zašto ne Markdown izravno u LaTeX?
Pandoc vrlo dobro radi Markdown za LaTeX. Naš pretvarač posebno cilja HTML, koji pokriva izvore do kojih Markdown ne dopire: CMS izvoze, web stranice, sadržaj napisan u WYSIWYG uređivačima, izlaz iz generatora dokumenata. Ako je vaš izvor već u Markdownu, izvezite ga u HTML, a zatim idite ovdje ili izravno upotrijebite Pandoc.
Podržava li LaTeX iscrtavanje UTF-8 i naglaske?
da Preambula uključuje \usepackage[utf8]{inputenc} i \usepackage[french]{babel}, što osigurava ispravno prikazivanje naglasaka, cedilla i francuska tipografska pravila (neprekidni razmaci prije dvostrukih interpunkcijskih znakova, francuski navodnici).
I suprotno, LaTeX u HTML-u?
Pretvaranje lateksa u html još je jedna vježba (LaTeX je mnogo izražajniji od HTML-a, posebno za jednadžbe). Za ovo značenje pogledajte pandoc, htlatex ili LaTeXML. Ovaj alat radi samo html u lateksu, samo u jednom smjeru.
Često postavljana pitanja
Koju LaTeX klasu odabrati: članak, pismo ili knjigu?
članak prikladan je za većinu slučajeva (kratko izvješće, post, dopis, znanstveni članak). pismo namijenjeno je korespondenciji s integriranim zaglavljem, potpisom i uljudnim izrazima. knjiga duge dokumente strukturira u poglavlja i uključuje detaljan sadržaj. Ako ste u nedoumici, idite s article: to je najuniverzalnija klasa.
Jesu li francuski naglasci i znakovi ispravno prikazani?
da Generirana preambula uključuje \usepackage[utf8]{inputenc} i \usepackage[french]{babel}, što osigurava ispravno prikazivanje naglasaka, cedilla i francuska tipografska pravila: neraskidivi razmaci prije duple interpunkcije, francuski navodnici, ispravno rastavljanje crtica. Za tekst na francuskom nije potrebna ručna intervencija.
Jesu li LaTeX posebni znakovi automatski izbjegnuti?
da Znakovi koji imaju značenje u LaTeX-u (%, &, $, #, _, {, }, ~, ^, \) automatski se izbjegavaju tijekom pretvorbe. HTML tekst koji sadrži 50% popusta ili username ispravno se prevodi bez prekida kompilacije.
Moj HTML koristi slike: jesu li one uključene u .tex?
Oznake pretvaraju se u \includegraphics{} s paketom graphicx, ali same slike nisu ugrađene u .tex jer LaTeX upućuje na lokalne datoteke. Preuzmite slike zasebno i postavite ih pored .tex prije kompajliranja ili prilagodite putanju u \graphicspath.
Kako obraditi HTML s matematičkim jednadžbama?
Ako su vaše jednadžbe već ugrađene u MathML ili LaTeX (na primjer $E = mc^2$), pretvarač ih prenosi gotovo takve kakve jesu na izlaz. Jednadžbe prikazane kao slike (PNG, SVG) ne pretvaraju se automatski natrag u LaTeX. Za besprijekorno matematičko prikazivanje, napišite formule u LaTeX-u u HTML izvoru, preambula već učitava amsmath i amssyb.
Je li zajamčeno da se generirani .tex može kompajlirati?
Za standardni HTML (odlomci, naslovi, popisi, umetnuto oblikovanje, veze, jednostavne tablice), da. Ako vaš HTML sadrži egzotične oznake, ugrađeni JavaScript, složeni CSS ili nestandardne ugniježđene strukture, možda će biti potrebno prilagoditi .tex prije kompilacije. Otvorite ga u Overleafu ili TeXstudiu kako biste brzo uočili sva upozorenja.
Primjer zahtjeva
curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
-H "Content-Type: application/json" \
-d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'
Ulazna shema
| Polje | Tip | Obavezno | Zadano |
|---|---|---|---|
content |
string | ✓ | – |
type |
choice (letter, article) | ✓ | – |
city |
string | ✓ | – |
object |
string | ✓ | – |
opening |
string | ✓ | – |
closing |
string | ✓ | – |
sender_address |
text | ✓ | – |
recipient_address |
text | ✓ | – |
recipient_name |
string | ✓ | – |
sender_name |
string | ✓ | – |
sender_phone |
string | ✓ | – |
sender_mail |
string | ✓ | – |
Krajnje točke
GET https://cdrn.fr/api/v1/tools- ispisuje sve dostupne alateGET https://cdrn.fr/api/v1/tools/html-to-latex-converter- dohvaća shemu ovog alataPOST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute- izvršava ovaj alat s JSON payloadom