Konverzia HTML do LaTeXu a vygenerovanie PDF
- Dashboard
- Dokumentácia
- API
Prečo konvertovať HTML na LaTeX?
Konverzia HTML na LaTeX umožňuje produkovať PDF profesionálnej kvality z obsahu už napísaného na webe: CMS články, automaticky generovaná dokumentácia, blog posty, exporty z wiki alebo poznámky urobené vo WYSIWYG editore. Namiesto ručného preusporiadania tento HTML to LaTeX konvertor berie váš HTML zdroj a produkuje .tex súbor kompilovateľný do PDF.
Typické použitia: transformovať draft napísaný v Notion alebo Markdowne (exportovaný do HTML) na vedecký článok, transformovať webovú stránku na tlačiteľný letáčik, generovať list alebo CV z HTML editora. Konverzia html to latex sa vyhýba prepisovaniu formátovania a garantuje koherentný typografický render.
Prečo LaTeX skôr ako priamy export do PDF?
Tlač HTML stránky do PDF z prehliadača je rýchla, ale výsledok zriedka dosahuje úroveň publikácie. Prechod cez LaTeX prináša niekoľko rozhodujúcich výhod:
- Profesionálna typografia: kerning, delenie slov, justifikácia, automaticky spravované widows a orphans, bibliografia cez BibTeX/BibLaTeX, koherentné číslovanie sekcií, obrázkov a rovníc.
- Reprodukovateľné dokumenty:
.texje verziovateľný textový súbor, ktorý sa rekompiluje identicky. Ideálne pre výskum, softvérovú dokumentáciu alebo akýkoľvek tok, kde záleží reprodukovateľnosť. - Akademický štandard: LaTeX zostáva formátom očakávaným väčšinou vedeckých časopisov, konferencií a univerzitných dizertácií.
- Možnosť jemnej úpravy: ak vám generovaný render nevyhovuje na 100 %, otvorte
.texv Overleaf, TeXstudio alebo VS Code a upravte. Zachovávate kontrolu, na rozdiel od fixného PDF.
Typické prípady použitia
- Vedecké články: draft napísaný na webe, konvertovať html na latex, doladiť v Overleaf, submitnúť časopisu.
- Listy a CV: prejsť z HTML editora (bohatý, vizuálny) na LaTeX list s impeccable renderom, pripravený na tlač.
- Technická dokumentácia: generovať referenčné PDF z existujúcej HTML dokumentácie (Sphinx, MkDocs, wiki), bez duplikácie zdroja.
- Notion / Markdown poznámky: exportovať do HTML, potom prejsť cez html2latex pre získanie štruktúrovaného tlačiteľného dokumentu.
- Firemné reporty: transformovať report napísaný v internom CMS na typografovaný PDF deliverable.
Ako funguje náš HTML to LaTeX konvertor?
Konvertor parsuje váš HTML zdroj, identifikuje každú tag a mapuje ju na ekvivalentný LaTeX príkaz. Konkrétne:
- Tituly
<h1>,<h2>,<h3>sa stávajú\section{},\subsection{},\subsubsection{}. - Inline formátovanie (
<strong>,<em>,<u>,<code>) je preložené na\textbf{},\textit{},\underline{},\texttt{}. - Zoznamy (
<ul>,<ol>) sa stávajúitemizeaenumerateprostredím. - Odkazy
<a href>sú renderované balíkomhyperref. - LaTeX špeciálne znaky (
%,&,$,#,_,{,}) sú automaticky escapované.
Vyberáte výstupnú LaTeX triedu: article (default, pre články, krátke reporty), letter (pre korešpondenciu) alebo book (pre dlhé dokumenty s kapitolami). Preambula je generovaná s užitočnými balíkmi: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.
Ako používať nástroj
Štyri kroky pre konverziu HTML na LaTeX:
- Vložte váš HTML kód do vyhradeného poľa.
- Vyberte výstupný typ dokumentu (article, letter, book).
- Kliknite na tlačidlo konverzie.
.texsúbor a jeho PDF render sú generované. - Stiahnite
.texpre editáciu vo vašom LaTeX editore, alebo PDF priamo.
Kľúčové HTML to LaTeX mappings
| HTML | LaTeX | Poznámky |
|---|---|---|
<h1> |
\section{} |
Úroveň 1 |
<h2> |
\subsection{} |
Úroveň 2 |
<h3> |
\subsubsection{} |
Úroveň 3 |
<strong> |
\textbf{} |
Tučné |
<em> |
\textit{} |
Kurzíva |
<u> |
\underline{} |
Podčiarknuté |
<code> |
\texttt{} |
Monospace písmo |
<ul> |
\begin{itemize} |
Odrážkový zoznam |
<ol> |
\begin{enumerate} |
Číslovaný zoznam |
<li> |
\item |
Položka zoznamu |
<a href="..."> |
\href{...}{...} |
Vyžaduje \usepackage{hyperref} |
<blockquote> |
\begin{quote} |
Citácia |
<p> |
odsek | Prázdny riadok medzi odsekmi |
<br> |
\\ |
Zlom riadku |
Príklad HTML to LaTeX konverzie
HTML zdroj:
<h1>Hlavny titul</h1>
<p>Toto je odsek s <strong>tucnym</strong> a <em>kurzivou</em>.</p>
<h2>Podsekcia</h2>
<ul>
<li>Prvok jeden</li>
<li>Prvok dva s <a href="https://cdrn.fr">odkazom</a></li>
</ul>
LaTeX výsledok:
\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[slovak]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amssymb}
\begin{document}
\section{Hlavny titul}
Toto je odsek s \textbf{tucnym} a \textit{kurzivou}.
\subsection{Podsekcia}
\begin{itemize}
\item Prvok jeden
\item Prvok dva s \href{https://cdrn.fr}{odkazom}
\end{itemize}
\end{document}
FAQ
Ktorú LaTeX triedu zvoliť: article, letter alebo book?
article vyhovuje väčšine prípadov (report, článok, krátke memo). letter je dedikovaný korešpondencii (hlavička, podpis, zdvorilostné frázy). book štruktúruje dlhé dokumenty do kapitol a obsahuje detailný obsah. V prípade pochybností začnite s article.
Je generované PDF garantovane kompilovateľné?
Pre štandardný HTML (odseky, tituly, zoznamy, inline formátovanie, odkazy) áno. Ak váš HTML obsahuje exotické tagy, inline JavaScript alebo neštandardné vnorené štruktúry, môže byť potrebné ručne upraviť .tex pred kompiláciou.
Môj HTML používa obrázky: sú zahrnuté?
<img> tagy sú konvertované na \includegraphics{} s balíkom graphicx, ale samotné obrázky nie sú vložené do .tex (LaTeX referencuje lokálne súbory). Stiahnite obrázky oddelene a umiestnite ich vedľa .tex pred kompiláciou.
Prečo nie Markdown na LaTeX priamo?
Pandoc robí Markdown na LaTeX veľmi dobre. Náš konvertor špecificky cieli HTML, ktorý pokrýva zdroje, na ktoré Markdown nedosahuje: CMS exporty, webové stránky, obsahy napísané vo WYSIWYG editoroch, výstup doc generátorov. Ak je váš zdroj už v Markdowne, exportujte ho do HTML a potom prejdite tu, alebo použite priamo Pandoc.
Spravuje LaTeX render UTF-8 a akcenty?
Áno. Preambula zahŕňa \usepackage[utf8]{inputenc} a \usepackage[slovak]{babel}, čo zabezpečuje správny render akcentov, dĺžňov a slovenských typografických pravidiel.
A opak, LaTeX na HTML?
Konverzia latex na html je iné cvičenie (LaTeX je oveľa expresívnejší než HTML, najmä pre rovnice). Pre tento smer sa pozrite na pandoc, htlatex alebo LaTeXML. Tento nástroj robí iba html to latex, jedným smerom.
Často kladené otázky
Ktorú LaTeX triedu zvoliť: article, letter alebo book?
article vyhovuje väčšine prípadov (krátky report, post, memo, vedecký článok). letter je dedikovaný korešpondencii s integrovanou hlavičkou, podpisom a zdvorilostnými frázami. book štruktúruje dlhé dokumenty do kapitol a obsahuje detailný obsah. V prípade pochybností začnite s article: je to najuniverzálnejšia trieda.
Sú akcenty a slovenské znaky správne renderované?
Áno. Generovaná preambula zahŕňa \usepackage[utf8]{inputenc} a \usepackage[slovak]{babel}, čo zabezpečuje korektný render akcentov, dĺžňov a slovenských typografických pravidiel: nepredeliteľné medzery pred dvojitými interpunkciami, správne delenie slov. Pre slovenský text nie je potrebný žiadny manuálny zásah.
Sú LaTeX špeciálne znaky automaticky escapované?
Áno. Znaky s významom v LaTeX (%, &, $, #, _, {, }, ~, ^, \) sú automaticky escapované pri konverzii. HTML text obsahujúci 50 % zľava alebo nazov_uzivatela sa správne prekladá bez porušenia kompilácie.
Môj HTML používa obrázky: sú zahrnuté v .tex?
<img> tagy sú konvertované na \includegraphics{} s balíkom graphicx, ale samotné obrázky nie sú vložené do .tex, pretože LaTeX referencuje lokálne súbory. Stiahnite obrázky oddelene a umiestnite ich vedľa .tex pred kompiláciou, alebo upravte cestu v \graphicspath.
Ako spracovať HTML s matematickými rovnicami?
Ak sú vaše rovnice už v MathML alebo inline LaTeX (napríklad $E = mc^2$), konvertor ich prenáša takmer tak, ako sú, do výstupu. Rovnice renderované ako obrázky (PNG, SVG) nie sú automaticky rekonvertované na LaTeX. Pre impeccable matematický render píšte vzorce v LaTeX v HTML zdroji, preambula už načítava amsmath a amssymb.
Je generovaný .tex garantovane kompilovateľný?
Pre štandardný HTML (odseky, tituly, zoznamy, inline formátovanie, odkazy, jednoduché tabuľky) áno. Ak váš HTML obsahuje exotické tagy, inline JavaScript, komplexné CSS alebo neštandardné vnorené štruktúry, môže byť potrebné upraviť .tex pred kompiláciou. Otvorte ho v Overleaf alebo TeXstudio pre rýchle identifikovanie prípadných varovaní.
Ukážka požiadavky
curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
-H "Content-Type: application/json" \
-d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'
Vstupná schéma
| Pole | Typ | Povinné | Predvolené |
|---|---|---|---|
content |
string | ✓ | – |
type |
choice (letter, article) | ✓ | – |
city |
string | ✓ | – |
object |
string | ✓ | – |
opening |
string | ✓ | – |
closing |
string | ✓ | – |
sender_address |
text | ✓ | – |
recipient_address |
text | ✓ | – |
recipient_name |
string | ✓ | – |
sender_name |
string | ✓ | – |
sender_phone |
string | ✓ | – |
sender_mail |
string | ✓ | – |
Koncové body
GET https://cdrn.fr/api/v1/tools- vypíše všetky dostupné nástrojeGET https://cdrn.fr/api/v1/tools/html-to-latex-converter- získa schému tohto nástrojaPOST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute- spustí tento nástroj s JSON payloadom