Převést HTML do LaTeXu a vygenerovat PDF
- Dashboard
- Dokumentace
- API
Proč převádět HTML na LaTeX?
Převod HTML na LaTeX umožňuje produkovat PDF profesionální kvality z obsahu již napsaného na webu: CMS články, automaticky generovaná dokumentace, blogové příspěvky, exporty wiki nebo poznámky pořízené v WYSIWYG editoru. Místo manuálního přepracování stránkování bere tento HTML to LaTeX převodník váš HTML zdroj a produkuje .tex soubor kompilovatelný do PDF.
Typická použití: transformovat koncept napsaný v Notion nebo Markdownu (exportovaný do HTML) na vědecký článek, transformovat webovou stránku na tisknutelnou brožuru, generovat dopis nebo CV z HTML editoru. Konverze html to latex se vyhne přepsání formátování a garantuje homogenní typografický rendering.
Proč LaTeX místo přímého PDF exportu?
Tisk HTML stránky do PDF z prohlížeče je rychlý, ale výsledek jen vzácně dosahuje úrovně publikace. Průchod přes LaTeX přináší několik rozhodujících výhod:
- Profesionální typografie: kerning, dělení slov, justification, automaticky spravované vdovy a sirotci, bibliografie přes BibTeX/BibLaTeX, konzistentní číslování sekcí, obrázků a rovnic.
- Reprodukovatelné dokumenty:
.texje verzovatelný textový soubor, který se identicky překompiluje. Ideální pro výzkum, softwarovou dokumentaci nebo jakýkoli flow, kde reprodukovatelnost počítá. - Akademický standard: LaTeX zůstává formátem očekávaným většinou vědeckých časopisů, konferencí a univerzitních disertací.
- Možnost jemné editace: pokud vám vygenerovaný rendering nevyhovuje na 100 %, otevřete
.texv Overleafu, TeXstudiu nebo VS Code a upravte. Zachováváte kontrolu, na rozdíl od zmrazeného PDF.
Typické případy použití
- Vědecké články: koncept napsaný na webu, převést html na latex, dopilovat v Overleafu, předložit časopisu.
- Dopisy a CV: přejít z HTML editoru (bohatý, vizuální) na LaTeX dopis s bezchybným renderingem, připravený k tisku.
- Technická dokumentace: generovat referenční PDF z existující HTML dokumentace (Sphinx, MkDocs, wiki), bez duplikace zdroje.
- Notion / Markdown poznámky: exportovat do HTML, pak projít přes html2latex pro získání strukturovaného tisknutelného dokumentu.
- Firemní reporty: transformovat report napsaný v interním CMS na typograficky upravený PDF výstup.
Jak funguje náš HTML to LaTeX převodník?
Převodník parsuje váš HTML zdroj, identifikuje každý tag, a mapuje ho na ekvivalentní LaTeX příkaz. Konkrétně:
- Nadpisy
<h1>,<h2>,<h3>se stávají\section{},\subsection{},\subsubsection{}. - Inline formátování (
<strong>,<em>,<u>,<code>) je překládáno na\textbf{},\textit{},\underline{},\texttt{}. - Seznamy (
<ul>,<ol>) se stávajíitemizeaenumerateprostředími. - Odkazy
<a href>jsou renderovány shyperrefbalíčkem. - Speciální LaTeX znaky (
%,&,$,#,_,{,}) jsou automaticky escapovány.
Vybíráte výstupní LaTeX třídu: article (výchozí, pro články, krátké reporty), letter (pro korespondenci) nebo book (pro dlouhé dokumenty s kapitolami). Preambule je generován s užitečnými balíčky: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.
Jak používat nástroj
Čtyři kroky k převodu HTML na LaTeX:
- Vložte svůj HTML kód do pole.
- Vyberte typ výstupního dokumentu (article, letter, book).
- Klikněte na převodní tlačítko.
.texsoubor a jeho PDF rendering jsou vygenerovány. - Stáhněte
.texpro editaci ve vašem LaTeX editoru, nebo PDF přímo.
Klíčové HTML to LaTeX mapping
| HTML | LaTeX | Poznámky |
|---|---|---|
<h1> | \section{} | Úroveň 1 |
<h2> | \subsection{} | Úroveň 2 |
<h3> | \subsubsection{} | Úroveň 3 |
<strong> | \textbf{} | Tučné |
<em> | \textit{} | Kurzíva |
<u> | \underline{} | Podtržené |
<code> | \texttt{} | Monospace písmo |
<ul> | \begin{itemize} | Odrážkový seznam |
<ol> | \begin{enumerate} | Číslovaný seznam |
<li> | \item | Element seznamu |
<a href="..."> | \href{...}{...} | Vyžaduje \usepackage{hyperref} |
<blockquote> | \begin{quote} | Citace |
<p> | odstavec | Prázdný řádek mezi odstavci |
<br> | \\ | Zalomení řádku |
Příklad HTML to LaTeX konverze
HTML zdroj:
<h1>Hlavní nadpis</h1>
<p>Toto je odstavec s <strong>tučným textem</strong> a <em>kurzívou</em>.</p>
<h2>Podsekce</h2>
<ul>
<li>Element jedna</li>
<li>Element dva s <a href="https://cdrn.fr">odkazem</a></li>
</ul>
LaTeX výsledek:
\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[czech]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amssymb}
\begin{document}
\section{Hlavní nadpis}
Toto je odstavec s \textbf{tučným textem} a \textit{kurzívou}.
\subsection{Podsekce}
\begin{itemize}
\item Element jedna
\item Element dva s \href{https://cdrn.fr}{odkazem}
\end{itemize}
\end{document}
FAQ
Kterou LaTeX třídu zvolit: article, letter nebo book?
article vyhovuje většině případů (report, článek, krátké memo). letter je dedikovaný korespondenci (hlavička, podpis, zdvořilostní fráze). book strukturuje dlouhé dokumenty do kapitol a obsahuje detailní obsah. V pochybách vyjděte z article.
Je vygenerované PDF zaručeně kompilovatelné?
Pro standardní HTML (odstavce, nadpisy, seznamy, inline formátování, odkazy) ano. Pokud váš HTML obsahuje exotické tagy, inline JavaScript nebo nestandardní vnořené struktury, může být nutné .tex manuálně upravit před kompilací.
Můj HTML používá obrázky: jsou zahrnuty?
<img> tagy jsou převedeny na \includegraphics{} s balíčkem graphicx, ale samotné obrázky nejsou vloženy do .tex (LaTeX referencuje lokální soubory). Stáhněte obrázky samostatně a umístěte je vedle .tex před kompilací.
Proč ne Markdown na LaTeX přímo?
Pandoc dělá Markdown na LaTeX velmi dobře. Náš převodník specificky cílí HTML, který pokrývá zdroje, kterých Markdown nedosáhne: CMS exporty, webové stránky, obsah napsaný v WYSIWYG editorech, výstupy doc generátorů. Pokud je váš zdroj již v Markdownu, exportujte ho do HTML a pak projděte sem, nebo použijte Pandoc přímo.
Spravuje LaTeX rendering UTF-8 a diakritiku?
Ano. Preambule obsahuje \usepackage[utf8]{inputenc} a \usepackage[czech]{babel}, což zajišťuje správný rendering diakritiky a české typografické pravidla.
A opačně, LaTeX na HTML?
Konverze latex na html je jiný úkol (LaTeX je mnohem expresivnější než HTML, zejména pro rovnice). Pro tento směr se podívejte na pandoc, htlatex nebo LaTeXML. Tento nástroj dělá pouze html to latex, v jediném směru.
Často kladené otázky
Kterou LaTeX třídu zvolit: article, letter nebo book?
article vyhovuje většině případů (krátký report, příspěvek, memo, vědecký článek). letter je dedikovaný korespondenci s integrovanou hlavičkou, podpisem a zdvořilostními frázemi. book strukturuje dlouhé dokumenty do kapitol a obsahuje detailní obsah. V pochybách vyjděte z article: je to nejuniverzálnější třída.
Jsou diakritika a české znaky správně renderovány?
Ano. Vygenerovaný preambule obsahuje \usepackage[utf8]{inputenc} a \usepackage[czech]{babel}, což zajišťuje správný rendering diakritiky a české typografické pravidla. Žádný manuální zásah není pro český text nutný.
Jsou speciální LaTeX znaky automaticky escapovány?
Ano. Znaky s LaTeX významem (%, &, $, #, _, {, }, ~, ^, \) jsou při konverzi automaticky escapovány. HTML text obsahující 50 % slevy nebo uzivatelske_jmeno se správně překládá bez rozbití kompilace.
Můj HTML používá obrázky: jsou zahrnuty v .tex?
<img> tagy jsou převedeny na \includegraphics{} s balíčkem graphicx, ale samotné obrázky nejsou vloženy do .tex, protože LaTeX referencuje lokální soubory. Stáhněte obrázky samostatně a umístěte je vedle .tex před kompilací, nebo upravte cestu v \graphicspath.
Jak ošetřit HTML s matematickými rovnicemi?
Pokud jsou vaše rovnice již v MathML nebo inline LaTeX (například $E = mc^2$), převodník je předává prakticky jak jsou na výstup. Rovnice renderované jako obrázky (PNG, SVG) nejsou automaticky převedeny zpět na LaTeX. Pro bezchybný matematický rendering pište vzorce v LaTeX v HTML zdroji, preambule již načítá amsmath a amssymb.
Je vygenerovaný .tex zaručeně kompilovatelný?
Pro standardní HTML (odstavce, nadpisy, seznamy, inline formátování, odkazy, jednoduché tabulky) ano. Pokud váš HTML obsahuje exotické tagy, inline JavaScript, komplexní CSS nebo nestandardní vnořené struktury, může být nutné .tex před kompilací upravit. Otevřete ho v Overleafu nebo TeXstudiu pro rychlou identifikaci případných varování.
Ukázka požadavku
curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
-H "Content-Type: application/json" \
-d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'
Vstupní schéma
| Pole | Typ | Povinné | Výchozí |
|---|---|---|---|
content |
string | ✓ | – |
type |
choice (letter, article) | ✓ | – |
city |
string | ✓ | – |
object |
string | ✓ | – |
opening |
string | ✓ | – |
closing |
string | ✓ | – |
sender_address |
text | ✓ | – |
recipient_address |
text | ✓ | – |
recipient_name |
string | ✓ | – |
sender_name |
string | ✓ | – |
sender_phone |
string | ✓ | – |
sender_mail |
string | ✓ | – |
Koncové body
GET https://cdrn.fr/api/v1/tools- vypíše všechny dostupné nástrojeGET https://cdrn.fr/api/v1/tools/html-to-latex-converter- získá schéma tohoto nástrojePOST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute- spustí tento nástroj s JSON payloadem