Převést LaTeX na HTML

převádí váš LaTeX zdroj do HTML, ideální pro publikování vašich článků, rovnic a akademických dokumentů na webu

Co je LaTeX?

LaTeX je sazební systém dokumentů velmi používaný ve vědeckých, akademických a technických prostředích. Vymyšlený Leslie Lamportem na začátku osmdesátých let, spočívá na typografickém enginu TeX Donalda Knutha. Místo psaní dokumentu s WYSIWYG editorem (jako Word) autor popisuje logickou strukturu obsahu přes příkazy: \section{Úvod}, \textbf{důležité}, \begin{itemize}... Kompilátor pak produkuje PDF pozoruhodné typografické kvality, zvláště přizpůsobené matematickým vzorcům, vědeckým článkům a dlouhým dílům.

Pokud je LaTeX neporazitelný pro produkci akademického PDF, je naopak málo kompatibilní s webem: prohlížeč nečte LaTeX, čte HTML. Náš nástroj LaTeX na HTML přesně odpovídá této potřebě: vzít fragment LaTeX zdroje a vrátit ho v HTML přímo integrovatelném do blogu, CMS, stránky webu nebo emailu.

Opak našeho HTML na LaTeX

Náš toolbox již nabízí převodník HTML na LaTeX, který bere HTML a produkuje PDF přes pdflatex. Tento nástroj je opačná operace: z LaTeXu do HTML. Oba nástroje se používají společně v editorial chains:

  • Píšete vědecký článek v LaTeXu, chcete publikovat webovou verzi: LaTeX na HTML.
  • Získáváte HTML text z CMS, chcete z něj udělat čisté akademické PDF: HTML na LaTeX.
  • Chcete udržovat jediný LaTeX zdroj a deklinovat ho na PDF + webová stránka: kombinujte oba nástroje nebo použijte LaTeX na HTML pro generování webové verze.

LaTeX na HTML mapping

Náš převodník rozpoznává běžné LaTeX příkazy a aplikuje následující mapping:

  • \section{Titul} a \section*{Titul}<h1>Titul</h1>
  • \subsection{Titul}<h2>Titul</h2>
  • \subsubsection{Titul}<h3>Titul</h3>
  • \paragraph{Titul}<h4>Titul</h4>
  • \textbf{x}<strong>x</strong>
  • \textit{x} a \emph{x}<em>x</em>
  • \underline{x}<u>x</u>
  • \texttt{x}<code>x</code>
  • \begin{itemize} \item ... \end{itemize}<ul><li>...</li></ul>
  • \begin{enumerate} \item ... \end{enumerate}<ol><li>...</li></ol>
  • \begin{quote} ... \end{quote}<blockquote>...</blockquote>
  • Prázdné řádky oddělující odstavce → <p>...</p>
  • \\ a \newline<br>
  • Escape \&, \%, \$, \#, \_, \{, \} → odpovídající znaky
  • Preambule (\documentclass, \usepackage, \begin{document}, \end{document}) → tiše odstraněno

Příklad použití

LaTeX zdroj:

\section*{Úvod}
Zde je \textbf{příklad} dokumentu se seznamem:

\begin{itemize}
\item první bod
\item druhý bod
\end{itemize}

A \textit{citace} na závěr.

HTML výsledek:

<h1>Úvod</h1>
<p>Zde je <strong>příklad</strong> dokumentu se seznamem:</p>
<ul><li>první bod</li><li>druhý bod</li></ul>
<p>A <em>citace</em> na závěr.</p>

Případy použití

  • Migrace disertace na blog: napsali jste disertaci v LaTeXu, chcete publikovat kapitoly na blogu nebo osobním webu. Převodník dělá podstatu těžké práce, už jen musíte dotáhnout finální formátování.
  • Extrakce obsahu z vědeckého článku: převzít úvod, abstrakt nebo závěr existujícího LaTeX článku pro znovupublikování na webu (stránka projektu, lab komunikace).
  • Příprava pedagogické podpory: kurz napsaný v LaTeXu může být přesunut do HTML pro napájení Moodle, wiki nebo e-learning platformy.
  • Technická dokumentace: převést LaTeX technickou poznámku do HTML pro distribuci na Confluence, GitHub Pages nebo intranetu.
  • Rychlý náhled: vizualizovat, jak by LaTeX fragment vypadal v HTML, bez spuštění kompletní pdflatex kompilace.

Omezení

Náš převodník je záměrně pragmatický: cílí pokrýt 90 % běžných případů s jednoduchou implementací, místo nárokování si exhaustivního pokrytí celé LaTeX syntaxe. Konkrétně:

  • Žádné komplexní matematické vzorce. Výrazy $x^2$ a \begin{equation}...\end{equation} jsou zachovány jak jsou. Pro webový matematický rendering integrujte MathJax nebo KaTeX do své stránky.
  • Žádné obrázky, tabulky nebo bibliografie. Příkazy \includegraphics, \begin{table}, \bibliography nejsou překládány.
  • Žádná vlastní makra. \newcommand{\mojefunkce} není interpretován: převodník rozpoznává pouze standardní LaTeX příkazy.
  • Minimální styl. Výstup je sémantické HTML bez vloženého CSS: je na vás přidat vlastní stylesheet.

Pro pokročilejší konverze nástroje jako Pandoc pokrývají větší LaTeX plochu. Náš nástroj cílí na běžnou potřebu: rychle získat čisté HTML z LaTeX fragmentu, bez instalace softwaru.

Jak používat převodník

  1. Vložte svůj LaTeX zdroj do textového pole (fragment nebo kompletní dokument, preambule bude ignorován).
  2. Klikněte na převést.
  3. Získáte odpovídající HTML: zkopírujte ho do svého editoru, CMS nebo statického souboru.
  4. Pro opačnou operaci použijte náš převodník HTML na LaTeX.

Často kladené otázky

Spravuje převodník matematické vzorce?

Matematický LaTeX ($x^2 + y^2$, \begin{equation}) je zachován jak je v HTML výstupu. Pro vizuální rendering přidejte na svou webovou stránku MathJax nebo KaTeX: tyto knihovny renderují matematický LaTeX na straně prohlížeče.

Mé vlastní příkazy (\newcommand) nejsou překládány, proč?

Převodník neprovádí TeX engine, dělá syntaktický mapping. Makro definované \newcommand není rozvinuto. Před konverzí nahraďte makra jejich explicitní definicí, nebo použijte Pandoc, který má kompletnější parser.

Je LaTeX preambule ve vstupu povinný?

Ne. Můžete vložit fragment bez \documentclass ani \begin{document}. Pokud váš zdroj obsahuje kompletní preambuli, je stejně ignorován: pouze užitečný obsah je převeden.

Jsou znaky s diakritikou správně spravovány?

Ano, pokud je váš LaTeX zdroj v UTF-8 (s nebo bez \usepackage[utf8]{inputenc}). Staré LaTeX notace jako \'e pro é nejsou explicitně překládány, preferujte přímý UTF-8.

Jsou má data odeslána a uložena?

LaTeX je zpracován na straně serveru po dobu konverze, pak výsledek je vrácen vašemu prohlížeči. Žádná data nejsou uložena, indexována ani sdílena.

Proč získávat HTML místo PDF?

HTML je nativní formát webu: stránky, blogy, emaily, CMS. Pokud je vaše finální potřeba PDF, použijte spíše náš převodník HTML na LaTeX, který produkuje PDF přes pdflatex.

Ukázka požadavku

curl -X POST https://cdrn.fr/api/v1/tools/latex-to-html-converter/execute \
  -H "Content-Type: application/json" \
  -d '{"latex":"..."}'

Vstupní schéma

Pole Typ Povinné Výchozí
latex text

Koncové body

  • GET https://cdrn.fr/api/v1/tools - vypíše všechny dostupné nástroje
  • GET https://cdrn.fr/api/v1/tools/latex-to-html-converter - získá schéma tohoto nástroje
  • POST https://cdrn.fr/api/v1/tools/latex-to-html-converter/execute - spustí tento nástroj s JSON payloadem