LaTeX konvertálása HTML-be

LaTeX forrását HTML-re alakítja, ideális cikkek, egyenletek és akadémiai dokumentumok webes publikálásához

Mi az a LaTeX?

A LaTeX egy dokumentumszerkesztő rendszer, amelyet széles körben használnak tudományos, akadémiai és műszaki körökben. Leslie Lamport találta fel az 1980-as évek elején, Donald Knuth TeX tipográfiai motorján alapul. Ahelyett, hogy WYSIWYG szerkesztővel (mint a Word) írna dokumentumot, a szerző parancsokon keresztül írja le a tartalom logikai szerkezetét: \section{Bevezetés}, \textbf{fontos}, \begin{itemize}... A fordító ezután figyelemre méltó tipográfiai minőségű PDF-et készít, amely különösen alkalmas matematikai képletekhez, tudományos cikkekhez és hosszú művekhez.

Bár a LaTeX verhetetlen az akadémiai PDF-ek készítésében, kevésbé kompatibilis a webbel: a böngésző nem olvassa a LaTeX-et, csak a HTML-t. LaTeX-ről HTML-re eszközünk pontosan erre az igényre válaszol: vesz egy LaTeX forrásrészletet, és közvetlenül egy blogba, CMS-be, weboldalba vagy e-mailbe integrálható HTML-ként adja vissza.

A HTML-ről LaTeX-re eszközünk fordítottja

Eszköztárunk már kínál egy HTML-ről LaTeX-re konvertálót, amely HTML-t vesz alapul, és PDF-et készít pdflatex-en keresztül. A jelenlegi eszköz ennek fordítottja: LaTeX-ről HTML-re. A két eszköz együtt is használható a szerkesztési folyamatokban:

  • Tudományos cikket ír LaTeX-ben, és szeretné közzétenni a webes verziót: LaTeX-ről HTML-re.
  • HTML szöveget kap egy CMS-ből, és tiszta akadémiai PDF-et szeretne belőle készíteni: HTML-ről LaTeX-re.
  • Egyetlen LaTeX forrást szeretne fenntartani, és PDF + weboldal formában is megjelentetni: kombinálja a két eszközt, vagy használja a LaTeX-ről HTML-re eszközt a webes verzió generálásához.

LaTeX-ről HTML-re megfeleltetés

Konvertálónk felismeri a gyakori LaTeX parancsokat, és az alábbi megfeleltetést alkalmazza:

  • \section{Cím} és \section*{Cím}<h1>Cím</h1>
  • \subsection{Cím}<h2>Cím</h2>
  • \subsubsection{Cím}<h3>Cím</h3>
  • \paragraph{Cím}<h4>Cím</h4>
  • \textbf{x}<strong>x</strong>
  • \textit{x} és \emph{x}<em>x</em>
  • \underline{x}<u>x</u>
  • \texttt{x}<code>x</code>
  • \begin{itemize} \item ... \end{itemize}<ul><li>...</li></ul>
  • \begin{enumerate} \item ... \end{enumerate}<ol><li>...</li></ol>
  • \begin{quote} ... \end{quote}<blockquote>...</blockquote>
  • Bekezdéseket elválasztó üres sorok → <p>...</p>
  • \\ és \newline<br>
  • \&, \%, \$, \#, \_, \{, \} kimenekítések → megfelelő karakterek
  • Preambulum (\documentclass, \usepackage, \begin{document}, \end{document}) → csendben eltávolítva

Használati példa

LaTeX forrás:

\section*{Bevezetés}
Íme egy \textbf{példa} dokumentum listával:

\begin{itemize}
\item első pont
\item második pont
\end{itemize}

És egy \textit{idézet} a végére.

HTML eredmény:

<h1>Bevezetés</h1>
<p>Íme egy <strong>példa</strong> dokumentum listával:</p>
<ul><li>első pont</li><li>második pont</li></ul>
<p>És egy <em>idézet</em> a végére.</p>

Felhasználási esetek

  • Szakdolgozat migrálása blogra: szakdolgozatát LaTeX-ben írta, és szeretne fejezeteket közzétenni belőle a blogján vagy személyes oldalán. A konvertáló elvégzi a munka oroszlánrészét, Önnek már csak a végső formázással kell foglalkoznia.
  • Tartalom kinyerése tudományos cikkből: egy meglévő LaTeX cikk bevezetésének, absztraktjának vagy következtetésének átvétele a weben való közzétételhez (projektoldal, laboratóriumi kommunikáció).
  • Oktatási segédanyagok előkészítése: egy LaTeX-ben megírt kurzus HTML-re váltható, hogy táplálja a Moodle-t, egy wikit vagy egy e-learning platformot.
  • Technikai dokumentáció: egy LaTeX technikai feljegyzés HTML-re váltása a Confluence-en, GitHub Pages-en vagy intraneten való terjesztéshez.
  • Gyors előnézet: vizualizálja, hogyan nézne ki egy LaTeX részlet HTML-ben, anélkül, hogy teljes pdflatex fordítást indítana.

Korlátozások

Konvertálónk szándékosan pragmatikus: célja, hogy az esetek 90%-át lefedje egy egyszerű megvalósítással, ahelyett, hogy a teljes LaTeX szintaxis kimerítő lefedésére törekedne. Konkrétan:

  • Nincsenek összetett matematikai képletek. Az $x^2$ és \begin{equation}...\end{equation} kifejezések változatlanul maradnak. Webes matematikai megjelenítéshez integrálja a MathJax-et vagy a KaTeX-et az oldalába.
  • Nincsenek ábrák, táblázatok vagy bibliográfiák. A \includegraphics, \begin{table}, \bibliography parancsok nem kerülnek lefordításra.
  • Nincsenek egyéni makrók. Egy \newcommand{\sajatfunkcio} nem lesz értelmezve: a konvertáló csak a szabványos LaTeX parancsokat ismeri fel.
  • Minimális stílus. A kimenet szemantikus HTML beágyazott CSS nélkül: szabadon hozzáadhatja saját stíluslapját.

Fejlettebb konverziókhoz az olyan eszközök, mint a Pandoc, nagyobb LaTeX felületet fednek le. Eszközünk a mindennapi igényt célozza meg: tiszta HTML gyors kinyerése egy LaTeX részletből, szoftver telepítése nélkül.

Hogyan használjuk a konvertálót

  1. Illessze be a LaTeX forrást a szöveges mezőbe (egy részletet vagy egy teljes dokumentumot, a preambulumot figyelmen kívül hagyja).
  2. Kattintson a konvertálás gombra.
  3. Megkapja a megfelelő HTML-t: másolja be szerkesztőjébe, CMS-ébe vagy statikus fájljába.
  4. A fordított művelethez használja HTML-ről LaTeX-re konvertálónkat.

Gyakran ismételt kérdések

Kezeli-e a konvertáló a matematikai képleteket?

A matematikai LaTeX ($x^2 + y^2$, \begin{equation}) változatlanul megmarad a HTML kimenetben. A vizuális megjelenítéshez adja hozzá a MathJax-et vagy a KaTeX-et weboldalához: ezek a könyvtárak megjelenítik a matematikai LaTeX-et a böngészőoldalon.

Miért nem kerülnek lefordításra az egyéni parancsaim (\newcommand)?

A konvertáló nem a TeX motort futtatja, hanem szintaktikai megfeleltetést végez. A \newcommand-dal meghatározott makró nem lesz kibontva. A konvertálás előtt cserélje ki makróit azok explicit definíciójára, vagy használja a Pandoc-ot, amely teljesebb elemzővel rendelkezik.

Kötelező a LaTeX preambulum a bemenetben?

Nem. Beilleszthet egy részletet \documentclass vagy \begin{document} nélkül is. Ha forrása teljes preambulumot tartalmaz, azt akkor is figyelmen kívül hagyja: csak a hasznos tartalom kerül konvertálásra.

Megfelelően kezelik-e az ékezetes karaktereket?

Igen, feltéve, hogy a LaTeX forrása UTF-8-ban van (\usepackage[utf8]{inputenc} használatával vagy anélkül). A régi LaTeX jelölések, mint például a \'e az é betűhöz, nincsenek kifejezetten lefordítva, preferálja a közvetlen UTF-8-at.

Elküldik és tárolják az adataimat?

A LaTeX feldolgozása a szerveren történik a konverzió idejére, majd az eredmény visszakerül a böngészőjébe. Semmilyen adatot nem tárolunk, indexelünk vagy osztunk meg.

Miért kapok HTML-t PDF helyett?

A HTML a web natív formátuma: oldalak, blogok, e-mailek, CMS-ek. Ha végső igénye egy PDF, használja inkább HTML-ről LaTeX-re konvertálónkat, amely pdflatex-en keresztül készít PDF-et.

Kérés példa

curl -X POST https://cdrn.fr/api/v1/tools/latex-to-html-converter/execute \
  -H "Content-Type: application/json" \
  -d '{"latex":"..."}'

Bemeneti séma

Mező Típus Kötelező Alapértelmezett
latex text

Végpontok

  • GET https://cdrn.fr/api/v1/tools - listázza az összes elérhető eszközt
  • GET https://cdrn.fr/api/v1/tools/latex-to-html-converter - lekéri ezen eszköz sémáját
  • POST https://cdrn.fr/api/v1/tools/latex-to-html-converter/execute - végrehajtja ezen eszközt JSON payloaddal