HTML in LaTeX konvertieren und ein PDF erzeugen
- Dashboard
- Dokumentation
- API
Warum HTML in LaTeX konvertieren?
HTML in LaTeX zu konvertieren ermöglicht es, professionelle PDFs aus bereits im Web verfassten Inhalten zu erzeugen: CMS-Artikel, automatisch generierte Dokumentation, Blogbeiträge, Wiki-Exporte oder Notizen aus einem WYSIWYG-Editor. Statt das Layout manuell neu zu erstellen, nimmt dieser HTML-to-LaTeX-Konverter Ihr HTML-Quellmaterial und erzeugt eine zu PDF kompilierbare .tex-Datei.
Typische Anwendungen: einen in Notion oder Markdown verfassten Entwurf (als HTML exportiert) in einen wissenschaftlichen Artikel umwandeln, eine Webseite in eine druckbare Broschüre umwandeln, einen Brief oder Lebenslauf aus einem HTML-Editor erzeugen. Die HTML-zu-LaTeX-Konvertierung erspart das Umformatieren und garantiert ein einheitliches typografisches Ergebnis.
Warum LaTeX statt eines direkten PDF-Exports?
Eine HTML-Seite über den Browser als PDF zu drucken ist schnell, aber das Ergebnis genügt selten den Ansprüchen einer Publikation. Der Umweg über LaTeX bringt mehrere entscheidende Vorteile:
- Professionelle Typografie: Kerning, Silbentrennung, Blocksatz, automatische Behandlung von Schusterjungen und Hurenkindern, Bibliografie via BibTeX/BibLaTeX, konsistente Nummerierung von Abschnitten, Abbildungen und Gleichungen.
- Reproduzierbare Dokumente: Die
.tex-Datei ist eine versionierbare Textdatei, die identisch neu kompiliert wird. Ideal für Forschung, Software-Dokumentation oder jeden Workflow, bei dem Reproduzierbarkeit zählt. - Akademischer Standard: LaTeX ist das von den meisten wissenschaftlichen Zeitschriften, Konferenzen und Universitätsabschlussarbeiten erwartete Format.
- Feine Bearbeitung möglich: Wenn das generierte Ergebnis Ihnen nicht zu 100 % zusagt, öffnen Sie die
.texin Overleaf, TeXstudio oder VS Code und passen sie an. Sie behalten die Kontrolle, anders als bei einem eingefrorenen PDF.
Typische Anwendungsfälle
- Wissenschaftliche Artikel: einen im Web verfassten Entwurf, HTML in LaTeX konvertieren, in Overleaf feinschleifen, bei der Zeitschrift einreichen.
- Briefe und Lebensläufe: von einem HTML-Editor (reich, visuell) zu einem LaTeX-Brief mit makellosem Layout übergehen, druckfertig.
- Technische Dokumentation: ein Referenz-PDF aus einer bestehenden HTML-Doku (Sphinx, MkDocs, Wiki) erzeugen, ohne die Quelle zu duplizieren.
- Notion-/Markdown-Notizen: als HTML exportieren und dann über html2latex ein strukturiertes druckbares Dokument erhalten.
- Unternehmensberichte: einen in einem internen CMS verfassten Bericht in ein typografiertes PDF-Deliverable umwandeln.
Wie funktioniert unser HTML-zu-LaTeX-Konverter?
Der Konverter parst Ihr HTML-Quellmaterial, identifiziert jedes Tag und mappt es auf den entsprechenden LaTeX-Befehl. Konkret:
- Die Überschriften
<h1>,<h2>,<h3>werden zu\section{},\subsection{},\subsubsection{}. - Inline-Formatierungen (
<strong>,<em>,<u>,<code>) werden in\textbf{},\textit{},\underline{},\texttt{}übersetzt. - Listen (
<ul>,<ol>) werden zuitemize- undenumerate-Umgebungen. - Links
<a href>werden mit dem Pakethyperrefgerendert. - LaTeX-Sonderzeichen (
%,&,$,#,_,{,}) werden automatisch escaped.
Sie wählen die LaTeX-Ausgabeklasse: article (Standard, für Artikel, Kurzberichte), letter (für Korrespondenz) oder book (für lange Dokumente mit Kapiteln). Die Präambel wird mit den nützlichen Paketen generiert: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.
So verwenden Sie das Tool
Vier Schritte, um HTML in LaTeX zu konvertieren:
- Fügen Sie Ihren HTML-Code in das vorgesehene Feld ein.
- Wählen Sie den Ausgabedokumenttyp (article, letter, book).
- Klicken Sie auf die Konvertierungsschaltfläche. Die
.tex-Datei und ihre PDF-Ausgabe werden erzeugt. - Laden Sie die
.texherunter, um sie in Ihrem LaTeX-Editor zu bearbeiten, oder das PDF direkt.
Wichtige HTML-zu-LaTeX-Mappings
| HTML | LaTeX | Hinweise |
|---|---|---|
<h1> |
\section{} |
Ebene 1 |
<h2> |
\subsection{} |
Ebene 2 |
<h3> |
\subsubsection{} |
Ebene 3 |
<strong> |
\textbf{} |
Fett |
<em> |
\textit{} |
Kursiv |
<u> |
\underline{} |
Unterstrichen |
<code> |
\texttt{} |
Monospace-Schrift |
<ul> |
\begin{itemize} |
Aufzählungsliste |
<ol> |
\begin{enumerate} |
Nummerierte Liste |
<li> |
\item |
Listenelement |
<a href="..."> |
\href{...}{...} |
Benötigt \usepackage{hyperref} |
<blockquote> |
\begin{quote} |
Zitat |
<p> |
Absatz | Leerzeile zwischen Absätzen |
<br> |
\\ |
Zeilenumbruch |
Beispiel einer HTML-zu-LaTeX-Konvertierung
HTML-Quelle:
<h1>Titre Principal</h1>
<p>Ceci est un paragraphe avec <strong>du gras</strong> et <em>de l'italique</em>.</p>
<h2>Sous-section</h2>
<ul>
<li>Élément un</li>
<li>Élément deux avec <a href="https://cdrn.fr">un lien</a></li>
</ul>
LaTeX-Ergebnis:
\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[french]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amssymb}
\begin{document}
\section{Titre Principal}
Ceci est un paragraphe avec \textbf{du gras} et \textit{de l'italique}.
\subsection{Sous-section}
\begin{itemize}
\item Élément un
\item Élément deux avec \href{https://cdrn.fr}{un lien}
\end{itemize}
\end{document}
FAQ
Welche LaTeX-Klasse wählen: article, letter oder book?
article eignet sich für die Mehrzahl der Fälle (Bericht, Artikel, kurzes Memo). letter ist der Korrespondenz gewidmet (Briefkopf, Unterschrift, Höflichkeitsformeln). book strukturiert lange Dokumente in Kapitel und enthält ein detailliertes Inhaltsverzeichnis. Im Zweifelsfall wählen Sie article.
Ist das erzeugte PDF garantiert kompilierbar?
Für ein Standard-HTML (Absätze, Überschriften, Listen, Inline-Formatierungen, Links) ja. Wenn Ihr HTML exotische Tags, Inline-JavaScript oder nicht standardmäßige verschachtelte Strukturen enthält, kann es notwendig sein, die .tex vor der Kompilierung manuell anzupassen.
Mein HTML verwendet Bilder: werden sie eingebunden?
Die <img>-Tags werden mit dem Paket graphicx in \includegraphics{} umgewandelt, aber die Bilder selbst werden nicht in die .tex eingebettet (LaTeX referenziert lokale Dateien). Laden Sie die Bilder separat herunter und legen Sie sie vor der Kompilierung neben die .tex.
Warum nicht direkt Markdown zu LaTeX?
Pandoc macht Markdown zu LaTeX sehr gut. Unser Konverter zielt speziell auf HTML, das Quellen abdeckt, die Markdown nicht erreicht: CMS-Exporte, Webseiten, in WYSIWYG-Editoren verfasste Inhalte, Ausgabe von Doku-Generatoren. Wenn Ihre Quelle bereits in Markdown vorliegt, exportieren Sie sie in HTML und nutzen Sie dann dieses Tool, oder verwenden Sie Pandoc direkt.
Verarbeitet das LaTeX-Rendering UTF-8 und Akzente?
Ja. Die Präambel enthält \usepackage[utf8]{inputenc} und \usepackage[french]{babel}, was die korrekte Darstellung der Akzente, der Cedille und der französischen typografischen Regeln (geschützte Leerzeichen vor doppelten Satzzeichen, französische Anführungszeichen) sicherstellt.
Und umgekehrt, LaTeX zu HTML?
Die LaTeX-zu-HTML-Konvertierung ist eine andere Übung (LaTeX ist deutlich ausdrucksstärker als HTML, insbesondere für Gleichungen). Für diese Richtung schauen Sie sich pandoc, htlatex oder LaTeXML an. Das vorliegende Tool macht nur HTML zu LaTeX, in eine Richtung.
Häufig gestellte Fragen
Welche LaTeX-Klasse wählen: article, letter oder book?
article eignet sich für die Mehrheit der Fälle (Kurzbericht, Beitrag, Memo, wissenschaftlicher Artikel). letter ist der Korrespondenz gewidmet, mit integriertem Briefkopf, Unterschrift und Höflichkeitsformeln. book strukturiert lange Dokumente in Kapitel und enthält ein detailliertes Inhaltsverzeichnis. Im Zweifelsfall wählen Sie article: Es ist die universellste Klasse.
Werden Akzente und französische Zeichen korrekt gerendert?
Ja. Die generierte Präambel enthält \usepackage[utf8]{inputenc} und \usepackage[french]{babel}, was das korrekte Rendering der Akzente, der Cedille und der französischen typografischen Regeln sicherstellt: geschützte Leerzeichen vor doppelten Satzzeichen, französische Anführungszeichen, korrekte Silbentrennung. Für einen französischen Text ist kein manuelles Eingreifen erforderlich.
Werden LaTeX-Sonderzeichen automatisch escaped?
Ja. Zeichen, die in LaTeX eine Bedeutung haben (%, &, $, #, _, {, }, ~, ^, \), werden bei der Konvertierung automatisch escaped. Ein HTML-Text, der 50 % Rabatt oder nom_utilisateur enthält, wird korrekt übersetzt, ohne die Kompilierung zu zerstören.
Mein HTML verwendet Bilder: werden sie in die .tex eingebunden?
Die <img>-Tags werden mit dem Paket graphicx in \includegraphics{} umgewandelt, aber die Bilder selbst werden nicht in die .tex eingebettet, da LaTeX lokale Dateien referenziert. Laden Sie die Bilder separat herunter und legen Sie sie vor der Kompilierung neben die .tex oder passen Sie den Pfad in \graphicspath an.
Wie behandelt man HTML mit mathematischen Gleichungen?
Wenn Ihre Gleichungen bereits in MathML oder Inline-LaTeX (zum Beispiel $E = mc^2$) vorliegen, übergibt der Konverter sie quasi unverändert an die Ausgabe. Als Bilder (PNG, SVG) gerenderte Gleichungen werden nicht automatisch in LaTeX zurückkonvertiert. Für ein makelloses mathematisches Rendering schreiben Sie die Formeln in LaTeX in die HTML-Quelle, da die Präambel bereits amsmath und amssymb lädt.
Ist die erzeugte .tex garantiert kompilierbar?
Für ein Standard-HTML (Absätze, Überschriften, Listen, Inline-Formatierungen, Links, einfache Tabellen) ja. Wenn Ihr HTML exotische Tags, Inline-JavaScript, komplexes CSS oder nicht standardmäßige verschachtelte Strukturen enthält, kann es notwendig sein, die .tex vor der Kompilierung anzupassen. Öffnen Sie sie in Overleaf oder TeXstudio, um eventuelle Warnungen schnell zu erkennen.
Beispielanfrage
curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
-H "Content-Type: application/json" \
-d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'
Eingabeschema
| Feld | Typ | Erforderlich | Standard |
|---|---|---|---|
content |
string | ✓ | – |
type |
choice (letter, article) | ✓ | – |
city |
string | ✓ | – |
object |
string | ✓ | – |
opening |
string | ✓ | – |
closing |
string | ✓ | – |
sender_address |
text | ✓ | – |
recipient_address |
text | ✓ | – |
recipient_name |
string | ✓ | – |
sender_name |
string | ✓ | – |
sender_phone |
string | ✓ | – |
sender_mail |
string | ✓ | – |
Endpunkte
GET https://cdrn.fr/api/v1/tools- listet alle verfügbaren Tools aufGET https://cdrn.fr/api/v1/tools/html-to-latex-converter- liefert das Schema dieses ToolsPOST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute- führt dieses Tool mit einem JSON-Payload aus