Konwertuj HTML do LaTeX i wygeneruj PDF

łatwo konwertuje HTML do LaTeX i jednocześnie generuje dopracowany plik PDF. Obsługuje kilka klas dokumentów LaTeX (article, letter) oraz najczęstsze tagi HTML. Idealne, gdy potrzebujesz wysokiej jakości wyniku dla swoich dokumentów.

Dlaczego konwertować HTML na LaTeX?

Konwersja HTML na LaTeX pozwala produkować PDF jakości profesjonalnej z treści już zredagowanej w sieci: artykuły z CMS, automatycznie generowana dokumentacja, wpisy blogowe, eksporty wiki lub notatki sporządzone w edytorze WYSIWYG. Zamiast ręcznie formatować, ten konwerter HTML to LaTeX bierze twoje źródło HTML i produkuje plik .tex kompilowalny do PDF.

Typowe zastosowania: przekształcenie brudnopisu napisanego w Notion lub Markdown (wyeksportowanego do HTML) w artykuł naukowy, przekształcenie strony internetowej w broszurę do druku, wygenerowanie listu lub CV z edytora HTML. Konwersja html to latex pozwala uniknąć przepisywania formatowania i gwarantuje jednorodny rendering typograficzny.

Dlaczego LaTeX zamiast bezpośredniego eksportu do PDF?

Drukowanie strony HTML do PDF z przeglądarki jest szybkie, ale wynik rzadko dorównuje publikacji. Przejście przez LaTeX wnosi kilka decydujących zalet:

  • Profesjonalna typografia: kerning, dzielenie wyrazów, wyrównanie, wdowy i sieroty obsługiwane automatycznie, bibliografia przez BibTeX/BibLaTeX, spójna numeracja sekcji, rysunków i równań.
  • Reprodukowalne dokumenty: .tex to plik tekstowy do wersjonowania, który ponownie kompiluje się identycznie. Idealny dla badań, dokumentacji oprogramowania lub dowolnego procesu, gdzie reprodukowalność ma znaczenie.
  • Standard akademicki: LaTeX pozostaje formatem oczekiwanym przez większość czasopism naukowych, konferencji i prac doktorskich.
  • Możliwa drobiazgowa edycja: jeśli wygenerowany rendering nie odpowiada ci w 100%, otwórz .tex w Overleaf, TeXstudio lub VS Code i dostosuj. Zachowujesz kontrolę, w przeciwieństwie do zamrożonego PDF.

Typowe przypadki użycia

  • Artykuły naukowe: brudnopis napisany w sieci, konwersja html na latex, dopracowanie w Overleaf, wysłanie do czasopisma.
  • Listy i CV: przejście z edytora HTML (bogatego, wizualnego) do listu LaTeX o nienagannym renderingu, gotowego do druku.
  • Dokumentacja techniczna: wygenerowanie referencyjnego PDF z istniejącej dokumentacji HTML (Sphinx, MkDocs, wiki), bez duplikowania źródła.
  • Notatki Notion / Markdown: eksport do HTML, następnie przejście przez html2latex, aby uzyskać ustrukturyzowany dokument do druku.
  • Raporty firmowe: przekształcenie raportu napisanego w wewnętrznym CMS w typograficzny PDF.

Jak działa nasz konwerter HTML to LaTeX?

Konwerter parsuje twoje źródło HTML, identyfikuje każdy tag i mapuje go na równoważne polecenie LaTeX. Konkretnie:

  • Tytuły <h1>, <h2>, <h3> stają się \section{}, \subsection{}, \subsubsection{}.
  • Formatowanie inline (<strong>, <em>, <u>, <code>) jest tłumaczone na \textbf{}, \textit{}, \underline{}, \texttt{}.
  • Listy (<ul>, <ol>) stają się środowiskami itemize i enumerate.
  • Linki <a href> są renderowane z pakietem hyperref.
  • Znaki specjalne LaTeX (%, &, $, #, _, {, }) są automatycznie escapowane.

Wybierasz klasę LaTeX wyjścia: article (domyślna, dla artykułów, krótkich raportów), letter (do korespondencji) lub book (dla długich dokumentów z rozdziałami). Preambuła jest generowana z przydatnymi pakietami: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.

Jak korzystać z narzędzia

Cztery kroki do konwersji HTML na LaTeX:

  1. Wklej swój kod HTML w przewidzianym polu.
  2. Wybierz typ wyjściowego dokumentu (article, letter, book).
  3. Kliknij przycisk konwersji. Plik .tex i jego rendering PDF są generowane.
  4. Pobierz .tex, aby edytować go w swoim edytorze LaTeX, lub bezpośrednio PDF.

Kluczowe mapowania HTML to LaTeX

HTML LaTeX Uwagi
<h1> \section{} Poziom 1
<h2> \subsection{} Poziom 2
<h3> \subsubsection{} Poziom 3
<strong> \textbf{} Pogrubienie
<em> \textit{} Kursywa
<u> \underline{} Podkreślenie
<code> \texttt{} Czcionka monospace
<ul> \begin{itemize} Lista punktowana
<ol> \begin{enumerate} Lista numerowana
<li> \item Element listy
<a href="..."> \href{...}{...} Wymaga \usepackage{hyperref}
<blockquote> \begin{quote} Cytat
<p> akapit Pusta linia między akapitami
<br> \\ Złamanie linii

Przykład konwersji HTML to LaTeX

Źródło HTML:


<h1>Titre Principal</h1>
<p>Ceci est un paragraphe avec <strong>du gras</strong> et <em>de l'italique</em>.</p>
<h2>Sous-section</h2>
<ul>
    <li>Élément un</li>
    <li>Élément deux avec <a href="https://cdrn.fr">un lien</a></li>
</ul>

Wynik LaTeX:


\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[french]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amssymb}
\begin{document}
\section{Titre Principal}
Ceci est un paragraphe avec \textbf{du gras} et \textit{de l'italique}.

\subsection{Sous-section}
\begin{itemize}
    \item Élément un
    \item Élément deux avec \href{https://cdrn.fr}{un lien}
\end{itemize}
\end{document}

FAQ

Jaką klasę LaTeX wybrać: article, letter czy book?

article pasuje do większości przypadków (raport, artykuł, krótka notatka). letter jest dedykowana korespondencji (nagłówek, podpis, formuły grzecznościowe). book strukturyzuje długie dokumenty w rozdziały i zawiera szczegółowy spis treści. W razie wątpliwości wybierz article.

Czy wygenerowany PDF jest gwarantowanie kompilowalny?

Dla standardowego HTML (akapity, tytuły, listy, formatowanie inline, linki) tak. Jeśli twój HTML zawiera egzotyczne tagi, inline JavaScript lub niestandardowe zagnieżdżone struktury, może być konieczne ręczne dostosowanie .tex przed kompilacją.

Mój HTML używa obrazów: czy są dołączone?

Tagi <img> są konwertowane na \includegraphics{} z pakietem graphicx, ale same obrazy nie są osadzone w .tex (LaTeX odwołuje się do lokalnych plików). Pobierz obrazy oddzielnie i umieść je obok .tex przed kompilacją.

Dlaczego nie Markdown na LaTeX bezpośrednio?

Pandoc świetnie radzi sobie z Markdown na LaTeX. Nasz konwerter celuje konkretnie w HTML, który pokrywa źródła, których Markdown nie osiąga: eksporty CMS, strony internetowe, treści napisane w edytorach WYSIWYG, wyjście generatorów dokumentacji. Jeśli twoje źródło jest już w Markdown, wyeksportuj je do HTML i przejdź tutaj lub użyj Pandoc bezpośrednio.

Czy rendering LaTeX obsługuje UTF-8 i akcenty?

Tak. Preambuła zawiera \usepackage[utf8]{inputenc} i \usepackage[french]{babel}, co zapewnia poprawny rendering akcentów, cedilli i francuskich reguł typograficznych (niełamliwe spacje przed podwójnymi interpunkcjami, francuskie cudzysłowy).

A odwrotnie, LaTeX na HTML?

Konwersja latex na html to inne ćwiczenie (LaTeX jest znacznie bardziej wyrazisty niż HTML, zwłaszcza dla równań). W tym kierunku zajrzyj do pandoc, htlatex lub LaTeXML. To narzędzie robi tylko html to latex, w jedną stronę.

Najczęściej zadawane pytania

Jaką klasę LaTeX wybrać: article, letter czy book?

article pasuje do większości przypadków (krótki raport, wpis, notatka, artykuł naukowy). letter jest dedykowana korespondencji z wbudowanym nagłówkiem, podpisem i formułami grzecznościowymi. book strukturyzuje długie dokumenty w rozdziały i zawiera szczegółowy spis treści. W razie wątpliwości wybierz article: to najbardziej uniwersalna klasa.

Czy akcenty i znaki francuskie są dobrze renderowane?

Tak. Wygenerowana preambuła zawiera \usepackage[utf8]{inputenc} i \usepackage[french]{babel}, co zapewnia poprawny rendering akcentów, cedilli i francuskich reguł typograficznych: niełamliwe spacje przed podwójnymi interpunkcjami, francuskie cudzysłowy, prawidłowe dzielenie wyrazów. Żadna ręczna interwencja nie jest konieczna dla tekstu po francusku.

Czy znaki specjalne LaTeX są automatycznie escapowane?

Tak. Znaki, które mają znaczenie w LaTeX (%, &, $, #, _, {, }, ~, ^, \) są automatycznie escapowane podczas konwersji. Tekst HTML zawierający 50 % rabatu lub nazwa_uzytkownika tłumaczy się poprawnie bez psucia kompilacji.

Mój HTML używa obrazów: czy są dołączone do .tex?

Tagi <img> są konwertowane na \includegraphics{} z pakietem graphicx, ale same obrazy nie są osadzone w .tex, ponieważ LaTeX odwołuje się do lokalnych plików. Pobierz obrazy oddzielnie i umieść je obok .tex przed kompilacją lub dostosuj ścieżkę w \graphicspath.

Jak obsługiwać HTML z równaniami matematycznymi?

Jeśli twoje równania są już w MathML lub LaTeX inline (na przykład $E = mc^2$), konwerter przekazuje je niemal w niezmienionej formie do wyjścia. Równania renderowane jako obrazy (PNG, SVG) nie są automatycznie konwertowane z powrotem na LaTeX. Dla nienagannego renderingu matematycznego pisz formuły w LaTeX w źródle HTML, preambuła już ładuje amsmath i amssymb.

Czy wygenerowany .tex jest gwarantowanie kompilowalny?

Dla standardowego HTML (akapity, tytuły, listy, formatowanie inline, linki, proste tabele) tak. Jeśli twój HTML zawiera egzotyczne tagi, inline JavaScript, złożone CSS lub niestandardowe zagnieżdżone struktury, może być konieczne dostosowanie .tex przed kompilacją. Otwórz go w Overleaf lub TeXstudio, aby szybko zidentyfikować ewentualne ostrzeżenia.

Przykładowe zapytanie

curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
  -H "Content-Type: application/json" \
  -d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'

Schemat wejściowy

Pole Typ Wymagane Domyślnie
content string
type choice (letter, article)
city string
object string
opening string
closing string
sender_address text
recipient_address text
recipient_name string
sender_name string
sender_phone string
sender_mail string

Punkty końcowe

  • GET https://cdrn.fr/api/v1/tools - lista wszystkich dostępnych narzędzi
  • GET https://cdrn.fr/api/v1/tools/html-to-latex-converter - zwraca schemat dla tego narzędzia
  • POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute - uruchamia to narzędzie z payloadem JSON