Konwertuj HTML do LaTeX i wygeneruj PDF
- Panel
- Dokumentacja
- API
Dlaczego konwertować HTML na LaTeX?
Konwersja HTML na LaTeX pozwala produkować PDF jakości profesjonalnej z treści już zredagowanej w sieci: artykuły z CMS, automatycznie generowana dokumentacja, wpisy blogowe, eksporty wiki lub notatki sporządzone w edytorze WYSIWYG. Zamiast ręcznie formatować, ten konwerter HTML to LaTeX bierze twoje źródło HTML i produkuje plik .tex kompilowalny do PDF.
Typowe zastosowania: przekształcenie brudnopisu napisanego w Notion lub Markdown (wyeksportowanego do HTML) w artykuł naukowy, przekształcenie strony internetowej w broszurę do druku, wygenerowanie listu lub CV z edytora HTML. Konwersja html to latex pozwala uniknąć przepisywania formatowania i gwarantuje jednorodny rendering typograficzny.
Dlaczego LaTeX zamiast bezpośredniego eksportu do PDF?
Drukowanie strony HTML do PDF z przeglądarki jest szybkie, ale wynik rzadko dorównuje publikacji. Przejście przez LaTeX wnosi kilka decydujących zalet:
- Profesjonalna typografia: kerning, dzielenie wyrazów, wyrównanie, wdowy i sieroty obsługiwane automatycznie, bibliografia przez BibTeX/BibLaTeX, spójna numeracja sekcji, rysunków i równań.
- Reprodukowalne dokumenty:
.texto plik tekstowy do wersjonowania, który ponownie kompiluje się identycznie. Idealny dla badań, dokumentacji oprogramowania lub dowolnego procesu, gdzie reprodukowalność ma znaczenie. - Standard akademicki: LaTeX pozostaje formatem oczekiwanym przez większość czasopism naukowych, konferencji i prac doktorskich.
- Możliwa drobiazgowa edycja: jeśli wygenerowany rendering nie odpowiada ci w 100%, otwórz
.texw Overleaf, TeXstudio lub VS Code i dostosuj. Zachowujesz kontrolę, w przeciwieństwie do zamrożonego PDF.
Typowe przypadki użycia
- Artykuły naukowe: brudnopis napisany w sieci, konwersja html na latex, dopracowanie w Overleaf, wysłanie do czasopisma.
- Listy i CV: przejście z edytora HTML (bogatego, wizualnego) do listu LaTeX o nienagannym renderingu, gotowego do druku.
- Dokumentacja techniczna: wygenerowanie referencyjnego PDF z istniejącej dokumentacji HTML (Sphinx, MkDocs, wiki), bez duplikowania źródła.
- Notatki Notion / Markdown: eksport do HTML, następnie przejście przez html2latex, aby uzyskać ustrukturyzowany dokument do druku.
- Raporty firmowe: przekształcenie raportu napisanego w wewnętrznym CMS w typograficzny PDF.
Jak działa nasz konwerter HTML to LaTeX?
Konwerter parsuje twoje źródło HTML, identyfikuje każdy tag i mapuje go na równoważne polecenie LaTeX. Konkretnie:
- Tytuły
<h1>,<h2>,<h3>stają się\section{},\subsection{},\subsubsection{}. - Formatowanie inline (
<strong>,<em>,<u>,<code>) jest tłumaczone na\textbf{},\textit{},\underline{},\texttt{}. - Listy (
<ul>,<ol>) stają się środowiskamiitemizeienumerate. - Linki
<a href>są renderowane z pakietemhyperref. - Znaki specjalne LaTeX (
%,&,$,#,_,{,}) są automatycznie escapowane.
Wybierasz klasę LaTeX wyjścia: article (domyślna, dla artykułów, krótkich raportów), letter (do korespondencji) lub book (dla długich dokumentów z rozdziałami). Preambuła jest generowana z przydatnymi pakietami: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.
Jak korzystać z narzędzia
Cztery kroki do konwersji HTML na LaTeX:
- Wklej swój kod HTML w przewidzianym polu.
- Wybierz typ wyjściowego dokumentu (article, letter, book).
- Kliknij przycisk konwersji. Plik
.texi jego rendering PDF są generowane. - Pobierz
.tex, aby edytować go w swoim edytorze LaTeX, lub bezpośrednio PDF.
Kluczowe mapowania HTML to LaTeX
| HTML | LaTeX | Uwagi |
|---|---|---|
<h1> |
\section{} |
Poziom 1 |
<h2> |
\subsection{} |
Poziom 2 |
<h3> |
\subsubsection{} |
Poziom 3 |
<strong> |
\textbf{} |
Pogrubienie |
<em> |
\textit{} |
Kursywa |
<u> |
\underline{} |
Podkreślenie |
<code> |
\texttt{} |
Czcionka monospace |
<ul> |
\begin{itemize} |
Lista punktowana |
<ol> |
\begin{enumerate} |
Lista numerowana |
<li> |
\item |
Element listy |
<a href="..."> |
\href{...}{...} |
Wymaga \usepackage{hyperref} |
<blockquote> |
\begin{quote} |
Cytat |
<p> |
akapit | Pusta linia między akapitami |
<br> |
\\ |
Złamanie linii |
Przykład konwersji HTML to LaTeX
Źródło HTML:
<h1>Titre Principal</h1>
<p>Ceci est un paragraphe avec <strong>du gras</strong> et <em>de l'italique</em>.</p>
<h2>Sous-section</h2>
<ul>
<li>Élément un</li>
<li>Élément deux avec <a href="https://cdrn.fr">un lien</a></li>
</ul>
Wynik LaTeX:
\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[french]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amssymb}
\begin{document}
\section{Titre Principal}
Ceci est un paragraphe avec \textbf{du gras} et \textit{de l'italique}.
\subsection{Sous-section}
\begin{itemize}
\item Élément un
\item Élément deux avec \href{https://cdrn.fr}{un lien}
\end{itemize}
\end{document}
FAQ
Jaką klasę LaTeX wybrać: article, letter czy book?
article pasuje do większości przypadków (raport, artykuł, krótka notatka). letter jest dedykowana korespondencji (nagłówek, podpis, formuły grzecznościowe). book strukturyzuje długie dokumenty w rozdziały i zawiera szczegółowy spis treści. W razie wątpliwości wybierz article.
Czy wygenerowany PDF jest gwarantowanie kompilowalny?
Dla standardowego HTML (akapity, tytuły, listy, formatowanie inline, linki) tak. Jeśli twój HTML zawiera egzotyczne tagi, inline JavaScript lub niestandardowe zagnieżdżone struktury, może być konieczne ręczne dostosowanie .tex przed kompilacją.
Mój HTML używa obrazów: czy są dołączone?
Tagi <img> są konwertowane na \includegraphics{} z pakietem graphicx, ale same obrazy nie są osadzone w .tex (LaTeX odwołuje się do lokalnych plików). Pobierz obrazy oddzielnie i umieść je obok .tex przed kompilacją.
Dlaczego nie Markdown na LaTeX bezpośrednio?
Pandoc świetnie radzi sobie z Markdown na LaTeX. Nasz konwerter celuje konkretnie w HTML, który pokrywa źródła, których Markdown nie osiąga: eksporty CMS, strony internetowe, treści napisane w edytorach WYSIWYG, wyjście generatorów dokumentacji. Jeśli twoje źródło jest już w Markdown, wyeksportuj je do HTML i przejdź tutaj lub użyj Pandoc bezpośrednio.
Czy rendering LaTeX obsługuje UTF-8 i akcenty?
Tak. Preambuła zawiera \usepackage[utf8]{inputenc} i \usepackage[french]{babel}, co zapewnia poprawny rendering akcentów, cedilli i francuskich reguł typograficznych (niełamliwe spacje przed podwójnymi interpunkcjami, francuskie cudzysłowy).
A odwrotnie, LaTeX na HTML?
Konwersja latex na html to inne ćwiczenie (LaTeX jest znacznie bardziej wyrazisty niż HTML, zwłaszcza dla równań). W tym kierunku zajrzyj do pandoc, htlatex lub LaTeXML. To narzędzie robi tylko html to latex, w jedną stronę.
Najczęściej zadawane pytania
Jaką klasę LaTeX wybrać: article, letter czy book?
article pasuje do większości przypadków (krótki raport, wpis, notatka, artykuł naukowy). letter jest dedykowana korespondencji z wbudowanym nagłówkiem, podpisem i formułami grzecznościowymi. book strukturyzuje długie dokumenty w rozdziały i zawiera szczegółowy spis treści. W razie wątpliwości wybierz article: to najbardziej uniwersalna klasa.
Czy akcenty i znaki francuskie są dobrze renderowane?
Tak. Wygenerowana preambuła zawiera \usepackage[utf8]{inputenc} i \usepackage[french]{babel}, co zapewnia poprawny rendering akcentów, cedilli i francuskich reguł typograficznych: niełamliwe spacje przed podwójnymi interpunkcjami, francuskie cudzysłowy, prawidłowe dzielenie wyrazów. Żadna ręczna interwencja nie jest konieczna dla tekstu po francusku.
Czy znaki specjalne LaTeX są automatycznie escapowane?
Tak. Znaki, które mają znaczenie w LaTeX (%, &, $, #, _, {, }, ~, ^, \) są automatycznie escapowane podczas konwersji. Tekst HTML zawierający 50 % rabatu lub nazwa_uzytkownika tłumaczy się poprawnie bez psucia kompilacji.
Mój HTML używa obrazów: czy są dołączone do .tex?
Tagi <img> są konwertowane na \includegraphics{} z pakietem graphicx, ale same obrazy nie są osadzone w .tex, ponieważ LaTeX odwołuje się do lokalnych plików. Pobierz obrazy oddzielnie i umieść je obok .tex przed kompilacją lub dostosuj ścieżkę w \graphicspath.
Jak obsługiwać HTML z równaniami matematycznymi?
Jeśli twoje równania są już w MathML lub LaTeX inline (na przykład $E = mc^2$), konwerter przekazuje je niemal w niezmienionej formie do wyjścia. Równania renderowane jako obrazy (PNG, SVG) nie są automatycznie konwertowane z powrotem na LaTeX. Dla nienagannego renderingu matematycznego pisz formuły w LaTeX w źródle HTML, preambuła już ładuje amsmath i amssymb.
Czy wygenerowany .tex jest gwarantowanie kompilowalny?
Dla standardowego HTML (akapity, tytuły, listy, formatowanie inline, linki, proste tabele) tak. Jeśli twój HTML zawiera egzotyczne tagi, inline JavaScript, złożone CSS lub niestandardowe zagnieżdżone struktury, może być konieczne dostosowanie .tex przed kompilacją. Otwórz go w Overleaf lub TeXstudio, aby szybko zidentyfikować ewentualne ostrzeżenia.
Przykładowe zapytanie
curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
-H "Content-Type: application/json" \
-d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'
Schemat wejściowy
| Pole | Typ | Wymagane | Domyślnie |
|---|---|---|---|
content |
string | ✓ | – |
type |
choice (letter, article) | ✓ | – |
city |
string | ✓ | – |
object |
string | ✓ | – |
opening |
string | ✓ | – |
closing |
string | ✓ | – |
sender_address |
text | ✓ | – |
recipient_address |
text | ✓ | – |
recipient_name |
string | ✓ | – |
sender_name |
string | ✓ | – |
sender_phone |
string | ✓ | – |
sender_mail |
string | ✓ | – |
Punkty końcowe
GET https://cdrn.fr/api/v1/tools- lista wszystkich dostępnych narzędziGET https://cdrn.fr/api/v1/tools/html-to-latex-converter- zwraca schemat dla tego narzędziaPOST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute- uruchamia to narzędzie z payloadem JSON