HTML konvertálása LaTeX-be és PDF generálás
- Irányítópult
- Dokumentáció
- API
Miért konvertáljunk HTML-t LaTeX-re?
A HTML LaTeX-re konvertálása lehetővé teszi, hogy professzionális minőségű PDF-eket készítsen a már weben megírt tartalmakból: CMS-cikkekből, automatikusan generált dokumentációkból, blogbejegyzésekből, wiki exportokból vagy WYSIWYG szerkesztőben készült jegyzetekből. Ahelyett, hogy kézzel formázná újra, ez a HTML to LaTeX konvertáló fogja a HTML forrást, és egy PDF-be fordítható .tex fájlt készít.
Tipikus felhasználási módok: egy Notion-ben vagy Markdown-ban (HTML-ként exportálva) írt piszkozat átalakítása tudományos cikkké, egy weboldal átalakítása nyomtatható füzetté, levél vagy önéletrajz generálása HTML szerkesztőből. A html to latex konverzió elkerüli a formázás újraírását, és garantálja az egységes tipográfiai megjelenést.
Miért LaTeX a közvetlen PDF export helyett?
Egy HTML oldal PDF-be nyomtatása a böngészőből gyors, de az eredmény ritkán felel meg egy kiadvány színvonalának. A LaTeX használata több döntő előnnyel jár:
- Professzionális tipográfia: automatikusan kezelt alávágás (kerning), elválasztás, sorkizárás, fattyú- és árvasorok kezelése, bibliográfia BibTeX/BibLaTeX segítségével, a szakaszok, ábrák és egyenletek következetes számozása.
- Reprodukálható dokumentumok: a
.texegy verziózható szöveges fájl, amely azonos módon újrafordítható. Ideális kutatáshoz, szoftveres dokumentációhoz vagy bármilyen munkafolyamathoz, ahol a reprodukálhatóság számít. - Akadémiai szabvány: a LaTeX továbbra is a tudományos folyóiratok, konferenciák és egyetemi szakdolgozatok többsége által elvárt formátum.
- Finomhangolási lehetőség: ha a generált megjelenés nem felel meg 100%-ban, nyissa meg a
.texfájlt az Overleaf-ben, a TeXstudióban vagy a VS Code-ban, és módosítsa. Ön marad a parancsnok, szemben egy rögzített PDF-fel.
Tipikus felhasználási esetek
- Tudományos cikkek: weben megírt piszkozat, html konvertálása latexre, finomítás Overleaf-ben, benyújtás a folyóirathoz.
- Levelek és önéletrajzok: áttérés egy HTML szerkesztőből (gazdag, vizuális) egy kifogástalan megjelenésű, nyomtatásra kész LaTeX levélre.
- Technikai dokumentáció: egy meglévő HTML dokumentációból (Sphinx, MkDocs, wiki) egy referencia PDF generálása a forrás duplikálása nélkül.
- Notion / Markdown jegyzetek: exportálás HTML-be, majd a html2latex-en keresztül struktúrált nyomtatható dokumentum elérése.
- Vállalati jelentések: egy belső CMS-ben megírt jelentés átalakítása tipografált PDF-fé.
Hogyan működik a HTML to LaTeX konvertálónk?
A konvertáló elemzi a HTML forrást, azonosítja az egyes címkéket, és megfelelteti azokat az egyenértékű LaTeX parancsnak. Konkrétan:
- A
<h1>,<h2>,<h3>címekből\section{},\subsection{},\subsubsection{}lesz. - A soron belüli formázás (
<strong>,<em>,<u>,<code>) a\textbf{},\textit{},\underline{},\texttt{}parancsokra fordul le. - A listákból (
<ul>,<ol>)itemizeésenumeratekörnyezetek lesznek. - Az
<a href>linkek ahyperrefcsomaggal jelennek meg. - A speciális LaTeX karakterek (
%,&,$,#,_,{,}) automatikusan ki lesznek menekítve (escape).
Ön választja ki a kimeneti LaTeX osztályt: article (alapértelmezett, cikkekhez, rövid jelentésekhez), letter (levelezéshez) vagy book (hosszú dokumentumokhoz fejezetekkel). A preambulum hasznos csomagokkal generálódik: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.
Hogyan használjuk az eszközt
Négy lépés a HTML LaTeX-re konvertálásához:
- Illessze be a HTML kódot az erre kijelölt mezőbe.
- Válassza ki a kimeneti dokumentum típusát (article, letter, book).
- Kattintson a konvertálás gombra. A
.texfájl és a PDF megjelenítése generálódik. - Töltse le a
.texfájlt a LaTeX szerkesztőben való szerkesztéshez, vagy közvetlenül a PDF-et.
Kulcsfontosságú HTML to LaTeX megfeleltetések
| HTML | LaTeX | Megjegyzések |
|---|---|---|
<h1> |
\section{} |
1. szint |
<h2> |
\subsection{} |
2. szint |
<h3> |
\subsubsection{} |
3. szint |
<strong> |
\textbf{} |
Félkövér |
<em> |
\textit{} |
Dőlt |
<u> |
\underline{} |
Aláhúzott |
<code> |
\texttt{} |
Monospace betűtípus |
<ul> |
\begin{itemize} |
Pontozott lista |
<ol> |
\begin{enumerate} |
Számozott lista |
<li> |
\item |
Listaelem |
<a href="..."> |
\href{...}{...} |
Szükséges a \usepackage{hyperref} |
<blockquote> |
\begin{quote} |
Idézet |
<p> |
paragrafus | Üres sor a bekezdések között |
<br> |
\\ |
Sortörés |
Példa HTML to LaTeX konverzióra
HTML forrás:
<h1>Főcím</h1>
<p>Ez egy bekezdés <strong>félkövérrel</strong> és <em>dőlttel</em>.</p>
<h2>Alszakasz</h2>
<ul>
<li>Egyes elem</li>
<li>Kettes elem <a href="https://cdrn.fr">egy linkkel</a></li>
</ul>
LaTeX eredmény:
\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[hungarian]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amssymb}
\begin{document}
\section{Főcím}
Ez egy bekezdés \textbf{félkövérrel} és \textit{dőlttel}.
\subsection{Alszakasz}
\begin{itemize}
\item Egyes elem
\item Kettes elem \href{https://cdrn.fr}{egy linkkel}
\end{itemize}
\end{document}
GYIK
Melyik LaTeX osztályt válasszam: article, letter vagy book?
Az article az esetek többségében megfelel (jelentés, cikk, rövid emlékeztető). A letter levelezéshez való (fejléc, aláírás, udvariassági formulák). A book a hosszú dokumentumokat fejezetekre strukturálja, és részletes tartalomjegyzéket is tartalmaz. Kétség esetén válassza az article osztályt.
Garantáltan fordítható-e a generált PDF?
Szabványos HTML (bekezdések, címek, listák, soron belüli formázás, linkek) esetén igen. Ha a HTML egzotikus címkéket, soron belüli JavaScriptet vagy nem szabványos beágyazott struktúrákat tartalmaz, a fordítás előtt szükség lehet a .tex fájl kézi módosítására.
A HTML-em képeket használ: bekerülnek-e azok is?
Az <img> címkék \includegraphics{}-re konvertálódnak a graphicx csomaggal, de maguk a képek nem kerülnek beágyazásra a .tex fájlba (a LaTeX helyi fájlokra hivatkozik). Töltse le külön a képeket, és helyezze őket a .tex fájl mellé a fordítás előtt.
Miért nem közvetlenül Markdown-ról LaTeX-re?
A Pandoc nagyon jól végzi a Markdown-ról LaTeX-re konvertálást. Eszközünk kifejezetten a HTML-t célozza meg, amely olyan forrásokat is lefed, amelyeket a Markdown nem: CMS exportok, weboldalak, WYSIWYG szerkesztőkben írt tartalmak, dokumentációgenerátorok kimenetei. Ha a forrása már Markdown-ban van, exportálja HTML-be, majd jöjjön ide, vagy használja közvetlenül a Pandoc-ot.
Kezeli-e a LaTeX megjelenítés az UTF-8-at és az ékezeteket?
Igen. A preambulum tartalmazza a \usepackage[utf8]{inputenc} és a \usepackage[hungarian]{babel} sorokat, ami biztosítja az ékezetek, és a magyar tipográfiai szabályok helyes megjelenítését.
És a fordítottja, LaTeX-ről HTML-re?
A latexről html-re konvertálás egy másik feladat (a LaTeX sokkal kifejezőbb, mint a HTML, különösen az egyenletek esetében). Ebben az irányban nézze meg a pandoc, htlatex vagy LaTeXML eszközöket. Ez az eszköz csak html to latex irányban működik.
Gyakran ismételt kérdések
Melyik LaTeX osztályt válasszam: article, letter vagy book ?
Az article az esetek többségében megfelel (rövid jelentés, bejegyzés, emlékeztető, tudományos cikk). A letter levelezéshez való, beépített fejléccel, aláírással és udvariassági formulákkal. A book a hosszú dokumentumokat fejezetekre strukturálja, és részletes tartalomjegyzéket tartalmaz. Kétség esetén válassza az article-t: ez a leguniverzálisabb osztály.
Jól jelennek-e meg az ékezetek és a magyar karakterek?
Igen. A generált preambulum tartalmazza a \usepackage[utf8]{inputenc} és a \usepackage[hungarian]{babel} sorokat, ami biztosítja az ékezetek és a magyar tipográfiai szabályok helyes megjelenítését: nem törhető szóközök a kettős írásjelek előtt, magyar idézőjelek, helyes elválasztás. Magyar nyelvű szöveg esetén nincs szükség kézi beavatkozásra.
Automatikusan ki lesznek menekítve a speciális LaTeX karakterek?
Igen. Azok a karakterek, amelyeknek jelentése van a LaTeX-ben (%, &, $, #, _, {, }, ~, ^, \), a konverzió során automatikusan ki lesznek menekítve. Egy 50 % kedvezmény-t vagy felhasznalonev_-et tartalmazó HTML szöveg helyesen lesz lefordítva anélkül, hogy megszakítaná a fordítást.
A HTML-em képeket használ: bekerülnek-e azok is a .tex-be?
Az <img> címkék \includegraphics{}-re konvertálódnak a graphicx csomaggal, de maguk a képek nem kerülnek beágyazásra a .tex fájlba, mert a LaTeX helyi fájlokra hivatkozik. Töltse le külön a képeket, és helyezze őket a .tex fájl mellé a fordítás előtt, vagy módosítsa az útvonalat a \graphicspath-ben.
Hogyan kezeljük a matematikai egyenleteket tartalmazó HTML-t?
Ha az egyenletei már MathML-ben vagy soron belüli LaTeX-ben vannak (például $E = mc^2$), a konvertáló szinte változatlanul továbbítja azokat a kimenetre. A képként (PNG, SVG) megjelenített egyenletek nem konvertálódnak vissza automatikusan LaTeX-re. A tökéletes matematikai megjelenítés érdekében írja a képleteket LaTeX-ben a HTML forrásban, a preambulum már betölti az amsmath és amssymb csomagokat.
Garantáltan fordítható-e a generált .tex ?
Szabványos HTML (bekezdések, címek, listák, soron belüli formázás, linkek, egyszerű táblázatok) esetén igen. Ha a HTML egzotikus címkéket, soron belüli JavaScriptet, összetett CSS-t vagy nem szabványos beágyazott struktúrákat tartalmaz, szükség lehet a .tex módosítására a fordítás előtt. Nyissa meg az Overleaf-ben vagy a TeXstudióban az esetleges figyelmeztetések gyors azonosításához.
Kérés példa
curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
-H "Content-Type: application/json" \
-d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'
Bemeneti séma
| Mező | Típus | Kötelező | Alapértelmezett |
|---|---|---|---|
content |
string | ✓ | – |
type |
choice (letter, article) | ✓ | – |
city |
string | ✓ | – |
object |
string | ✓ | – |
opening |
string | ✓ | – |
closing |
string | ✓ | – |
sender_address |
text | ✓ | – |
recipient_address |
text | ✓ | – |
recipient_name |
string | ✓ | – |
sender_name |
string | ✓ | – |
sender_phone |
string | ✓ | – |
sender_mail |
string | ✓ | – |
Végpontok
GET https://cdrn.fr/api/v1/tools- listázza az összes elérhető eszköztGET https://cdrn.fr/api/v1/tools/html-to-latex-converter- lekéri ezen eszköz sémájátPOST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute- végrehajtja ezen eszközt JSON payloaddal