HTML konvertálása LaTeX-be és PDF generálás

Könnyedén alakítja át a HTML szöveget LaTeX-be, miközben professzionális PDF fájlt generál. Különböző LaTeX dokumentum formátumokat támogat, mint például cikkek és levelek, és kezeli a gyakori HTML tag-eket. Ideális azok számára, akik magas minőségű megjelenítést szeretnének dokumentumaikhoz.

Miért konvertáljunk HTML-t LaTeX-re?

A HTML LaTeX-re konvertálása lehetővé teszi, hogy professzionális minőségű PDF-eket készítsen a már weben megírt tartalmakból: CMS-cikkekből, automatikusan generált dokumentációkból, blogbejegyzésekből, wiki exportokból vagy WYSIWYG szerkesztőben készült jegyzetekből. Ahelyett, hogy kézzel formázná újra, ez a HTML to LaTeX konvertáló fogja a HTML forrást, és egy PDF-be fordítható .tex fájlt készít.

Tipikus felhasználási módok: egy Notion-ben vagy Markdown-ban (HTML-ként exportálva) írt piszkozat átalakítása tudományos cikkké, egy weboldal átalakítása nyomtatható füzetté, levél vagy önéletrajz generálása HTML szerkesztőből. A html to latex konverzió elkerüli a formázás újraírását, és garantálja az egységes tipográfiai megjelenést.

Miért LaTeX a közvetlen PDF export helyett?

Egy HTML oldal PDF-be nyomtatása a böngészőből gyors, de az eredmény ritkán felel meg egy kiadvány színvonalának. A LaTeX használata több döntő előnnyel jár:

  • Professzionális tipográfia: automatikusan kezelt alávágás (kerning), elválasztás, sorkizárás, fattyú- és árvasorok kezelése, bibliográfia BibTeX/BibLaTeX segítségével, a szakaszok, ábrák és egyenletek következetes számozása.
  • Reprodukálható dokumentumok: a .tex egy verziózható szöveges fájl, amely azonos módon újrafordítható. Ideális kutatáshoz, szoftveres dokumentációhoz vagy bármilyen munkafolyamathoz, ahol a reprodukálhatóság számít.
  • Akadémiai szabvány: a LaTeX továbbra is a tudományos folyóiratok, konferenciák és egyetemi szakdolgozatok többsége által elvárt formátum.
  • Finomhangolási lehetőség: ha a generált megjelenés nem felel meg 100%-ban, nyissa meg a .tex fájlt az Overleaf-ben, a TeXstudióban vagy a VS Code-ban, és módosítsa. Ön marad a parancsnok, szemben egy rögzített PDF-fel.

Tipikus felhasználási esetek

  • Tudományos cikkek: weben megírt piszkozat, html konvertálása latexre, finomítás Overleaf-ben, benyújtás a folyóirathoz.
  • Levelek és önéletrajzok: áttérés egy HTML szerkesztőből (gazdag, vizuális) egy kifogástalan megjelenésű, nyomtatásra kész LaTeX levélre.
  • Technikai dokumentáció: egy meglévő HTML dokumentációból (Sphinx, MkDocs, wiki) egy referencia PDF generálása a forrás duplikálása nélkül.
  • Notion / Markdown jegyzetek: exportálás HTML-be, majd a html2latex-en keresztül struktúrált nyomtatható dokumentum elérése.
  • Vállalati jelentések: egy belső CMS-ben megírt jelentés átalakítása tipografált PDF-fé.

Hogyan működik a HTML to LaTeX konvertálónk?

A konvertáló elemzi a HTML forrást, azonosítja az egyes címkéket, és megfelelteti azokat az egyenértékű LaTeX parancsnak. Konkrétan:

  • A <h1>, <h2>, <h3> címekből \section{}, \subsection{}, \subsubsection{} lesz.
  • A soron belüli formázás (<strong>, <em>, <u>, <code>) a \textbf{}, \textit{}, \underline{}, \texttt{} parancsokra fordul le.
  • A listákból (<ul>, <ol>) itemize és enumerate környezetek lesznek.
  • Az <a href> linkek a hyperref csomaggal jelennek meg.
  • A speciális LaTeX karakterek (%, &, $, #, _, {, }) automatikusan ki lesznek menekítve (escape).

Ön választja ki a kimeneti LaTeX osztályt: article (alapértelmezett, cikkekhez, rövid jelentésekhez), letter (levelezéshez) vagy book (hosszú dokumentumokhoz fejezetekkel). A preambulum hasznos csomagokkal generálódik: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.

Hogyan használjuk az eszközt

Négy lépés a HTML LaTeX-re konvertálásához:

  1. Illessze be a HTML kódot az erre kijelölt mezőbe.
  2. Válassza ki a kimeneti dokumentum típusát (article, letter, book).
  3. Kattintson a konvertálás gombra. A .tex fájl és a PDF megjelenítése generálódik.
  4. Töltse le a .tex fájlt a LaTeX szerkesztőben való szerkesztéshez, vagy közvetlenül a PDF-et.

Kulcsfontosságú HTML to LaTeX megfeleltetések

HTML LaTeX Megjegyzések
<h1> \section{} 1. szint
<h2> \subsection{} 2. szint
<h3> \subsubsection{} 3. szint
<strong> \textbf{} Félkövér
<em> \textit{} Dőlt
<u> \underline{} Aláhúzott
<code> \texttt{} Monospace betűtípus
<ul> \begin{itemize} Pontozott lista
<ol> \begin{enumerate} Számozott lista
<li> \item Listaelem
<a href="..."> \href{...}{...} Szükséges a \usepackage{hyperref}
<blockquote> \begin{quote} Idézet
<p> paragrafus Üres sor a bekezdések között
<br> \\ Sortörés

Példa HTML to LaTeX konverzióra

HTML forrás:


<h1>Főcím</h1>
<p>Ez egy bekezdés <strong>félkövérrel</strong> és <em>dőlttel</em>.</p>
<h2>Alszakasz</h2>
<ul>
    <li>Egyes elem</li>
    <li>Kettes elem <a href="https://cdrn.fr">egy linkkel</a></li>
</ul>

LaTeX eredmény:


\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[hungarian]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amssymb}
\begin{document}
\section{Főcím}
Ez egy bekezdés \textbf{félkövérrel} és \textit{dőlttel}.

\subsection{Alszakasz}
\begin{itemize}
    \item Egyes elem
    \item Kettes elem \href{https://cdrn.fr}{egy linkkel}
\end{itemize}
\end{document}

GYIK

Melyik LaTeX osztályt válasszam: article, letter vagy book?

Az article az esetek többségében megfelel (jelentés, cikk, rövid emlékeztető). A letter levelezéshez való (fejléc, aláírás, udvariassági formulák). A book a hosszú dokumentumokat fejezetekre strukturálja, és részletes tartalomjegyzéket is tartalmaz. Kétség esetén válassza az article osztályt.

Garantáltan fordítható-e a generált PDF?

Szabványos HTML (bekezdések, címek, listák, soron belüli formázás, linkek) esetén igen. Ha a HTML egzotikus címkéket, soron belüli JavaScriptet vagy nem szabványos beágyazott struktúrákat tartalmaz, a fordítás előtt szükség lehet a .tex fájl kézi módosítására.

A HTML-em képeket használ: bekerülnek-e azok is?

Az <img> címkék \includegraphics{}-re konvertálódnak a graphicx csomaggal, de maguk a képek nem kerülnek beágyazásra a .tex fájlba (a LaTeX helyi fájlokra hivatkozik). Töltse le külön a képeket, és helyezze őket a .tex fájl mellé a fordítás előtt.

Miért nem közvetlenül Markdown-ról LaTeX-re?

A Pandoc nagyon jól végzi a Markdown-ról LaTeX-re konvertálást. Eszközünk kifejezetten a HTML-t célozza meg, amely olyan forrásokat is lefed, amelyeket a Markdown nem: CMS exportok, weboldalak, WYSIWYG szerkesztőkben írt tartalmak, dokumentációgenerátorok kimenetei. Ha a forrása már Markdown-ban van, exportálja HTML-be, majd jöjjön ide, vagy használja közvetlenül a Pandoc-ot.

Kezeli-e a LaTeX megjelenítés az UTF-8-at és az ékezeteket?

Igen. A preambulum tartalmazza a \usepackage[utf8]{inputenc} és a \usepackage[hungarian]{babel} sorokat, ami biztosítja az ékezetek, és a magyar tipográfiai szabályok helyes megjelenítését.

És a fordítottja, LaTeX-ről HTML-re?

A latexről html-re konvertálás egy másik feladat (a LaTeX sokkal kifejezőbb, mint a HTML, különösen az egyenletek esetében). Ebben az irányban nézze meg a pandoc, htlatex vagy LaTeXML eszközöket. Ez az eszköz csak html to latex irányban működik.

Gyakran ismételt kérdések

Melyik LaTeX osztályt válasszam: article, letter vagy book ?

Az article az esetek többségében megfelel (rövid jelentés, bejegyzés, emlékeztető, tudományos cikk). A letter levelezéshez való, beépített fejléccel, aláírással és udvariassági formulákkal. A book a hosszú dokumentumokat fejezetekre strukturálja, és részletes tartalomjegyzéket tartalmaz. Kétség esetén válassza az article-t: ez a leguniverzálisabb osztály.

Jól jelennek-e meg az ékezetek és a magyar karakterek?

Igen. A generált preambulum tartalmazza a \usepackage[utf8]{inputenc} és a \usepackage[hungarian]{babel} sorokat, ami biztosítja az ékezetek és a magyar tipográfiai szabályok helyes megjelenítését: nem törhető szóközök a kettős írásjelek előtt, magyar idézőjelek, helyes elválasztás. Magyar nyelvű szöveg esetén nincs szükség kézi beavatkozásra.

Automatikusan ki lesznek menekítve a speciális LaTeX karakterek?

Igen. Azok a karakterek, amelyeknek jelentése van a LaTeX-ben (%, &, $, #, _, {, }, ~, ^, \), a konverzió során automatikusan ki lesznek menekítve. Egy 50 % kedvezmény-t vagy felhasznalonev_-et tartalmazó HTML szöveg helyesen lesz lefordítva anélkül, hogy megszakítaná a fordítást.

A HTML-em képeket használ: bekerülnek-e azok is a .tex-be?

Az <img> címkék \includegraphics{}-re konvertálódnak a graphicx csomaggal, de maguk a képek nem kerülnek beágyazásra a .tex fájlba, mert a LaTeX helyi fájlokra hivatkozik. Töltse le külön a képeket, és helyezze őket a .tex fájl mellé a fordítás előtt, vagy módosítsa az útvonalat a \graphicspath-ben.

Hogyan kezeljük a matematikai egyenleteket tartalmazó HTML-t?

Ha az egyenletei már MathML-ben vagy soron belüli LaTeX-ben vannak (például $E = mc^2$), a konvertáló szinte változatlanul továbbítja azokat a kimenetre. A képként (PNG, SVG) megjelenített egyenletek nem konvertálódnak vissza automatikusan LaTeX-re. A tökéletes matematikai megjelenítés érdekében írja a képleteket LaTeX-ben a HTML forrásban, a preambulum már betölti az amsmath és amssymb csomagokat.

Garantáltan fordítható-e a generált .tex ?

Szabványos HTML (bekezdések, címek, listák, soron belüli formázás, linkek, egyszerű táblázatok) esetén igen. Ha a HTML egzotikus címkéket, soron belüli JavaScriptet, összetett CSS-t vagy nem szabványos beágyazott struktúrákat tartalmaz, szükség lehet a .tex módosítására a fordítás előtt. Nyissa meg az Overleaf-ben vagy a TeXstudióban az esetleges figyelmeztetések gyors azonosításához.

Kérés példa

curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
  -H "Content-Type: application/json" \
  -d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'

Bemeneti séma

Mező Típus Kötelező Alapértelmezett
content string
type choice (letter, article)
city string
object string
opening string
closing string
sender_address text
recipient_address text
recipient_name string
sender_name string
sender_phone string
sender_mail string

Végpontok

  • GET https://cdrn.fr/api/v1/tools - listázza az összes elérhető eszközt
  • GET https://cdrn.fr/api/v1/tools/html-to-latex-converter - lekéri ezen eszköz sémáját
  • POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute - végrehajtja ezen eszközt JSON payloaddal