Muunna HTML LaTeX:iin ja generoi PDF

Muuntaa helposti HTML-tekstin LaTeX:iin, generoiden samalla ammattimaisen PDF-tiedoston. Tukee erilaisia LaTeX-dokumenttiformaatteja, kuten artikkeleita ja kirjeitä, ja käsittelee yleisiä HTML-tageja. Ihanteellinen käyttäjille, jotka haluavat korkealaatuisen renderöinnin dokumenteilleen.

Miksi muuntaa HTML LaTeXiksi?

HTML:n muuntaminen LaTeXiksi mahdollistaa ammattilaatuisen PDF-tiedoston luomisen jo valmiiksi verkkoon kirjoitetusta sisällöstä: CMS-artikkeleista, automaattisesti luodusta dokumentaatiosta, blogikirjoituksista, wiki-vienneistä tai WYSIWYG-editorilla tehdyistä muistiinpanoista. Sen sijaan, että asettelisit sivun uudelleen käsin, tämä HTML to LaTeX -muunnin ottaa HTML-lähteesi ja luo .tex-tiedoston, joka on käännettävissä PDF-muotoon.

Tyypillisiä käyttötapoja: Notionissa tai Markdownilla laaditun luonnoksen (viety HTML:nä) muuntaminen tieteelliseksi artikkeliksi, verkkosivun muuntaminen painetuksi kirjasiksi, kirjeen tai ansioluettelon luominen HTML-editorista. html to latex -muunnos välttää muotoilun uudelleenkirjoittamisen ja takaa yhtenäisen typografisen tuloksen.

Miksi LaTeX mieluummin kuin suora PDF-vienti?

HTML-sivun tulostaminen PDF:ksi selaimesta on nopeaa, mutta tulos vastaa harvoin julkaisun laatuvaatimuksia. LaTeXin käyttö tuo useita ratkaisevia etuja:

  • Ammattimainen typografia : merkkiväli (kerning), tavutus, tasaus, leski- ja orporivit automaattisesti hallittuina, bibliografia BibTeX/BibLaTeX:n kautta, johdonmukainen osioiden, kuvien ja yhtälöiden numerointi.
  • Toistettavat dokumentit : .tex on versioitava tekstitiedosto, joka kääntyy aina identtiseksi. Ihanteellinen tutkimukseen, ohjelmistodokumentaatioon tai mihin tahansa työnkulkuun, jossa toistettavuus on tärkeää.
  • Akateeminen standardi : LaTeX on edelleen muoto, jota useimmat tieteelliset julkaisut, konferenssit ja yliopistolliset väitöskirjat edellyttävät.
  • Hienosäätö mahdollista : jos luotu tulos ei miellytä 100-prosenttisesti, avaa .tex-tiedosto Overleafissa, TeXstudiossa tai VS Codessa ja säädä. Säilytät hallinnan, toisin kuin lukitussa PDF:ssä.

Tyypillisiä käyttötapauksia

  • Tieteelliset artikkelit : un brouillon rédigé sur le web, convertir html en latex, peaufiner dans Overleaf, soumettre à la revue.
  • Kirjeet ja ansioluettelot : passer d'un éditeur HTML (riche, visuel) à une lettre LaTeX au rendu impeccable, prête à imprimer.
  • Tekninen dokumentaatio : générer un PDF de référence à partir d'une doc HTML existante (Sphinx, MkDocs, wiki), sans dupliquer la source.
  • Notion / Markdown -muistiinpanot : exporter en HTML, puis passer par html2latex pour obtenir un document imprimable structuré.
  • Yritysraportit : transformer un rapport rédigé dans un CMS interne en livrable PDF typographié.

Miten HTML to LaTeX -muuntimemme toimii?

Muunnin jäsentää HTML-lähteesi, tunnistaa jokaisen tagin ja yhdistää sen vastaavaan LaTeX-komentoon. Käytännössä:

  • Otsikoista <h1>, <h2>, <h3> tulee \section{}, \subsection{}, \subsubsection{}.
  • Rivin sisäinen muotoilu (<strong>, <em>, <u>, <code>) käännetään muotoon \textbf{}, \textit{}, \underline{}, \texttt{}.
  • Luetteloista (<ul>, <ol>) tulee itemize- ja enumerate-ympäristöjä.
  • Linkit <a href> luodaan hyperref-paketin avulla.
  • LaTeXin erikoismerkit (%, &, $, #, _, {, }) ohitetaan (escaped) automaattisesti.

Valitset LaTeX-tulosteluokan: article (oletus, artikkeleille ja lyhyille raporteille), letter (kirjeenvaihtoon) tai book (pitkille dokumenteille, joissa on lukuja). Esipuhe (preamble) luodaan hyödyllisillä paketeilla: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.

Miten työkalua käytetään

Neljä vaihetta HTML:n muuntamiseksi LaTeXiksi:

  1. Liitä HTML-koodisi varattuun kenttään.
  2. Valitse tulosdokumentin tyyppi (article, letter, book).
  3. Napsauta muunnospainiketta. Tiedosto .tex ja sen PDF-tulos luodaan.
  4. Lataa .tex-tiedosto muokataksesi sitä LaTeX-editorissasi tai PDF suoraan.

Keskeiset HTML to LaTeX -vastaavuudet

HTML LaTeX Huomautukset
<h1> \section{} Taso 1
<h2> \subsection{} Taso 2
<h3> \subsubsection{} Taso 3
<strong> \textbf{} Lihavointi
<em> \textit{} Kursivointi
<u> \underline{} Alleviivaus
<code> \texttt{} Tasavälinen fontti
<ul> \begin{itemize} Luettelomerkit
<ol> \begin{enumerate} Numeroitu luettelo
<li> \item Luettelon kohta
<a href="..."> \href{...}{...} Vaatii \usepackage{hyperref}
<blockquote> \begin{quote} Lainaus
<p> kappale Tyhjä rivi kappaleiden välillä
<br> \\ Rivinvaihto

Esimerkki HTML to LaTeX -muunnoksesta

HTML-lähde :


<h1>Pääotsikko</h1>
<p>Tämä on kappale, jossa on <strong>lihavointia</strong> ja <em>kursivointia</em>.</p>
<h2>Alioisio</h2>
<ul>
    <li>Kohta yksi</li>
    <li>Kohta kaksi, jossa on <a href="https://cdrn.fr">linkki</a></li>
</ul>

LaTeX-tulos :


\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[french]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amssymb}
\begin{document}
\section{Pääotsikko}
Tämä on kappale, jossa on \textbf{lihavointia} ja \textit{kursivointia}.

\subsection{Alioisio}
\begin{itemize}
    \item Kohta yksi
    \item Kohta kaksi, jossa on \href{https://cdrn.fr}{linkki}
\end{itemize}
\end{document}

UKK

Mikä LaTeX-luokka valita: article, letter vai book ?

article sopii useimpiin tapauksiin (raportti, artikkeli, lyhyt muistio). letter on tarkoitettu kirjeenvaihtoon (otsikko, allekirjoitus, kohteliaisuusmuodot). book rakentaa pitkät dokumentit luvuiksi ja sisältää yksityiskohtaisen sisällysluettelon. Jos olet epävarma, valitse article.

Onko luotu PDF taatusti käännettävissä ?

Standardille HTML:lle (kappaleet, otsikot, luettelot, rivin sisäinen muotoilu, linkit), kyllä. Jos HTML-koodisi sisältää erikoisia tageja, upotettua JavaScriptiä tai epästandardeja sisäkkäisiä rakenteita, voi olla tarpeen säätää .tex-tiedostoa manuaalisesti ennen kääntämistä.

HTML-koodini käyttää kuvia : sisältyvätkö ne ?

<img>-tagit muunnetaan \includegraphics{}-muotoon graphicx-paketin avulla, mutta itse kuvia ei upoteta .tex-tiedostoon (LaTeX viittaa paikallisiin tiedostoihin). Lataa kuvat erikseen ja sijoita ne .tex-tiedoston viereen ennen kääntämistä.

Miksi ei Markdownista suoraan LaTeXiksi ?

Pandoc hoitaa Markdownista LaTeXiksi -muunnoksen erittäin hyvin. Meidän muuntimemme kohdistuu erityisesti HTML:ään, joka kattaa lähteitä, joita Markdown ei tavoita: CMS-vienneet, verkkosivut, WYSIWYG-editoreilla kirjoitetut sisällöt, dokumentaatiogeneraattoreiden tulosteet. Jos lähteesi on jo Markdownia, vie se HTML:nä ja käytä tätä muunninta, tai käytä Pandocia suoraan.

Hallitseeko LaTeX-tulos UTF-8:n ja aksentit ?

Kyllä. Esipuhe sisältää komennot \usepackage[utf8]{inputenc} ja \usepackage[french]{babel}, mikä varmistaa aksenttien, sediljin ja ranskalaisten typografisten sääntöjen oikean tulostuksen (sitovat välilyönnit ennen kaksoisvälimerkkejä, ranskalaiset lainausmerkit).

Entä käänteinen, LaTeX HTML:ksi ?

LaTeXin muuntaminen HTML:ksi on eri asia (LaTeX on paljon ilmaisuvoimaisempi kuin HTML, erityisesti yhtälöissä). Tätä suuntaa varten tutustu pandoc-, htlatex- tai LaTeXML-työkaluihin. Tämä työkalu tekee vain HTML to LaTeX -muunnoksen, yhteen suuntaan.

Usein kysytyt kysymykset

Mikä LaTeX-luokka valita: article, letter tai book ?

article sopii useimpiin tapauksiin (lyhyt raportti, kirjoitus, muistio, tieteellinen artikkeli). letter on tarkoitettu kirjeenvaihtoon, jossa on integroitu otsikko, allekirjoitus ja kohteliaisuusmuodot. book rakentaa pitkät dokumentit luvuiksi ja sisältää yksityiskohtaisen sisällysluettelon. Jos olet epävarma, valitse article : se on yleiskäyttöisin luokka.

Tulostuvatko aksentit ja ranskalaiset merkit oikein ?

Kyllä. Luotu esipuhe sisältää komennot \usepackage[utf8]{inputenc} ja \usepackage[french]{babel}, mikä varmistaa aksenttien, sediljin ja ranskalaisten typografisten sääntöjen oikean tulostuksen: sitovat välilyönnit ennen kaksoisvälimerkkejä, ranskalaiset lainausmerkit, oikea tavutus. Ranskankieliselle tekstille ei tarvita manuaalisia toimenpiteitä.

Ohitetaanpa LaTeXin erikoismerkit automaattisesti ?

Kyllä. Merkit, joilla on merkitys LaTeXissa (%, &, $, #, _, {, }, ~, ^, \) ohitetaan automaattisesti muunnoksen aikana. HTML-teksti, joka sisältää 50 % alennus tai kayttaja_nimi, kääntyy oikein rikkomatta käännöstä.

HTML-koodini käyttää kuvia : sisältyvätkö ne .tex-tiedostoon ?

<img>-tagit muunnetaan \includegraphics{}-muotoon graphicx-paketin avulla, mutta itse kuvia ei upoteta .tex-tiedostoon, koska LaTeX viittaa paikallisiin tiedostoihin. Lataa kuvat erikseen ja sijoita ne .tex-tiedoston viereen ennen kääntämistä tai säädä polkua \graphicspath-komennolla.

Miten käsitellä HTML-koodia, jossa on matemaattisia yhtälöitä ?

Jos yhtälösi ovat jo MathML- tai rivin sisäisessä LaTeX-muodossa (esimerkiksi $E = mc^2$), muunnin välittää ne lähes sellaisinaan tulosteeseen. Kuvina (PNG, SVG) esitettyjä yhtälöitä ei muunneta automaattisesti LaTeXiksi. Moitteetonta matemaattista tulosta varten kirjoita kaavat LaTeXilla HTML-lähteeseen; esipuhe lataa jo valmiiksi paketit amsmath ja amssymb.

Onko luotu .tex taatusti käännettävissä ?

Standardille HTML:lle (kappaleet, otsikot, luettelot, rivin sisäinen muotoilu, linkit, yksinkertaiset taulukot), kyllä. Jos HTML-koodisi sisältää erikoisia tageja, upotettua JavaScriptiä, monimutkaisia CSS-määrityksiä tai epästandardeja sisäkkäisiä rakenteita, voi olla tarpeen säätää .tex-tiedostoa ennen kääntämistä. Avaa se Overleafissa tai TeXstudiossa havaitaksesi nopeasti mahdolliset varoitukset.

Pyyntöesimerkki

curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
  -H "Content-Type: application/json" \
  -d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'

Syöteskeema

Kenttä Tyyppi Pakollinen Oletus
content string
type choice (letter, article)
city string
object string
opening string
closing string
sender_address text
recipient_address text
recipient_name string
sender_name string
sender_phone string
sender_mail string

Päätepisteet

  • GET https://cdrn.fr/api/v1/tools - listaa kaikki saatavilla olevat työkalut
  • GET https://cdrn.fr/api/v1/tools/html-to-latex-converter - hakee tämän työkalun skeeman
  • POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute - suorittaa tämän työkalun JSON-payloadilla