Convertire HTML in LaTeX e generare un PDF

Converte facilmente del testo HTML in LaTeX, generando al contempo un file PDF professionale. Supporta vari formati di documenti LaTeX, come articoli e lettere, e gestisce i tag HTML comuni. Ideale per gli utenti che desiderano ottenere un rendering di alta qualità per i loro documenti.

Perché convertire HTML in LaTeX?

Convertire HTML in LaTeX permette di produrre PDF di qualità professionale da contenuti già redatti sul web: articoli di un CMS, documentazione auto-generata, post di blog, export di wiki o note prese in un editor WYSIWYG. Piuttosto che impaginare manualmente, questo convertitore HTML to LaTeX prende il vostro sorgente HTML e produce un file .tex compilabile in PDF.

Gli usi tipici: trasformare una bozza redatta su Notion o Markdown (esportato in HTML) in articolo scientifico, trasformare una pagina web in libretto stampabile, generare una lettera o un CV da un editor HTML. La conversione html to latex evita di riscrivere l'impaginazione e garantisce una resa tipografica omogenea.

Perché LaTeX piuttosto che un export PDF diretto?

Stampare una pagina HTML in PDF dal browser è rapido, ma il risultato è raramente all'altezza di una pubblicazione. Passare per LaTeX porta più vantaggi decisivi:

  • Tipografia professionale: kerning, sillabazione, giustificazione, vedove e orfani gestiti automaticamente, bibliografia tramite BibTeX/BibLaTeX, numerazione coerente di sezioni, figure ed equazioni.
  • Documenti riproducibili: il .tex è un file di testo versionabile che si ricompila identico. Ideale per la ricerca, la documentazione software o ogni flusso dove la riproducibilità conta.
  • Standard accademico: LaTeX resta il formato atteso dalla maggior parte delle riviste scientifiche, delle conferenze e delle tesi universitarie.
  • Editing fine possibile: se la resa generata non vi convince al 100%, aprite il .tex in Overleaf, TeXstudio o VS Code e regolate. Mantenete il controllo, a differenza di un PDF fisso.

Casi d'uso tipici

  • Articoli scientifici: una bozza redatta sul web, convertire html in latex, rifinire in Overleaf, sottomettere alla rivista.
  • Lettere e CV: passare da un editor HTML (ricco, visivo) a una lettera LaTeX dalla resa impeccabile, pronta da stampare.
  • Documentazione tecnica: generare un PDF di riferimento da una doc HTML esistente (Sphinx, MkDocs, wiki), senza duplicare la sorgente.
  • Note Notion / Markdown: esportare in HTML, poi passare per html2latex per ottenere un documento stampabile strutturato.
  • Report aziendali: trasformare un report redatto in un CMS interno in un deliverable PDF tipografato.

Come funziona il nostro convertitore HTML to LaTeX?

Il convertitore fa il parsing del vostro sorgente HTML, identifica ogni tag, e lo mappa sul comando LaTeX equivalente. Concretamente:

  • I titoli <h1>, <h2>, <h3> diventano \section{}, \subsection{}, \subsubsection{}.
  • La formattazione inline (<strong>, <em>, <u>, <code>) viene tradotta in \textbf{}, \textit{}, \underline{}, \texttt{}.
  • Le liste (<ul>, <ol>) diventano ambienti itemize ed enumerate.
  • I link <a href> sono resi con il pacchetto hyperref.
  • I caratteri speciali LaTeX (%, &, $, #, _, {, }) sono escapati automaticamente.

Scegliete la classe LaTeX di output: article (per default, per articoli, report brevi), letter (per la corrispondenza) o book (per documenti lunghi con capitoli). Il preambolo viene generato con i pacchetti utili: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.

Come usare lo strumento

Quattro passaggi per convertire HTML in LaTeX:

  1. Incollate il vostro codice HTML nel campo previsto.
  2. Scegliete il tipo di documento di output (article, letter, book).
  3. Cliccate sul pulsante di conversione. Il file .tex e il suo rendering PDF sono generati.
  4. Scaricate il .tex per modificarlo nel vostro editor LaTeX, o il PDF direttamente.

Mappature chiave HTML to LaTeX

HTML LaTeX Note
<h1> \section{} Livello 1
<h2> \subsection{} Livello 2
<h3> \subsubsection{} Livello 3
<strong> \textbf{} Grassetto
<em> \textit{} Corsivo
<u> \underline{} Sottolineato
<code> \texttt{} Font monospace
<ul> \begin{itemize} Lista puntata
<ol> \begin{enumerate} Lista numerata
<li> \item Elemento di lista
<a href="..."> \href{...}{...} Richiede \usepackage{hyperref}
<blockquote> \begin{quote} Citazione
<p> paragrafo Riga vuota tra paragrafi
<br> \\ A capo

Esempio di conversione HTML to LaTeX

Sorgente HTML:


<h1>Titre Principal</h1>
<p>Ceci est un paragraphe avec <strong>du gras</strong> et <em>de l'italique</em>.</p>
<h2>Sous-section</h2>
<ul>
    <li>Élément un</li>
    <li>Élément deux avec <a href="https://cdrn.fr">un lien</a></li>
</ul>

Risultato LaTeX:


\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[french]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amssymb}
\begin{document}
\section{Titre Principal}
Ceci est un paragraphe avec \textbf{du gras} et \textit{de l'italique}.

\subsection{Sous-section}
\begin{itemize}
    \item Élément un
    \item Élément deux avec \href{https://cdrn.fr}{un lien}
\end{itemize}
\end{document}

FAQ

Quale classe LaTeX scegliere: article, letter o book?

article conviene alla maggior parte dei casi (report, articolo, memo breve). letter è dedicato alla corrispondenza (intestazione, firma, formule di cortesia). book struttura i documenti lunghi in capitoli e include un indice dettagliato. In caso di dubbio, partite con article.

Il PDF generato è garantito compilabile?

Per un HTML standard (paragrafi, titoli, liste, formattazione inline, link), sì. Se il vostro HTML contiene tag esotici, JavaScript inline o strutture nidificate non standard, può essere necessario regolare manualmente il .tex prima della compilazione.

Il mio HTML usa immagini: sono incluse?

I tag <img> sono convertiti in \includegraphics{} con il pacchetto graphicx, ma le immagini stesse non sono incorporate nel .tex (LaTeX riferisce file locali). Scaricate le immagini separatamente e mettetele a fianco del .tex prima della compilazione.

Perché non Markdown verso LaTeX direttamente?

Pandoc fa molto bene Markdown verso LaTeX. Il nostro convertitore mira specificamente all'HTML, che copre sorgenti che Markdown non raggiunge: export di CMS, pagine web, contenuti redatti in editor WYSIWYG, output di generatori di doc. Se la vostra sorgente è già in Markdown, esportatela in HTML poi passate qui, o usate Pandoc direttamente.

La resa LaTeX gestisce UTF-8 e accenti?

Sì. Il preambolo include \usepackage[utf8]{inputenc} e \usepackage[french]{babel}, il che assicura la buona resa degli accenti, della cediglia e delle regole tipografiche francesi (spazi non separabili prima delle punteggiature doppie, virgolette francesi).

E l'inverso, LaTeX in HTML?

La conversione latex in html è un altro esercizio (LaTeX è molto più espressivo di HTML, in particolare per le equazioni). Per questo senso, guardate pandoc, htlatex o LaTeXML. Il presente strumento fa solo html to latex, in un solo senso.

Domande frequenti

Quale classe LaTeX scegliere: article, letter o book?

article conviene alla maggior parte dei casi (report breve, post, memo, articolo scientifico). letter è dedicato alla corrispondenza con intestazione, firma e formule di cortesia integrate. book struttura i documenti lunghi in capitoli e include un indice dettagliato. In caso di dubbio, partite con article: è la classe più universale.

Gli accenti e i caratteri francesi sono ben resi?

Sì. Il preambolo generato include \usepackage[utf8]{inputenc} e \usepackage[french]{babel}, il che assicura la resa corretta degli accenti, della cediglia e delle regole tipografiche francesi: spazi non separabili prima delle punteggiature doppie, virgolette francesi, sillabazione corretta. Nessun intervento manuale è necessario per un testo in francese.

I caratteri speciali LaTeX sono escapati automaticamente?

Sì. I caratteri che hanno un significato in LaTeX (%, &, $, #, _, {, }, ~, ^, \) sono escapati automaticamente durante la conversione. Un testo HTML che contiene 50 % di sconto o nome_utente si traduce correttamente senza rompere la compilazione.

Il mio HTML usa immagini: sono incluse nel .tex?

I tag <img> sono convertiti in \includegraphics{} con il pacchetto graphicx, ma le immagini stesse non sono incorporate nel .tex perché LaTeX riferisce file locali. Scaricate le immagini separatamente e mettetele a fianco del .tex prima della compilazione, o regolate il percorso in \graphicspath.

Come trattare un HTML con equazioni matematiche?

Se le vostre equazioni sono già in MathML o LaTeX inline (per esempio $E = mc^2$), il convertitore le trasmette praticamente così come sono verso l'output. Le equazioni rese come immagini (PNG, SVG) non sono riconvertite in LaTeX automaticamente. Per una resa matematica impeccabile, scrivete le formule in LaTeX nella sorgente HTML, il preambolo carica già amsmath e amssymb.

Il .tex generato è garantito compilabile?

Per un HTML standard (paragrafi, titoli, liste, formattazione inline, link, tabelle semplici), sì. Se il vostro HTML contiene tag esotici, JavaScript inline, CSS complessi o strutture nidificate non standard, può essere necessario regolare il .tex prima della compilazione. Apritelo in Overleaf o TeXstudio per individuare rapidamente gli eventuali avvertimenti.

Esempio di richiesta

curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
  -H "Content-Type: application/json" \
  -d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'

Schema di input

Campo Tipo Richiesto Predefinito
content string
type choice (letter, article)
city string
object string
opening string
closing string
sender_address text
recipient_address text
recipient_name string
sender_name string
sender_phone string
sender_mail string

Endpoint

  • GET https://cdrn.fr/api/v1/tools - elenca tutti gli strumenti disponibili
  • GET https://cdrn.fr/api/v1/tools/html-to-latex-converter - recupera lo schema di questo strumento
  • POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute - esegue questo strumento con un payload JSON