Converter HTML em LaTeX e gerar um PDF

Converte facilmente texto HTML em LaTeX, gerando um ficheiro PDF profissional. Suporta diversos formatos de documentos LaTeX, tais como artigos e cartas, e gere as etiquetas HTML comuns. Ideal para utilizadores que pretendem obter uma renderização de alta qualidade para os seus documentos.

Porquê converter HTML em LaTeX?

Converter HTML em LaTeX permite produzir PDFs de qualidade profissional a partir de conteúdo já redigido na web: artigos de um CMS, documentação autogerada, posts de blogue, exportações de wikis ou notas tomadas num editor WYSIWYG. Em vez de refazer a paginação manualmente, este conversor HTML to LaTeX pega na sua fonte HTML e produz um ficheiro .tex compilável em PDF.

Os usos típicos: transformar um rascunho redigido no Notion ou em Markdown (exportado em HTML) num artigo científico, transformar uma página web num livro imprimível, gerar uma carta ou um CV a partir de um editor HTML. A conversão html to latex evita reescrever a paginação e garante uma rendição tipográfica homogénea.

Porquê LaTeX em vez de uma exportação PDF direta?

Imprimir uma página HTML em PDF a partir do navegador é rápido, mas o resultado raramente está à altura de uma publicação. Passar por LaTeX traz várias vantagens decisivas:

  • Tipografia profissional: kerning, hifenização, justificação, viúvas e órfãs geridas automaticamente, bibliografia através de BibTeX/BibLaTeX, numeração coerente das secções, figuras e equações.
  • Documentos reproduzíveis: o .tex é um ficheiro de texto versionável que se recompila de forma idêntica. Ideal para investigação, documentação de software ou qualquer fluxo onde a reprodutibilidade conte.
  • Padrão académico: LaTeX continua a ser o formato esperado pela maioria das revistas científicas, conferências e teses universitárias.
  • Edição fina possível: se a rendição gerada não lhe agrada a 100 %, abra o .tex no Overleaf, TeXstudio ou VS Code e ajuste. Mantém o controlo, ao contrário de um PDF fechado.

Casos de uso típicos

  • Artigos científicos: um rascunho redigido na web, converter html em latex, afinar no Overleaf, submeter à revista.
  • Cartas e CV: passar de um editor HTML (rico, visual) para uma carta LaTeX com rendição impecável, pronta a imprimir.
  • Documentação técnica: gerar um PDF de referência a partir de uma documentação HTML existente (Sphinx, MkDocs, wiki), sem duplicar a fonte.
  • Notas Notion / Markdown: exportar em HTML, depois passar por html2latex para obter um documento imprimível estruturado.
  • Relatórios de empresa: transformar um relatório redigido num CMS interno num entregável PDF tipografado.

Como funciona o nosso conversor HTML to LaTeX?

O conversor faz parse da sua fonte HTML, identifica cada tag, e mapeia-a no comando LaTeX equivalente. Concretamente:

  • Os títulos <h1>, <h2>, <h3> tornam-se \section{}, \subsection{}, \subsubsection{}.
  • A formatação inline (<strong>, <em>, <u>, <code>) é traduzida em \textbf{}, \textit{}, \underline{}, \texttt{}.
  • As listas (<ul>, <ol>) tornam-se ambientes itemize e enumerate.
  • As ligações <a href> são renderizadas com o pacote hyperref.
  • Os caracteres especiais LaTeX (%, &, $, #, _, {, }) são automaticamente escapados.

Escolhe a classe LaTeX de saída: article (por defeito, para artigos, relatórios curtos), letter (para correspondência) ou book (para documentos longos com capítulos). O preâmbulo é gerado com os pacotes úteis: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.

Como utilizar a ferramenta

Quatro etapas para converter HTML em LaTeX:

  1. Cole o seu código HTML no campo previsto.
  2. Escolha o tipo de documento de saída (article, letter, book).
  3. Clique no botão de conversão. O ficheiro .tex e a sua rendição PDF são gerados.
  4. Descarregue o .tex para o editar no seu editor LaTeX, ou o PDF diretamente.

Mapeamentos chave HTML to LaTeX

HTML LaTeX Notas
<h1> \section{} Nível 1
<h2> \subsection{} Nível 2
<h3> \subsubsection{} Nível 3
<strong> \textbf{} Negrito
<em> \textit{} Itálico
<u> \underline{} Sublinhado
<code> \texttt{} Fonte monoespaçada
<ul> \begin{itemize} Lista de marcas
<ol> \begin{enumerate} Lista numerada
<li> \item Elemento de lista
<a href="..."> \href{...}{...} Requer \usepackage{hyperref}
<blockquote> \begin{quote} Citação
<p> parágrafo Linha vazia entre parágrafos
<br> \\ Quebra de linha

Exemplo de conversão HTML to LaTeX

Fonte HTML:


<h1>Titre Principal</h1>
<p>Ceci est un paragraphe avec <strong>du gras</strong> et <em>de l'italique</em>.</p>
<h2>Sous-section</h2>
<ul>
    <li>Élément un</li>
    <li>Élément deux avec <a href="https://cdrn.fr">un lien</a></li>
</ul>

Resultado LaTeX:


\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[french]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amssymb}
\begin{document}
\section{Titre Principal}
Ceci est un paragraphe avec \textbf{du gras} et \textit{de l'italique}.

\subsection{Sous-section}
\begin{itemize}
    \item Élément un
    \item Élément deux avec \href{https://cdrn.fr}{un lien}
\end{itemize}
\end{document}

FAQ

Que classe LaTeX escolher: article, letter ou book?

article serve para a maioria dos casos (relatório, artigo, memo curto). letter é dedicado à correspondência (cabeçalho, assinatura, fórmulas de cortesia). book estrutura os documentos longos em capítulos e inclui um índice detalhado. Em caso de dúvida, opte por article.

O PDF gerado é garantidamente compilável?

Para um HTML padrão (parágrafos, títulos, listas, formatação inline, ligações), sim. Se o seu HTML contém tags exóticas, JavaScript inline ou estruturas encadeadas não padrão, pode ser necessário ajustar manualmente o .tex antes da compilação.

O meu HTML usa imagens: são incluídas?

As tags <img> são convertidas em \includegraphics{} com o pacote graphicx, mas as próprias imagens não são incorporadas no .tex (o LaTeX referencia ficheiros locais). Descarregue as imagens à parte e coloque-as ao lado do .tex antes da compilação.

Porque não Markdown para LaTeX diretamente?

O Pandoc faz muito bem Markdown para LaTeX. O nosso conversor visa especificamente o HTML, que cobre fontes que o Markdown não atinge: exportações de CMS, páginas web, conteúdos redigidos em editores WYSIWYG, saída de geradores de documentação. Se a sua fonte já está em Markdown, exporte-a em HTML e depois passe por aqui, ou use o Pandoc diretamente.

A rendição LaTeX gere o UTF-8 e os acentos?

Sim. O preâmbulo inclui \usepackage[utf8]{inputenc} e \usepackage[french]{babel}, o que assegura a boa rendição dos acentos, da cedilha e das regras tipográficas francesas (espaços inquebráveis antes das pontuações duplas, aspas francesas).

E o inverso, LaTeX em HTML?

A conversão latex em html é outro exercício (o LaTeX é muito mais expressivo do que o HTML, nomeadamente para as equações). Para este sentido, veja do lado de pandoc, htlatex ou LaTeXML. A presente ferramenta só faz html to latex, num único sentido.

Perguntas frequentes

Que classe LaTeX escolher: article, letter ou book?

article serve para a maioria dos casos (relatório curto, post, memo, artigo científico). letter é dedicado à correspondência com cabeçalho, assinatura e fórmulas de cortesia integradas. book estrutura os documentos longos em capítulos e inclui um índice detalhado. Em caso de dúvida, opte por article: é a classe mais universal.

Os acentos e caracteres franceses são bem renderizados?

Sim. O preâmbulo gerado inclui \usepackage[utf8]{inputenc} e \usepackage[french]{babel}, o que assegura a rendição correta dos acentos, da cedilha e das regras tipográficas francesas: espaços inquebráveis antes das pontuações duplas, aspas francesas, hifenização correta. Não é necessária qualquer intervenção manual para um texto em francês.

Os caracteres especiais LaTeX são escapados automaticamente?

Sim. Os caracteres com significado em LaTeX (%, &, $, #, _, {, }, ~, ^, \) são automaticamente escapados durante a conversão. Um texto HTML que contém 50 % de desconto ou nome_utilizador traduz-se corretamente sem quebrar a compilação.

O meu HTML utiliza imagens: são incluídas no .tex?

As tags <img> são convertidas em \includegraphics{} com o pacote graphicx, mas as próprias imagens não são incorporadas no .tex porque o LaTeX referencia ficheiros locais. Descarregue as imagens à parte e coloque-as ao lado do .tex antes da compilação, ou ajuste o caminho em \graphicspath.

Como tratar HTML com equações matemáticas?

Se as suas equações já estão em MathML ou LaTeX inline (por exemplo $E = mc^2$), o conversor transmite-as quase tal como estão para a saída. As equações renderizadas sob a forma de imagens (PNG, SVG) não são reconvertidas em LaTeX automaticamente. Para uma rendição matemática impecável, escreva as fórmulas em LaTeX na fonte HTML, o preâmbulo já carrega amsmath e amssymb.

O .tex gerado é garantidamente compilável?

Para um HTML padrão (parágrafos, títulos, listas, formatação inline, ligações, tabelas simples), sim. Se o seu HTML contém tags exóticas, JavaScript inline, CSS complexo ou estruturas encadeadas não padrão, pode ser necessário ajustar o .tex antes da compilação. Abra-o no Overleaf ou TeXstudio para detetar rapidamente os eventuais avisos.

Exemplo de pedido

curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
  -H "Content-Type: application/json" \
  -d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'

Esquema de entrada

Campo Tipo Obrigatório Predefinição
content string
type choice (letter, article)
city string
object string
opening string
closing string
sender_address text
recipient_address text
recipient_name string
sender_name string
sender_phone string
sender_mail string

Pontos de acesso

  • GET https://cdrn.fr/api/v1/tools - lista todas as ferramentas disponíveis
  • GET https://cdrn.fr/api/v1/tools/html-to-latex-converter - obtém o esquema desta ferramenta
  • POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute - executa esta ferramenta com um payload JSON