Converter HTML em LaTeX e gerar um PDF
- Painel
- Documentação
- API
Porquê converter HTML em LaTeX?
Converter HTML em LaTeX permite produzir PDFs de qualidade profissional a partir de conteúdo já redigido na web: artigos de um CMS, documentação autogerada, posts de blogue, exportações de wikis ou notas tomadas num editor WYSIWYG. Em vez de refazer a paginação manualmente, este conversor HTML to LaTeX pega na sua fonte HTML e produz um ficheiro .tex compilável em PDF.
Os usos típicos: transformar um rascunho redigido no Notion ou em Markdown (exportado em HTML) num artigo científico, transformar uma página web num livro imprimível, gerar uma carta ou um CV a partir de um editor HTML. A conversão html to latex evita reescrever a paginação e garante uma rendição tipográfica homogénea.
Porquê LaTeX em vez de uma exportação PDF direta?
Imprimir uma página HTML em PDF a partir do navegador é rápido, mas o resultado raramente está à altura de uma publicação. Passar por LaTeX traz várias vantagens decisivas:
- Tipografia profissional: kerning, hifenização, justificação, viúvas e órfãs geridas automaticamente, bibliografia através de BibTeX/BibLaTeX, numeração coerente das secções, figuras e equações.
- Documentos reproduzíveis: o
.texé um ficheiro de texto versionável que se recompila de forma idêntica. Ideal para investigação, documentação de software ou qualquer fluxo onde a reprodutibilidade conte. - Padrão académico: LaTeX continua a ser o formato esperado pela maioria das revistas científicas, conferências e teses universitárias.
- Edição fina possível: se a rendição gerada não lhe agrada a 100 %, abra o
.texno Overleaf, TeXstudio ou VS Code e ajuste. Mantém o controlo, ao contrário de um PDF fechado.
Casos de uso típicos
- Artigos científicos: um rascunho redigido na web, converter html em latex, afinar no Overleaf, submeter à revista.
- Cartas e CV: passar de um editor HTML (rico, visual) para uma carta LaTeX com rendição impecável, pronta a imprimir.
- Documentação técnica: gerar um PDF de referência a partir de uma documentação HTML existente (Sphinx, MkDocs, wiki), sem duplicar a fonte.
- Notas Notion / Markdown: exportar em HTML, depois passar por html2latex para obter um documento imprimível estruturado.
- Relatórios de empresa: transformar um relatório redigido num CMS interno num entregável PDF tipografado.
Como funciona o nosso conversor HTML to LaTeX?
O conversor faz parse da sua fonte HTML, identifica cada tag, e mapeia-a no comando LaTeX equivalente. Concretamente:
- Os títulos
<h1>,<h2>,<h3>tornam-se\section{},\subsection{},\subsubsection{}. - A formatação inline (
<strong>,<em>,<u>,<code>) é traduzida em\textbf{},\textit{},\underline{},\texttt{}. - As listas (
<ul>,<ol>) tornam-se ambientesitemizeeenumerate. - As ligações
<a href>são renderizadas com o pacotehyperref. - Os caracteres especiais LaTeX (
%,&,$,#,_,{,}) são automaticamente escapados.
Escolhe a classe LaTeX de saída: article (por defeito, para artigos, relatórios curtos), letter (para correspondência) ou book (para documentos longos com capítulos). O preâmbulo é gerado com os pacotes úteis: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.
Como utilizar a ferramenta
Quatro etapas para converter HTML em LaTeX:
- Cole o seu código HTML no campo previsto.
- Escolha o tipo de documento de saída (article, letter, book).
- Clique no botão de conversão. O ficheiro
.texe a sua rendição PDF são gerados. - Descarregue o
.texpara o editar no seu editor LaTeX, ou o PDF diretamente.
Mapeamentos chave HTML to LaTeX
| HTML | LaTeX | Notas |
|---|---|---|
<h1> |
\section{} |
Nível 1 |
<h2> |
\subsection{} |
Nível 2 |
<h3> |
\subsubsection{} |
Nível 3 |
<strong> |
\textbf{} |
Negrito |
<em> |
\textit{} |
Itálico |
<u> |
\underline{} |
Sublinhado |
<code> |
\texttt{} |
Fonte monoespaçada |
<ul> |
\begin{itemize} |
Lista de marcas |
<ol> |
\begin{enumerate} |
Lista numerada |
<li> |
\item |
Elemento de lista |
<a href="..."> |
\href{...}{...} |
Requer \usepackage{hyperref} |
<blockquote> |
\begin{quote} |
Citação |
<p> |
parágrafo | Linha vazia entre parágrafos |
<br> |
\\ |
Quebra de linha |
Exemplo de conversão HTML to LaTeX
Fonte HTML:
<h1>Titre Principal</h1>
<p>Ceci est un paragraphe avec <strong>du gras</strong> et <em>de l'italique</em>.</p>
<h2>Sous-section</h2>
<ul>
<li>Élément un</li>
<li>Élément deux avec <a href="https://cdrn.fr">un lien</a></li>
</ul>
Resultado LaTeX:
\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[french]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amssymb}
\begin{document}
\section{Titre Principal}
Ceci est un paragraphe avec \textbf{du gras} et \textit{de l'italique}.
\subsection{Sous-section}
\begin{itemize}
\item Élément un
\item Élément deux avec \href{https://cdrn.fr}{un lien}
\end{itemize}
\end{document}
FAQ
Que classe LaTeX escolher: article, letter ou book?
article serve para a maioria dos casos (relatório, artigo, memo curto). letter é dedicado à correspondência (cabeçalho, assinatura, fórmulas de cortesia). book estrutura os documentos longos em capítulos e inclui um índice detalhado. Em caso de dúvida, opte por article.
O PDF gerado é garantidamente compilável?
Para um HTML padrão (parágrafos, títulos, listas, formatação inline, ligações), sim. Se o seu HTML contém tags exóticas, JavaScript inline ou estruturas encadeadas não padrão, pode ser necessário ajustar manualmente o .tex antes da compilação.
O meu HTML usa imagens: são incluídas?
As tags <img> são convertidas em \includegraphics{} com o pacote graphicx, mas as próprias imagens não são incorporadas no .tex (o LaTeX referencia ficheiros locais). Descarregue as imagens à parte e coloque-as ao lado do .tex antes da compilação.
Porque não Markdown para LaTeX diretamente?
O Pandoc faz muito bem Markdown para LaTeX. O nosso conversor visa especificamente o HTML, que cobre fontes que o Markdown não atinge: exportações de CMS, páginas web, conteúdos redigidos em editores WYSIWYG, saída de geradores de documentação. Se a sua fonte já está em Markdown, exporte-a em HTML e depois passe por aqui, ou use o Pandoc diretamente.
A rendição LaTeX gere o UTF-8 e os acentos?
Sim. O preâmbulo inclui \usepackage[utf8]{inputenc} e \usepackage[french]{babel}, o que assegura a boa rendição dos acentos, da cedilha e das regras tipográficas francesas (espaços inquebráveis antes das pontuações duplas, aspas francesas).
E o inverso, LaTeX em HTML?
A conversão latex em html é outro exercício (o LaTeX é muito mais expressivo do que o HTML, nomeadamente para as equações). Para este sentido, veja do lado de pandoc, htlatex ou LaTeXML. A presente ferramenta só faz html to latex, num único sentido.
Perguntas frequentes
Que classe LaTeX escolher: article, letter ou book?
article serve para a maioria dos casos (relatório curto, post, memo, artigo científico). letter é dedicado à correspondência com cabeçalho, assinatura e fórmulas de cortesia integradas. book estrutura os documentos longos em capítulos e inclui um índice detalhado. Em caso de dúvida, opte por article: é a classe mais universal.
Os acentos e caracteres franceses são bem renderizados?
Sim. O preâmbulo gerado inclui \usepackage[utf8]{inputenc} e \usepackage[french]{babel}, o que assegura a rendição correta dos acentos, da cedilha e das regras tipográficas francesas: espaços inquebráveis antes das pontuações duplas, aspas francesas, hifenização correta. Não é necessária qualquer intervenção manual para um texto em francês.
Os caracteres especiais LaTeX são escapados automaticamente?
Sim. Os caracteres com significado em LaTeX (%, &, $, #, _, {, }, ~, ^, \) são automaticamente escapados durante a conversão. Um texto HTML que contém 50 % de desconto ou nome_utilizador traduz-se corretamente sem quebrar a compilação.
O meu HTML utiliza imagens: são incluídas no .tex?
As tags <img> são convertidas em \includegraphics{} com o pacote graphicx, mas as próprias imagens não são incorporadas no .tex porque o LaTeX referencia ficheiros locais. Descarregue as imagens à parte e coloque-as ao lado do .tex antes da compilação, ou ajuste o caminho em \graphicspath.
Como tratar HTML com equações matemáticas?
Se as suas equações já estão em MathML ou LaTeX inline (por exemplo $E = mc^2$), o conversor transmite-as quase tal como estão para a saída. As equações renderizadas sob a forma de imagens (PNG, SVG) não são reconvertidas em LaTeX automaticamente. Para uma rendição matemática impecável, escreva as fórmulas em LaTeX na fonte HTML, o preâmbulo já carrega amsmath e amssymb.
O .tex gerado é garantidamente compilável?
Para um HTML padrão (parágrafos, títulos, listas, formatação inline, ligações, tabelas simples), sim. Se o seu HTML contém tags exóticas, JavaScript inline, CSS complexo ou estruturas encadeadas não padrão, pode ser necessário ajustar o .tex antes da compilação. Abra-o no Overleaf ou TeXstudio para detetar rapidamente os eventuais avisos.
Exemplo de pedido
curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
-H "Content-Type: application/json" \
-d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'
Esquema de entrada
| Campo | Tipo | Obrigatório | Predefinição |
|---|---|---|---|
content |
string | ✓ | – |
type |
choice (letter, article) | ✓ | – |
city |
string | ✓ | – |
object |
string | ✓ | – |
opening |
string | ✓ | – |
closing |
string | ✓ | – |
sender_address |
text | ✓ | – |
recipient_address |
text | ✓ | – |
recipient_name |
string | ✓ | – |
sender_name |
string | ✓ | – |
sender_phone |
string | ✓ | – |
sender_mail |
string | ✓ | – |
Pontos de acesso
GET https://cdrn.fr/api/v1/tools- lista todas as ferramentas disponíveisGET https://cdrn.fr/api/v1/tools/html-to-latex-converter- obtém o esquema desta ferramentaPOST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute- executa esta ferramenta com um payload JSON