Преобразуване на HTML в LaTeX и генериране на PDF
- Табло
- Документация
- API
Защо да конвертирате HTML в LaTeX?
Конвертирането на HTML в LaTeX ви позволява да създавате PDF файлове с професионално качество от съдържание, което вече е написано в мрежата: статии от CMS, самостоятелно генерирана документация, публикации в блогове, експортиране на wiki или бележки, направени в WYSIWYG редактор. Вместо ръчно предаване, този конвертор на HTML към LaTeX взема вашия HTML източник и създава .tex файл, който може да бъде компилиран в PDF.
Типични употреби: трансформирайте чернова, написана на Notion или Markdown (експортирана в HTML) в научна статия, трансформирайте уеб страница в брошура за печат, генерирайте писмо или автобиография от HTML редактор. Преобразуването на html в латекс избягва пренаписването на форматирането и гарантира хомогенно типографско изобразяване.
Защо LaTeX вместо директен PDF експорт?
Отпечатването на HTML страница в PDF от браузъра е бързо, но резултатът рядко е толкова добър, колкото публикация. Използването на LaTeX носи няколко решаващи предимства:
- Професионална типография: кернинг, пренасяне, обосновка, вдовици и сираци, управлявани автоматично, библиография чрез BibTeX/BibLaTeX, последователно номериране на секции, фигури и уравнения.
- Възпроизводими документи:
.texе текстов файл с възможност за версии, който се прекомпилира по идентичен начин. Идеален за изследвания, софтуерна документация или всеки работен процес, където възпроизводимостта има значение. - Академичен стандарт: LaTeX остава форматът, очакван от повечето научни списания, конференции и университетски дисертации.
- Възможно е фино редактиране: ако генерираното изобразяване не ви устройва на 100%, отворете
.texв Overleaf, TeXstudio или VS Code и коригирайте. Вие запазвате контрола, за разлика от замразения PDF.
Типични случаи на употреба
- Научни статии: чернова, написана в мрежата, конвертиране на html в латекс, прецизиране в Overleaf, изпращане в списанието.
- Писма и автобиографии: преминете от HTML редактор (богат, визуален) към безупречно изобразено LaTeX писмо, готово за печат.
- Техническа документация: генерирайте референтен PDF от съществуващ HTML документ (Sphinx, MkDocs, wiki), без да дублирате източника.
- Notes Notion / Markdown: експортирайте в HTML, след това преминете през html2latex, за да получите структуриран документ за печат.
- Корпоративни отчети: трансформирайте отчет, написан във вътрешен CMS, във въведен PDF файл.
Как работи нашият конвертор от HTML към LaTeX?
Конверторът анализира вашия HTML източник, идентифицира всеки таг и го свързва с еквивалентната LaTeX команда. Конкретно:
- Заглавията
,,стават\section{},\subsection{},\subssubsection{}. - Вграденото форматиране (
,,,) се превежда наextbf{},extit{},\underline{},exttt{}. - Списъците (
,) стават среди заitemizeиenumerate. - Връзките
се изобразяват с пакетаhyperref. - Специалните символи на LaTeX (
%,&,$,#,_,{,}) се екранират автоматично.
Вие избирате изходния LaTeX клас: статия (по подразбиране за статии, кратки доклади), писмо (за кореспонденция) или книга (за дълги документи с глави). Преамбюлът се генерира с полезните пакети: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.
Как да използвате инструмента
Четири стъпки за конвертиране на HTML в LaTeX:
- Поставете своя HTML код в предоставеното поле.
- Изберете вида на изходния документ (статия, писмо, книга).
- Щракнете върху бутона за конвертиране. Файлът
.texи неговото PDF изобразяване се генерират. - Изтеглете
.tex, за да го редактирате във вашия LaTeX редактор или директно в PDF.
HTML към LaTeX ключови съпоставяния
Пример за конвертиране на HTML към LaTeX
HTML източник:
<преди>
Основно заглавие
Това е параграф с удебелен шрифт и курсив.
Подраздел
- Елемент едно
- Елемент две с връзка
Резултат от LaTeX:
<преди>
\documentclass{статия}
\usepackage[utf8]{inputenc}
\usepackage[френски]{бабел}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amsymb}
egin{документ}
\section{Основно заглавие}
Това е параграф с extbf{bold} и extit{italics}.
\subsection{Подсекция}
egin{itemize}
\item Първи елемент
\item Елемент две с \href{https://cdrn.fr}{a връзка}
nd{itemize}
nd{документ}
ЧЗВ
Кой LaTeX клас да избера: статия, писмо или книга?
статия е подходяща за повечето случаи (доклад, статия, кратка бележка). писмо е предназначено за кореспонденция (заглавие, подпис, учтиви изрази). book структурира дълги документи в глави и включва подробно съдържание. Ако се съмнявате, отидете на статия.
Гарантирано ли е, че генерираният PDF може да бъде компилиран?
За стандартен HTML (параграфи, заглавия, списъци, вътрешно форматиране, връзки), да. Ако вашият HTML съдържа екзотични тагове, вграден JavaScript или нестандартни вложени структури, може да се наложи ръчно коригиране на .tex преди компилиране.
Моят HTML използва изображения: включени ли са?
Таговете се преобразуват в \includegraphics{} с пакета graphicx, но самите изображения не са вградени в .tex (препратка към локален файл LaTeX). Изтеглете изображенията отделно и ги поставете до .tex преди компилиране.
Защо не Markdown директно към LaTeX?
Pandoc прави Markdown към LaTeX много добре. Нашият конвертор е специално насочен към HTML, който обхваща източници, до които Markdown не достига: CMS експорти, уеб страници, съдържание, написано в WYSIWYG редактори, изход от генератори на документи. Ако вашият източник вече е в Markdown, експортирайте го в HTML, след което отидете тук или използвайте директно Pandoc.
Изобразяването на LaTeX поддържа ли UTF-8 и ударения?
да Преамбюлът включва \usepackage[utf8]{inputenc} и \usepackage[french]{babel}, което гарантира правилното изобразяване на акцентите, седилата и френските типографски правила (неразделящи се интервали преди двойна пунктуация, френски кавички).
И обратното, LaTeX в HTML?
Преобразуването на латекс в html е друго упражнение (LaTeX е много по-изразителен от HTML, особено за уравнения). За това значение вижте pandoc, htlatex или LaTeXML. Този инструмент прави html към латекс само в една посока.
Често задавани въпроси
Кой LaTeX клас да избера: статия, писмо или книга?
статия е подходяща за повечето случаи (кратък доклад, публикация, бележка, научна статия). писмо е предназначено за кореспонденция с интегрирана заглавка, подпис и учтиви изрази. book структурира дълги документи в глави и включва подробно съдържание. Ако се съмнявате, изберете article: това е най-универсалният клас.
Правилно ли са изведени френските акценти и знаци?
да Генерираният преамбюл включва \usepackage[utf8]{inputenc} и \usepackage[french]{babel}, което гарантира правилното изобразяване на ударения, седила и френски типографски правила: неразделящи се интервали преди двойна пунктуация, френски кавички, правилно поставяне на срички. Не е необходима ръчна намеса за текст на френски.
Специалните символи на LaTeX автоматично ли се екранират?
да Знаците, които имат значение в LaTeX (%, &, $, #, _, {, }, ~, ^, \), се екранират автоматично по време на конвертирането. HTML текст, съдържащ 50% отстъпка или потребителско име, се превежда правилно, без да нарушава компилацията.
Моят HTML използва изображения: включени ли са в .tex?
Таговете се преобразуват в \includegraphics{} с пакета graphicx, но самите изображения не са вградени в .tex, тъй като LaTeX препраща към локални файлове. Изтеглете изображенията поотделно и ги поставете до .tex преди компилиране или коригирайте пътя в \graphicspath.
Как да обработвам HTML с математически уравнения?
Ако вашите уравнения вече са вградени в MathML или LaTeX (например $E = mc^2$), конверторът ги предава почти такива, каквито са към изхода. Уравненията, изобразени като изображения (PNG, SVG), не се конвертират автоматично обратно в LaTeX. За безупречно математическо изобразяване, напишете формулите в LaTeX в HTML източника, преамбюлът вече зарежда amsmath и amssyb.
Гарантирано ли е, че генерираният .tex може да бъде компилиран?
За стандартен HTML (параграфи, заглавия, списъци, вградено форматиране, връзки, прости таблици), да. Ако вашият HTML съдържа екзотични тагове, вграден JavaScript, сложен CSS или нестандартни вложени структури, може да е необходимо да коригирате .tex преди компилиране. Отворете го в Overleaf или TeXstudio, за да забележите бързо всички предупреждения.
Пример за заявка
curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
-H "Content-Type: application/json" \
-d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'
Входна схема
| Поле | Тип | Задължително | По подразбиране |
|---|---|---|---|
content |
string | ✓ | – |
type |
choice (letter, article) | ✓ | – |
city |
string | ✓ | – |
object |
string | ✓ | – |
opening |
string | ✓ | – |
closing |
string | ✓ | – |
sender_address |
text | ✓ | – |
recipient_address |
text | ✓ | – |
recipient_name |
string | ✓ | – |
sender_name |
string | ✓ | – |
sender_phone |
string | ✓ | – |
sender_mail |
string | ✓ | – |
Крайни точки
GET https://cdrn.fr/api/v1/tools- изброява всички достъпни инструментиGET https://cdrn.fr/api/v1/tools/html-to-latex-converter- извлича схемата на този инструментPOST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute- изпълнява този инструмент с JSON payload