Конвертувати LaTeX у HTML

конвертує ваш LaTeX-вихідний код у HTML, ідеально для публікації ваших статей, рівнянь та академічних документів в Інтернеті

Що таке LaTeX?

LaTeX — система набору документів, широко використовувана в наукових, академічних і технічних колах. Винайдений Леслі Лемпортом на початку 1980-х, він ґрунтується на типографічному рушії TeX Дональда Кнута. Замість написання документа у WYSIWYG-редакторі (як Word), автор описує логічну структуру вмісту за допомогою команд: \section{Вступ}, \textbf{важливо}, \begin{itemize}... Компілятор потім виробляє PDF чудової типографічної якості, особливо підходящий для математичних формул, наукових статей і довгих видань.

Якщо LaTeX є незамінним для виробництва академічних PDF, він практично несумісний з вебом: браузер не читає LaTeX, він читає HTML. Наш інструмент LaTeX до HTML відповідає саме на цю потребу: взяти фрагмент LaTeX-джерела і відтворити його у HTML, що безпосередньо інтегрується в блог, CMS, веб-сторінку або електронний лист.

Зворотна операція нашого HTML у LaTeX

Наш набір інструментів вже пропонує конвертер HTML у LaTeX, який бере HTML і виробляє PDF через pdflatex. Цей інструмент є зворотною операцією: з LaTeX у HTML. Обидва інструменти використовуються разом у редакційних ланцюжках:

  • Ви пишете наукову статтю у LaTeX, хочете опублікувати її веб-версію: LaTeX у HTML.
  • Ви отримуєте HTML-текст з CMS, хочете зробити з нього охайний академічний PDF: HTML у LaTeX.
  • Ви хочете підтримувати єдине LaTeX-джерело і публікувати його у PDF + веб-сторінка: комбінуйте обидва інструменти або використовуйте LaTeX у HTML для генерації веб-версії.

Зіставлення LaTeX у HTML

Наш конвертер розпізнає поширені команди LaTeX та застосовує таке зіставлення:

  • \section{Заголовок} і \section*{Заголовок}<h1>Заголовок</h1>
  • \subsection{Заголовок}<h2>Заголовок</h2>
  • \subsubsection{Заголовок}<h3>Заголовок</h3>
  • \paragraph{Заголовок}<h4>Заголовок</h4>
  • \textbf{x}<strong>x</strong>
  • \textit{x} і \emph{x}<em>x</em>
  • \underline{x}<u>x</u>
  • \texttt{x}<code>x</code>
  • \begin{itemize} \item ... \end{itemize}<ul><li>...</li></ul>
  • \begin{enumerate} \item ... \end{enumerate}<ol><li>...</li></ol>
  • \begin{quote} ... \end{quote}<blockquote>...</blockquote>
  • Порожні рядки між абзацами → <p>...</p>
  • \\ і \newline<br>
  • Екрановані символи \&, \%, \$, \#, \_, \{, \} → відповідні символи
  • Преамбула (\documentclass, \usepackage, \begin{document}, \end{document}) → мовчки видаляється

Приклад використання

Вихідний LaTeX:

\section*{Вступ}
Ось \textbf{приклад} документа зі списком:

\begin{itemize}
\item перший пункт
\item другий пункт
\end{itemize}

І \textit{цитата} на завершення.

Результат HTML:

<h1>Вступ</h1>
<p>Ось <strong>приклад</strong> документа зі списком:</p>
<ul><li>перший пункт</li><li>другий пункт</li></ul>
<p>І <em>цитата</em> на завершення.</p>

Випадки використання

  • Міграція дисертації на блог: ви написали дисертацію у LaTeX, хочете публікувати розділи на своєму блозі або особистому сайті. Конвертер виконує основну роботу, вам залишається лише відшліфувати кінцеве форматування.
  • Вилучення вмісту з наукової статті: перевиданнявступу, анотації або висновку наявної LaTeX-статті для веб-сторінки (сторінка проекту, комунікація лабораторії).
  • Підготовка навчальних матеріалів: курс, написаний у LaTeX, може бути перенесений у HTML для наповнення Moodle, вікі або e-learning платформи.
  • Технічна документація: перетворення технічної LaTeX-нотатки у HTML для поширення на Confluence, GitHub Pages або інтранеті.
  • Швидкий перегляд: перегляд того, як виглядатиме фрагмент LaTeX у HTML, без запуску повної компіляції pdflatex.

Обмеження

Наш конвертер свідомо прагматичний: він охоплює 90% поширених випадків з простою реалізацією, не претендуючи на вичерпне охоплення всього синтаксису LaTeX. Конкретно:

  • Немає складних математичних формул. Вирази $x^2$ і \begin{equation}...\end{equation} зберігаються як є. Для математичного веб-відображення інтегруйте MathJax або KaTeX у свою сторінку.
  • Немає рисунків, таблиць або бібліографій. Команди \includegraphics, \begin{table}, \bibliography не перекладаються.
  • Немає користувацьких макросів. \newcommand{\моятфункція} не інтерпретується: конвертер розпізнає лише стандартні команди LaTeX.
  • Мінімальний стиль. Вивід є семантичним HTML без вбудованого CSS: ви можете додати власну таблицю стилів.

Для більш складних конвертацій такі інструменти, як Pandoc, покривають більшу поверхню LaTeX. Наш інструмент орієнтований на поширену потребу: швидко отримати чистий HTML з фрагмента LaTeX без встановлення програмного забезпечення.

Як користуватися конвертером

  1. Вставте ваш LaTeX-джерело у текстове поле (фрагмент або повний документ, преамбула буде проігнорована).
  2. Натисніть конвертувати.
  3. Ви отримуєте відповідний HTML: скопіюйте його у свій редактор, CMS або статичний файл.
  4. Для зворотної операції скористайтеся нашим конвертером HTML у LaTeX.

Часті запитання

Чи обробляє конвертер математичні формули?

Математичний LaTeX ($x^2 + y^2$, \begin{equation}) зберігається як є у виводі HTML. Для візуального відображення додайте MathJax або KaTeX до своєї веб-сторінки: ці бібліотеки відображають математичний LaTeX на стороні браузера.

Мої користувацькі команди (\newcommand) не перекладаються, чому?

Конвертер не виконує рушій TeX, він виконує синтаксичне зіставлення. Макрос, визначений через \newcommand, не розгортається. Перед конвертацією замініть свої макроси їх явними визначеннями або використовуйте Pandoc, що має більш повний парсер.

Чи є преамбула LaTeX обов'язковою у вхідних даних?

Ні. Ви можете вставити фрагмент без \documentclass або \begin{document}. Якщо ваше джерело містить повну преамбулу, вона все одно ігнорується: конвертується лише корисний вміст.

Чи правильно обробляються наголошені символи?

Так, за умови що ваше LaTeX-джерело в UTF-8 (з або без \usepackage[utf8]{inputenc}). Старі LaTeX-нотації, як \'e для é, явно не перекладаються, надавайте перевагу прямому UTF-8.

Чи надсилаються і зберігаються мої дані?

LaTeX обробляється на стороні сервера під час конвертації, а потім результат надсилається до вашого браузера. Жодні дані не зберігаються, не індексуються і не передаються.

Чому отримувати HTML, а не PDF?

HTML є нативним форматом вебу: сторінки, блоги, електронні листи, CMS. Якщо ваша кінцева потреба — PDF, скористайтеся натомість нашим конвертером HTML у LaTeX, який виробляє PDF через pdflatex.

Приклад запиту

curl -X POST https://cdrn.fr/api/v1/tools/latex-to-html-converter/execute \
  -H "Content-Type: application/json" \
  -d '{"latex":"..."}'

Схема вхідних даних

Поле Тип Обов'язкове За замовчуванням
latex text

Точки доступу

  • GET https://cdrn.fr/api/v1/tools - перелічує всі доступні інструменти
  • GET https://cdrn.fr/api/v1/tools/latex-to-html-converter - отримує схему цього інструменту
  • POST https://cdrn.fr/api/v1/tools/latex-to-html-converter/execute - виконує цей інструмент з JSON-payload