Paversti HTML į LaTeX ir generuoti PDF

Lengvai paverčia HTML tekstą į LaTeX, kartu generuodamas profesionalų PDF failą. Jis palaiko įvairius LaTeX dokumentų formatus, pvz., straipsnius ir laiškus, ir tvarko bendrus HTML žymes. Idealu vartotojams, norintiems aukštos kokybės savo dokumentų atvaizdavimo.

Kodėl konvertuoti HTML į LaTeX?

HTML konvertavimas į LaTeX leidžia kurti profesionalios kokybės PDF failus iš turinio, jau parašyto žiniatinklyje: straipsnių iš TVS, savarankiškai sukurtos dokumentacijos, tinklaraščio įrašų, wiki eksporto ar pastabų, padarytų WYSIWYG redaktoriuje. Užuot perdavęs rankiniu būdu, šis HTML į LaTeX keitiklis paima jūsų HTML šaltinį ir sukuria .tex failą, kurį galima sukompiliuoti į PDF.

Įprasti naudojimo būdai: paverskite juodraštį, parašytą „Notion“ arba „Markdown“ (eksportuotu HTML formatu), į mokslinį straipsnį, paverskite tinklalapį spausdinamu bukletu, sugeneruokite laišką arba CV iš HTML redaktoriaus. Konvertuojant html į lateksą išvengiama formatavimo perrašymo ir garantuojamas vienalytis tipografinis atvaizdavimas.

Kodėl LaTeX, o ne tiesioginis PDF eksportas?

HTML puslapio spausdinimas į PDF iš naršyklės yra greitas, tačiau rezultatas retai būna toks geras kaip publikacija. LaTeX naudojimas suteikia keletą lemiamų pranašumų:

  • Profesionali tipografija: šerdis, brūkšnelis, pagrindimas, automatiškai valdomos našlės ir našlaičiai, bibliografija naudojant BibTeX / BibLaTeX, nuoseklus skyrių, paveikslų ir lygčių numeravimas.
  • Atkuriami dokumentai: .tex yra tekstinis failas su versijomis, kuris perkompiliuojamas identiškai. Idealiai tinka tyrimams, programinės įrangos dokumentacijai ar bet kokiai darbo eigai, kur svarbu atkuriamumas.
  • Akademinis standartas: LaTeX išlieka formatu, kurio tikimasi daugumos mokslinių žurnalų, konferencijų ir universitetų disertacijų.
  • Galimas smulkus redagavimas: jei sugeneruotas vaizdas jums netinka 100%, atidarykite .tex „Overleaf“, „TeXstudio“ arba „VS Code“ ir pakoreguokite. Jūs išlaikote kontrolę, kitaip nei užšaldytas PDF failas.

Tipiški naudojimo atvejai

  • Moksliniai straipsniai: juodraštis, parašytas žiniatinklyje, konvertuoti HTML į lateksą, patikslinti kitoje lape, pateikti žurnalui.
  • Laiškai ir CV: pereikite nuo HTML redaktoriaus (raiškios, vaizdinės) į nepriekaištingai pateiktą LaTeX laišką, paruoštą spausdinti.
  • Techninė dokumentacija: generuokite nuorodos PDF iš esamo HTML dokumento (Sphinx, MkDocs, wiki), nedubliuodami šaltinio.
  • Pastabų sąvoka / žymėjimas: eksportuokite į HTML, tada pereikite per html2latex, kad gautumėte struktūrinį spausdinamą dokumentą.
  • Bendrovės ataskaitos: paverskite ataskaitą, parašytą vidinėje TVS, į atspausdintą PDF pristatymą.

Kaip veikia mūsų HTML į LaTeX konverteris?

Konverteris analizuoja jūsų HTML šaltinį, identifikuoja kiekvieną žymą ir susieja ją su lygiaverte LaTeX komanda. Konkrečiai:

Kaip naudotis įrankiu

Keturi žingsniai konvertuoti HTML į LaTeX:

  1. Įklijuokite HTML kodą į pateiktą lauką.
  2. Pasirinkite išvesties dokumento tipą (straipsnis, laiškas, knyga).
  3. Spustelėkite konvertavimo mygtuką. Sugeneruojamas .tex failas ir jo PDF atvaizdavimas.
  4. Atsisiųskite .tex ir redaguokite jį LaTeX rengyklėje arba PDF tiesiogiai.

HTML į LaTeX raktų susiejimas

HTML LaTeX Pastabos

\section{} 1 lygis

\subsection{} 2 lygis

\subsubsection{} 3 lygis
extbf{} Paryškintas
išeiti{} Išsyvus
\underline{} Pabraukta
exttt{} Miniveno šriftas
egin{itemize} Ženklų sąrašas
egin{enumerate} Sunumeruotas sąrašas
  • \item Sąrašo elementas
    \href{...}{...} Reikalingas \usepackage{hyperref}
    egin{quote} Citata

    pastraipa Tuščia eilutė tarp pastraipų

    \ Line break

    HTML konvertavimo į LaTeX pavyzdys

    HTML šaltinis:

    
    

    Pagrindinis pavadinimas

    Tai pastraipa su pusjuodžiu ir kursyvu.

    Poskyris

    LaTeX rezultatas:

    
    \documentclass{straipsnis}
    \usepackage[utf8]{inputenc}
    \usepackage[pranc.]{babel}
    \usepackage{hyperref}
    \usepackage{amsmath}
    \usepackage{amsymb}
    egin{document}
    \section{Pagrindinis pavadinimas}
    Tai pastraipa su extbf{bold} ir extit{italics}.
    
    \subsection{Subsection}
    egin{itemize}
        \item Pirmas elementas
        \item Antrasis elementas su \href{https://cdrn.fr}{a nuoroda}
    nd{itemize}
    nd{document}
    
    

    DUK

    Kokią LaTeX klasę pasirinkti: straipsnį, laišką ar knygą?

    straipsnis tinka daugeliu atvejų (ataskaita, straipsnis, trumpa atmintis). laiškas skirtas susirašinėjimui (antraštė, parašas, mandagūs posakiai). knyga suskirsto ilgus dokumentus į skyrius ir pateikia išsamų turinį. Jei abejojate, eikite į straipsnį.

    Ar garantuojama, kad sugeneruotą PDF bus galima kompiliuoti?

    Standartiniam HTML (pastraipos, pavadinimai, sąrašai, tiesioginis formatavimas, nuorodos) taip. Jei jūsų HTML yra egzotiškų žymų, įterptųjų „JavaScript“ arba nestandartinių įdėtųjų struktūrų, prieš kompiliuojant gali tekti rankiniu būdu pakoreguoti .tex.

    Mano HTML naudojami vaizdai: ar jie įtraukti?

    Žymos konvertuojamos į \includegraphics{} naudojant graphicx paketą, tačiau patys vaizdai nėra įterpti į .tex (LaTeX vietinio failo nuoroda). Atsisiųskite vaizdus atskirai ir prieš kompiliuodami padėkite juos šalia .tex.

    Kodėl nepažymėjus LaTeX tiesiogiai?

    Pandoc labai gerai atlieka Markdown į LaTeX. Mūsų konverteris konkrečiai taikomas HTML, kuris apima šaltinius, kurių Markdown nepasiekia: TVS eksportą, tinklalapius, WYSIWYG redaktoriuose parašytą turinį, dokumentų generatorių išvestį. Jei jūsų šaltinis jau yra Markdown, eksportuokite jį į HTML, tada eikite čia arba naudokite „Pandoc“ tiesiogiai.

    Ar LaTeX atvaizdavimas palaiko UTF-8 ir diakritinius ženklus?

    Taip. Preambulėje yra \usepackage[utf8]{inputenc} ir \usepackage[french]{babel}, užtikrinantis teisingą kirčių atvaizdavimą, cedilla ir prancūzų tipografijos taisyklės (nepertraukiami tarpai prieš dvigubus skyrybos ženklus, prancūziškos kabutės).

    O priešingai, LaTeX HTML?

    Latekso konvertavimas į html yra dar vienas pratimas (LaTeX yra daug išraiškingesnis nei HTML, ypač lygtims). Norėdami sužinoti šią reikšmę, žiūrėkite pandoc, htlatex arba LaTeXML. Šis įrankis sujungia html į lateksą tik viena kryptimi.

    Dažnai užduodami klausimai

    Kokią LaTeX klasę pasirinkti: straipsnį, laišką ar knygą?

    straipsnis tinka daugeliu atvejų (trumpas pranešimas, pranešimas, atmintinė, mokslinis straipsnis). laiškas skirtas susirašinėjimui su integruota antrašte, parašu ir mandagumo posakiais. knyga suskirsto ilgus dokumentus į skyrius ir pateikia išsamų turinį. Jei abejojate, naudokite straipsnį: tai pati universaliausia klasė.

    Ar prancūzų kalbos akcentai ir simboliai pateikiami teisingai?

    Taip. Sugeneruota preambulė apima \usepackage[utf8]{inputenc} ir \usepackage[prancūzų kalba]{babel}, kuri užtikrina teisingą kirčių atvaizdavimą, cedilla ir prancūzų tipografijos taisykles: nelaužomi tarpai prieš dvigubus skyrybos ženklus, prancūziškos kabutės, teisingi brūkšneliai. Tekstui prancūzų kalba rankinio įsikišimo nereikia.

    Ar LaTeX specialieji simboliai automatiškai pašalinami?

    Taip. Simboliai, turintys reikšmę LaTeX (%, &, $, #, _, {, }, ~, ^, \), konvertuojant automatiškai pašalinami. HTML tekstas, kuriame yra 50 % nuolaida arba naudotojo vardas, verčiamas teisingai, nepažeidžiant kompiliacijos.

    Mano HTML naudojami vaizdai: ar jie įtraukti į .tex?

    Žymos konvertuojamos į \includegraphics{} naudojant graphicx paketą, tačiau patys vaizdai nėra įterpiami į .tex, nes LaTeX nurodo vietinius failus. Atsisiųskite vaizdus atskirai ir prieš kompiliuodami padėkite juos šalia .tex arba pakoreguokite kelią \graphicspath.

    Kaip apdoroti HTML naudojant matematines lygtis?

    Jei jūsų lygtys jau yra įtrauktos į MathML arba LaTeX (pvz., $E = mc^2$), keitiklis jas perduoda beveik taip, kaip išvestis. Lygtys, pateiktos kaip vaizdai (PNG, SVG), nėra automatiškai konvertuojamos atgal į LaTeX. Dėl nepriekaištingo matematinio atvaizdavimo HTML šaltinyje rašykite formules LaTeX, preambulė jau įkelia amsmath ir amssyb.

    Ar garantuojama, kad sugeneruotą .tex bus galima kompiliuoti?

    Standartiniam HTML (pastraipos, antraštės, sąrašai, tiesioginis formatavimas, nuorodos, paprastos lentelės) taip. Jei jūsų HTML yra egzotiškų žymų, įterptųjų „JavaScript“, sudėtingų CSS arba nestandartinių įdėtųjų struktūrų, prieš kompiliuojant gali reikėti pakoreguoti .tex. Atidarykite jį Overleaf arba TeXstudio, kad greitai pastebėtumėte visus įspėjimus.

    Užklausos pavyzdys

    curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
      -H "Content-Type: application/json" \
      -d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'

    Įvesties schema

    Laukas Tipas Privalomas Numatytasis
    content string
    type choice (letter, article)
    city string
    object string
    opening string
    closing string
    sender_address text
    recipient_address text
    recipient_name string
    sender_name string
    sender_phone string
    sender_mail string

    Galiniai taškai

    • GET https://cdrn.fr/api/v1/tools - išvardija visus galimus įrankius
    • GET https://cdrn.fr/api/v1/tools/html-to-latex-converter - gauna šio įrankio schemą
    • POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute - vykdo šį įrankį su JSON payload