Μετατροπή HTML σε LaTeX και δημιουργία PDF

Μετατρέπει εύκολα κείμενο HTML σε LaTeX, δημιουργώντας ταυτόχρονα ένα επαγγελματικό αρχείο PDF. Υποστηρίζει διάφορες μορφές εγγράφων LaTeX, όπως άρθρα και επιστολές, και χειρίζεται κοινά HTML tags. Ιδανικό για χρήστες που επιθυμούν υψηλής ποιότητας απόδοση των εγγράφων τους.

Γιατί να μετατρέψετε HTML σε LaTeX;

Η μετατροπή HTML σε LaTeX σάς επιτρέπει να παράγετε PDF επαγγελματικής ποιότητας από περιεχόμενο που έχει ήδη γραφτεί στον Ιστό: άρθρα από ένα CMS, τεκμηρίωση που δημιουργείται μόνοι σας, αναρτήσεις ιστολογίου, εξαγωγές wiki ή σημειώσεις που έχουν ληφθεί σε πρόγραμμα επεξεργασίας WYSIWYG. Αντί για μη αυτόματη αναμετάδοση, αυτός ο μετατροπέας HTML σε LaTeX παίρνει την πηγή HTML και παράγει ένα αρχείο .tex που μπορεί να μεταγλωττιστεί σε PDF.

Τυπικές χρήσεις: μετατροπή ενός προσχέδιο γραμμένου σε Notion ή Markdown (που εξάγεται σε HTML) σε επιστημονικό άρθρο, μετατροπή μιας ιστοσελίδας σε εκτυπώσιμο φυλλάδιο, δημιουργία επιστολής ή βιογραφικού από ένα πρόγραμμα επεξεργασίας HTML. Η μετατροπή html σε λατέξ αποφεύγει την επανεγγραφή της μορφοποίησης και εγγυάται μια ομοιογενή τυπογραφική απόδοση.

Γιατί LaTeX αντί για άμεση εξαγωγή PDF;

Η εκτύπωση μιας σελίδας HTML σε PDF από το πρόγραμμα περιήγησης είναι γρήγορη, αλλά το αποτέλεσμα σπάνια είναι τόσο καλό όσο μια δημοσίευση. Η χρήση του LaTeX έχει πολλά αποφασιστικά πλεονεκτήματα:

  • Επαγγελματική τυπογραφία: αποτύπωση, συλλαβισμός, αιτιολόγηση, αυτόματη διαχείριση χήρων και ορφανών, βιβλιογραφία μέσω BibTeX/BibLaTeX, συνεπής αρίθμηση ενοτήτων, σχημάτων και εξισώσεων.
  • Αναπαραγώγιμα έγγραφα: Το .tex είναι ένα αρχείο κειμένου με δυνατότητα έκδοσης που επαναμεταγλωττίζεται με τον ίδιο τρόπο. Ιδανικό για έρευνα, τεκμηρίωση λογισμικού ή οποιαδήποτε ροή εργασίας όπου έχει σημασία η αναπαραγωγιμότητα.
  • Ακαδημαϊκό πρότυπο: Το LaTeX παραμένει η μορφή που αναμένεται από την πλειονότητα των επιστημονικών περιοδικών, συνεδρίων και πανεπιστημιακών διατριβών.
  • Δυνατότητα λεπτής επεξεργασίας: εάν η απόδοση που δημιουργείται δεν σας ταιριάζει 100%, ανοίξτε το .tex στο Overleaf, TeXstudio ή VS Code και προσαρμόστε. Διατηρείτε τον έλεγχο, σε αντίθεση με ένα παγωμένο PDF.

Τυπικές περιπτώσεις χρήσης

  • Επιστημονικά άρθρα: ένα προσχέδιο γραμμένο στον ιστό, μετατροπή html σε λατέξ, τελειοποίηση στο Overleaf, υποβολή στο περιοδικό.
  • Γράμματα και βιογραφικά: μεταβείτε από ένα πρόγραμμα επεξεργασίας HTML (πλούσιο, οπτικό) σε ένα γράμμα LaTeX με άψογη απόδοση, έτοιμο για εκτύπωση.
  • Τεχνική τεκμηρίωση: δημιουργήστε ένα PDF αναφοράς από ένα υπάρχον έγγραφο HTML (Sphinx, MkDocs, wiki), χωρίς να αντιγράψετε την πηγή.
  • Σημειώσεις Έννοια / Σημείωση: εξαγωγή σε HTML και μετά περάστε από το html2latex για να αποκτήσετε ένα δομημένο εκτυπώσιμο έγγραφο.
  • Εταιρικές αναφορές: μετατρέψτε μια αναφορά γραμμένη σε εσωτερικό CMS σε πληκτρολογημένο παραδοτέο PDF.

Πώς λειτουργεί ο μετατροπέας HTML σε LaTeX;

Ο μετατροπέας αναλύει την πηγή HTML σας, προσδιορίζει κάθε ετικέτα και την αντιστοιχίζει στην αντίστοιχη εντολή LaTeX. Συγκεκριμένα:

Πώς να χρησιμοποιήσετε το εργαλείο

Τέσσερα βήματα για τη μετατροπή HTML σε LaTeX:

  1. Επικολλήστε τον κώδικα HTML στο πεδίο που παρέχεται.
  2. Επιλέξτε τον τύπο εγγράφου εξόδου (άρθρο, επιστολή, βιβλίο).
  3. Κάντε κλικ στο κουμπί μετατροπής. Δημιουργείται το αρχείο .tex και η απόδοση PDF του.
  4. Κατεβάστε το .tex για να το επεξεργαστείτε στο πρόγραμμα επεξεργασίας LaTeX ή απευθείας στο PDF.

Αντιστοιχίσεις πλήκτρων HTML σε LaTeX

<κεφάλι>
HTML LaTeX Σημειώσεις

\section{} Niveau 1

\subsection{} Niveau 2

\subsubsection{} Niveau 3
extbf{} Γκράς
έξοδος{} Italique
\underline{} Souligné
exttt{} Μονοδιάστημα της αστυνομίας
egin{itemize} Καταγραφή à puces
egin{enumerate} Λίστα αριθμών
  • \item Élément de list
    \href{...}{...} Απαραίτητο \usepackage{hyperref}
    egin{quote} Αναφορά

    παράγραφος Δείτε τις εισαγωγικές παραγράφους

    \ Saut de ligne

    Παράδειγμα μετατροπής HTML σε LaTeX

    Πηγή HTML:

    
    

    Κύριος τίτλος

    Αυτή είναι μια παράγραφος με έντονους και πλάγιους χαρακτήρες.

    Υποενότητα

    Αποτέλεσμα LaTeX:

    
    \documentclass{article}
    \usepackage[utf8]{inputenc}
    \usepackage[γαλλικά]{babel}
    \usepackage{hyperref}
    \usepackage{amsmath}
    \usepackage{amsymb}
    egin{document}
    \section{Κύριος τίτλος}
    Αυτή είναι μια παράγραφος με extbf{bold} και extit{italics}.
    
    \subsection{Subsection}
    egin{itemize}
        \item Στοιχείο ένα
        \item Στοιχείο δύο με \href{https://cdrn.fr}{a σύνδεσμο}
    nd{itemize}
    nd{document}
    
    

    FAQ

    Ποιο μάθημα LaTeX να επιλέξετε: άρθρο, επιστολή ή βιβλίο;

    Το article είναι κατάλληλο για τις περισσότερες περιπτώσεις (έκθεση, άρθρο, σύντομο σημείωμα). Το γράμμα είναι αφιερωμένο στην αλληλογραφία (κεφαλίδα, υπογραφή, ευγενικές εκφράσεις). Το book δομεί μεγάλα έγγραφα σε κεφάλαια και περιλαμβάνει αναλυτικό πίνακα περιεχομένων. Εάν έχετε αμφιβολίες, μεταβείτε στο article.

    Είναι εγγυημένη η μεταγλώττιση του PDF που δημιουργείται;

    Για τυπικό HTML (παράγραφοι, τίτλοι, λίστες, ενσωματωμένη μορφοποίηση, σύνδεσμοι), ναι. Εάν το HTML σας περιέχει εξωτικές ετικέτες, ενσωματωμένη JavaScript ή μη τυπικές ένθετες δομές, μπορεί να είναι απαραίτητο να προσαρμόσετε μη αυτόματα το .tex πριν από τη μεταγλώττιση.

    Το HTML μου χρησιμοποιεί εικόνες: περιλαμβάνονται;

    Οι ετικέτες μετατρέπονται σε \includegraphics{} με το πακέτο graphicx, αλλά οι ίδιες οι εικόνες δεν είναι ενσωματωμένες στο .tex (τοπική αναφορά αρχείου LaTeX). Κατεβάστε τις εικόνες ξεχωριστά και τοποθετήστε τις δίπλα στο .tex πριν από τη μεταγλώττιση.

    Γιατί να μην κάνετε Markdown απευθείας στο LaTeX;

    Το Pandoc κάνει πολύ καλά το Markdown στο LaTeX. Ο μετατροπέας μας στοχεύει συγκεκριμένα την HTML, η οποία καλύπτει πηγές στις οποίες δεν προσεγγίζει το Markdown: εξαγωγές CMS, ιστοσελίδες, περιεχόμενο γραμμένο σε επεξεργαστές WYSIWYG, έξοδος από γεννήτριες εγγράφων. Εάν η πηγή σας βρίσκεται ήδη σε Markdown, εξάγετε την σε HTML και, στη συνέχεια, μεταβείτε εδώ ή χρησιμοποιήστε απευθείας το Pandoc.

    Η απόδοση LaTeX υποστηρίζει UTF-8 και τόνους;

    Ναι. Το προοίμιο περιλαμβάνει τα \usepackage[utf8]{inputenc} και \usepackage[french]{babel}, τα οποία διασφαλίζουν τη σωστή απόδοση των τονισμών, του cedilla και των γαλλικών τυπογραφικών κανόνων (μη σπασμένα κενά πριν από διπλή στίξη, γαλλικά εισαγωγικά).

    Και το αντίθετο, LaTeX σε HTML;

    Η μετατροπή λατέξ σε html είναι μια άλλη άσκηση (το LaTeX είναι πολύ πιο εκφραστικό από το HTML, ειδικά για εξισώσεις). Για αυτό το νόημα, δείτε τα pandoc, htlatex ή LaTeXML. Αυτό το εργαλείο κάνει μόνο html σε λατέξ, προς μία μόνο κατεύθυνση.

    Συχνές ερωτήσεις

    Ποια τάξη LaTeX να επιλέξετε: article, γράμμα ή βιβλίο;

    Το article είναι κατάλληλο για τις περισσότερες περιπτώσεις (σύντομη αναφορά, ανάρτηση, υπόμνημα, επιστημονικό άρθρο). Το letter είναι αφιερωμένο στην αλληλογραφία με ενσωματωμένη κεφαλίδα, υπογραφή και ευγενικές εκφράσεις. Το book δομεί μεγάλα έγγραφα σε κεφάλαια και περιλαμβάνει αναλυτικό πίνακα περιεχομένων. Εάν έχετε αμφιβολίες, ακολουθήστε το article: είναι η πιο καθολική κατηγορία.

    Οι γαλλικοί τόνοι και χαρακτήρες αποδίδονται σωστά;

    Ναι. Το προοίμιο που δημιουργείται περιλαμβάνει τα \usepackage[utf8]{inputenc} και \usepackage[french]{babel}, τα οποία διασφαλίζουν τη σωστή απόδοση τονισμών, cedilla και γαλλικών τυπογραφικών κανόνων: μη σπασμένα κενά πριν από διπλή στίξη, γαλλικά εισαγωγικά, σωστά. Δεν απαιτείται χειροκίνητη παρέμβαση για ένα κείμενο στα γαλλικά.

    Διαφεύγουν αυτόματα οι ειδικοί χαρακτήρες του LaTeX;

    Ναι. Οι χαρακτήρες που έχουν νόημα στο LaTeX (%, &, $, #, _, {, }, ~, $, #, _, {, }, ~, ~, , είναι αυτόματα κατά τη διάρκεια του ^) μετατροπής. Το κείμενο HTML που περιέχει 50% έκπτωση ή όνομα χρήστη μεταφράζεται σωστά χωρίς διακοπή της μεταγλώττισης.

    Το HTML μου χρησιμοποιεί εικόνες: περιλαμβάνονται στο .tex;

    Οι ετικέτες μετατρέπονται σε \includegraphics{} με το πακέτο graphicx, αλλά οι ίδιες οι εικόνες δεν είναι ενσωματωμένες στο .tex επειδή το LaTeX αναφέρεται σε τοπικά αρχεία. Κατεβάστε τις εικόνες ξεχωριστά και τοποθετήστε τις δίπλα στο .tex πριν από τη μεταγλώττιση ή προσαρμόστε τη διαδρομή στο \graphicspath.

    Πώς να επεξεργαστείτε HTML με μαθηματικές εξισώσεις;

    Εάν οι εξισώσεις σας είναι ήδη σε MathML ή LaTeX inline (για παράδειγμα $E = mc^2$), ο μετατροπέας τις μεταδίδει σχεδόν όπως είναι στην έξοδο. Οι εξισώσεις που αποδίδονται ως εικόνες (PNG, SVG) δεν μετατρέπονται αυτόματα σε LaTeX. Για άψογη μαθηματική απόδοση, γράψτε τους τύπους σε LaTeX στην πηγή HTML, το προοίμιο φορτώνει ήδη τα amsmath και amssyb.

    Είναι εγγυημένο ότι το .tex που δημιουργείται είναι μεταγλωττιζόμενο;

    Για τυπικό HTML (παράγραφοι, επικεφαλίδες, λίστες, ενσωματωμένη μορφοποίηση, σύνδεσμοι, απλοί πίνακες), ναι. Εάν το HTML σας περιέχει εξωτικές ετικέτες, ενσωματωμένη JavaScript, σύνθετες CSS ή μη τυπικές ένθετες δομές, μπορεί να είναι απαραίτητο να προσαρμόσετε το .tex πριν από τη μεταγλώττιση. Ανοίξτε το στο Overleaf ή στο TeXstudio για να εντοπίσετε γρήγορα τυχόν προειδοποιήσεις.

    Παράδειγμα αιτήματος

    curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
      -H "Content-Type: application/json" \
      -d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'

    Σχήμα εισόδου

    Πεδίο Τύπος Απαιτείται Προεπιλογή
    content string
    type choice (letter, article)
    city string
    object string
    opening string
    closing string
    sender_address text
    recipient_address text
    recipient_name string
    sender_name string
    sender_phone string
    sender_mail string

    Σημεία πρόσβασης

    • GET https://cdrn.fr/api/v1/tools - εμφανίζει όλα τα διαθέσιμα εργαλεία
    • GET https://cdrn.fr/api/v1/tools/html-to-latex-converter - ανακτά το σχήμα αυτού του εργαλείου
    • POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute - εκτελεί αυτό το εργαλείο με payload JSON

    CDRN - δημιουργήθηκε από ARDNTECH