Μετατροπή HTML σε LaTeX και δημιουργία PDF
- Πίνακας ελέγχου
- Τεκμηρίωση
- API
Γιατί να μετατρέψετε HTML σε LaTeX;
Η μετατροπή HTML σε LaTeX σάς επιτρέπει να παράγετε PDF επαγγελματικής ποιότητας από περιεχόμενο που έχει ήδη γραφτεί στον Ιστό: άρθρα από ένα CMS, τεκμηρίωση που δημιουργείται μόνοι σας, αναρτήσεις ιστολογίου, εξαγωγές wiki ή σημειώσεις που έχουν ληφθεί σε πρόγραμμα επεξεργασίας WYSIWYG. Αντί για μη αυτόματη αναμετάδοση, αυτός ο μετατροπέας HTML σε LaTeX παίρνει την πηγή HTML και παράγει ένα αρχείο .tex που μπορεί να μεταγλωττιστεί σε PDF.
Τυπικές χρήσεις: μετατροπή ενός προσχέδιο γραμμένου σε Notion ή Markdown (που εξάγεται σε HTML) σε επιστημονικό άρθρο, μετατροπή μιας ιστοσελίδας σε εκτυπώσιμο φυλλάδιο, δημιουργία επιστολής ή βιογραφικού από ένα πρόγραμμα επεξεργασίας HTML. Η μετατροπή html σε λατέξ αποφεύγει την επανεγγραφή της μορφοποίησης και εγγυάται μια ομοιογενή τυπογραφική απόδοση.
Γιατί LaTeX αντί για άμεση εξαγωγή PDF;
Η εκτύπωση μιας σελίδας HTML σε PDF από το πρόγραμμα περιήγησης είναι γρήγορη, αλλά το αποτέλεσμα σπάνια είναι τόσο καλό όσο μια δημοσίευση. Η χρήση του LaTeX έχει πολλά αποφασιστικά πλεονεκτήματα:
- Επαγγελματική τυπογραφία: αποτύπωση, συλλαβισμός, αιτιολόγηση, αυτόματη διαχείριση χήρων και ορφανών, βιβλιογραφία μέσω BibTeX/BibLaTeX, συνεπής αρίθμηση ενοτήτων, σχημάτων και εξισώσεων.
- Αναπαραγώγιμα έγγραφα: Το
.texείναι ένα αρχείο κειμένου με δυνατότητα έκδοσης που επαναμεταγλωττίζεται με τον ίδιο τρόπο. Ιδανικό για έρευνα, τεκμηρίωση λογισμικού ή οποιαδήποτε ροή εργασίας όπου έχει σημασία η αναπαραγωγιμότητα. - Ακαδημαϊκό πρότυπο: Το LaTeX παραμένει η μορφή που αναμένεται από την πλειονότητα των επιστημονικών περιοδικών, συνεδρίων και πανεπιστημιακών διατριβών.
- Δυνατότητα λεπτής επεξεργασίας: εάν η απόδοση που δημιουργείται δεν σας ταιριάζει 100%, ανοίξτε το
.texστο Overleaf, TeXstudio ή VS Code και προσαρμόστε. Διατηρείτε τον έλεγχο, σε αντίθεση με ένα παγωμένο PDF.
Τυπικές περιπτώσεις χρήσης
- Επιστημονικά άρθρα: ένα προσχέδιο γραμμένο στον ιστό, μετατροπή html σε λατέξ, τελειοποίηση στο Overleaf, υποβολή στο περιοδικό.
- Γράμματα και βιογραφικά: μεταβείτε από ένα πρόγραμμα επεξεργασίας HTML (πλούσιο, οπτικό) σε ένα γράμμα LaTeX με άψογη απόδοση, έτοιμο για εκτύπωση.
- Τεχνική τεκμηρίωση: δημιουργήστε ένα PDF αναφοράς από ένα υπάρχον έγγραφο HTML (Sphinx, MkDocs, wiki), χωρίς να αντιγράψετε την πηγή.
- Σημειώσεις Έννοια / Σημείωση: εξαγωγή σε HTML και μετά περάστε από το html2latex για να αποκτήσετε ένα δομημένο εκτυπώσιμο έγγραφο.
- Εταιρικές αναφορές: μετατρέψτε μια αναφορά γραμμένη σε εσωτερικό CMS σε πληκτρολογημένο παραδοτέο PDF.
Πώς λειτουργεί ο μετατροπέας HTML σε LaTeX;
Ο μετατροπέας αναλύει την πηγή HTML σας, προσδιορίζει κάθε ετικέτα και την αντιστοιχίζει στην αντίστοιχη εντολή LaTeX. Συγκεκριμένα:
- Οι τίτλοι
,,γίνονται\section{},\subsection{},\subsubsection{}. - Η ενσωματωμένη μορφοποίηση (
,,,,) μεταφράζεται σεextbf{},extit{},\underline{},\underline{}, - Οι λίστες (
,) γίνονται περιβάλλονταitemizeκαιenumerate. - Οι σύνδεσμοι
αποδίδονται με το πακέτοhyperref. - Οι ειδικοί χαρακτήρες LaTeX (
%,&,$,#,_,{,}) διαγράφονται αυτόματα.
Επιλέγετε την τάξη εξόδου LaTeX: article (από προεπιλογή, για άρθρα, σύντομες αναφορές), γράμμα (για αλληλογραφία) ή book (για μεγάλα έγγραφα με κεφάλαια). Το προοίμιο δημιουργείται με τα χρήσιμα πακέτα: inputenc (UTF-8), babel, hyperref, amsmath, amssymb.
Πώς να χρησιμοποιήσετε το εργαλείο
Τέσσερα βήματα για τη μετατροπή HTML σε LaTeX:
- Επικολλήστε τον κώδικα HTML στο πεδίο που παρέχεται.
- Επιλέξτε τον τύπο εγγράφου εξόδου (άρθρο, επιστολή, βιβλίο).
- Κάντε κλικ στο κουμπί μετατροπής. Δημιουργείται το αρχείο
.texκαι η απόδοση PDF του. - Κατεβάστε το
.texγια να το επεξεργαστείτε στο πρόγραμμα επεξεργασίας LaTeX ή απευθείας στο PDF.
Αντιστοιχίσεις πλήκτρων HTML σε LaTeX
Παράδειγμα μετατροπής HTML σε LaTeX
Πηγή HTML:
Κύριος τίτλος
Αυτή είναι μια παράγραφος με έντονους και πλάγιους χαρακτήρες.
Υποενότητα
- Στοιχείο πρώτο
- Στοιχείο δεύτερο με σύνδεσμο
Αποτέλεσμα LaTeX:
\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[γαλλικά]{babel}
\usepackage{hyperref}
\usepackage{amsmath}
\usepackage{amsymb}
egin{document}
\section{Κύριος τίτλος}
Αυτή είναι μια παράγραφος με extbf{bold} και extit{italics}.
\subsection{Subsection}
egin{itemize}
\item Στοιχείο ένα
\item Στοιχείο δύο με \href{https://cdrn.fr}{a σύνδεσμο}
nd{itemize}
nd{document}
FAQ
Ποιο μάθημα LaTeX να επιλέξετε: άρθρο, επιστολή ή βιβλίο;
Το article είναι κατάλληλο για τις περισσότερες περιπτώσεις (έκθεση, άρθρο, σύντομο σημείωμα). Το γράμμα είναι αφιερωμένο στην αλληλογραφία (κεφαλίδα, υπογραφή, ευγενικές εκφράσεις). Το book δομεί μεγάλα έγγραφα σε κεφάλαια και περιλαμβάνει αναλυτικό πίνακα περιεχομένων. Εάν έχετε αμφιβολίες, μεταβείτε στο article.
Είναι εγγυημένη η μεταγλώττιση του PDF που δημιουργείται;
Για τυπικό HTML (παράγραφοι, τίτλοι, λίστες, ενσωματωμένη μορφοποίηση, σύνδεσμοι), ναι. Εάν το HTML σας περιέχει εξωτικές ετικέτες, ενσωματωμένη JavaScript ή μη τυπικές ένθετες δομές, μπορεί να είναι απαραίτητο να προσαρμόσετε μη αυτόματα το .tex πριν από τη μεταγλώττιση.
Το HTML μου χρησιμοποιεί εικόνες: περιλαμβάνονται;
Οι ετικέτες μετατρέπονται σε \includegraphics{} με το πακέτο graphicx, αλλά οι ίδιες οι εικόνες δεν είναι ενσωματωμένες στο .tex (τοπική αναφορά αρχείου LaTeX). Κατεβάστε τις εικόνες ξεχωριστά και τοποθετήστε τις δίπλα στο .tex πριν από τη μεταγλώττιση.
Γιατί να μην κάνετε Markdown απευθείας στο LaTeX;
Το Pandoc κάνει πολύ καλά το Markdown στο LaTeX. Ο μετατροπέας μας στοχεύει συγκεκριμένα την HTML, η οποία καλύπτει πηγές στις οποίες δεν προσεγγίζει το Markdown: εξαγωγές CMS, ιστοσελίδες, περιεχόμενο γραμμένο σε επεξεργαστές WYSIWYG, έξοδος από γεννήτριες εγγράφων. Εάν η πηγή σας βρίσκεται ήδη σε Markdown, εξάγετε την σε HTML και, στη συνέχεια, μεταβείτε εδώ ή χρησιμοποιήστε απευθείας το Pandoc.
Η απόδοση LaTeX υποστηρίζει UTF-8 και τόνους;
Ναι. Το προοίμιο περιλαμβάνει τα \usepackage[utf8]{inputenc} και \usepackage[french]{babel}, τα οποία διασφαλίζουν τη σωστή απόδοση των τονισμών, του cedilla και των γαλλικών τυπογραφικών κανόνων (μη σπασμένα κενά πριν από διπλή στίξη, γαλλικά εισαγωγικά).
Και το αντίθετο, LaTeX σε HTML;
Η μετατροπή λατέξ σε html είναι μια άλλη άσκηση (το LaTeX είναι πολύ πιο εκφραστικό από το HTML, ειδικά για εξισώσεις). Για αυτό το νόημα, δείτε τα pandoc, htlatex ή LaTeXML. Αυτό το εργαλείο κάνει μόνο html σε λατέξ, προς μία μόνο κατεύθυνση.
Συχνές ερωτήσεις
Ποια τάξη LaTeX να επιλέξετε: article, γράμμα ή βιβλίο;
Το article είναι κατάλληλο για τις περισσότερες περιπτώσεις (σύντομη αναφορά, ανάρτηση, υπόμνημα, επιστημονικό άρθρο). Το letter είναι αφιερωμένο στην αλληλογραφία με ενσωματωμένη κεφαλίδα, υπογραφή και ευγενικές εκφράσεις. Το book δομεί μεγάλα έγγραφα σε κεφάλαια και περιλαμβάνει αναλυτικό πίνακα περιεχομένων. Εάν έχετε αμφιβολίες, ακολουθήστε το article: είναι η πιο καθολική κατηγορία.
Οι γαλλικοί τόνοι και χαρακτήρες αποδίδονται σωστά;
Ναι. Το προοίμιο που δημιουργείται περιλαμβάνει τα \usepackage[utf8]{inputenc} και \usepackage[french]{babel}, τα οποία διασφαλίζουν τη σωστή απόδοση τονισμών, cedilla και γαλλικών τυπογραφικών κανόνων: μη σπασμένα κενά πριν από διπλή στίξη, γαλλικά εισαγωγικά, σωστά. Δεν απαιτείται χειροκίνητη παρέμβαση για ένα κείμενο στα γαλλικά.
Διαφεύγουν αυτόματα οι ειδικοί χαρακτήρες του LaTeX;
Ναι. Οι χαρακτήρες που έχουν νόημα στο LaTeX (%, &, $, #, _, {, }, ~, $, #, _, {, }, ~, ~, , είναι αυτόματα κατά τη διάρκεια του ^) μετατροπής. Το κείμενο HTML που περιέχει 50% έκπτωση ή όνομα χρήστη μεταφράζεται σωστά χωρίς διακοπή της μεταγλώττισης.
Το HTML μου χρησιμοποιεί εικόνες: περιλαμβάνονται στο .tex;
Οι ετικέτες μετατρέπονται σε \includegraphics{} με το πακέτο graphicx, αλλά οι ίδιες οι εικόνες δεν είναι ενσωματωμένες στο .tex επειδή το LaTeX αναφέρεται σε τοπικά αρχεία. Κατεβάστε τις εικόνες ξεχωριστά και τοποθετήστε τις δίπλα στο .tex πριν από τη μεταγλώττιση ή προσαρμόστε τη διαδρομή στο \graphicspath.
Πώς να επεξεργαστείτε HTML με μαθηματικές εξισώσεις;
Εάν οι εξισώσεις σας είναι ήδη σε MathML ή LaTeX inline (για παράδειγμα $E = mc^2$), ο μετατροπέας τις μεταδίδει σχεδόν όπως είναι στην έξοδο. Οι εξισώσεις που αποδίδονται ως εικόνες (PNG, SVG) δεν μετατρέπονται αυτόματα σε LaTeX. Για άψογη μαθηματική απόδοση, γράψτε τους τύπους σε LaTeX στην πηγή HTML, το προοίμιο φορτώνει ήδη τα amsmath και amssyb.
Είναι εγγυημένο ότι το .tex που δημιουργείται είναι μεταγλωττιζόμενο;
Για τυπικό HTML (παράγραφοι, επικεφαλίδες, λίστες, ενσωματωμένη μορφοποίηση, σύνδεσμοι, απλοί πίνακες), ναι. Εάν το HTML σας περιέχει εξωτικές ετικέτες, ενσωματωμένη JavaScript, σύνθετες CSS ή μη τυπικές ένθετες δομές, μπορεί να είναι απαραίτητο να προσαρμόσετε το .tex πριν από τη μεταγλώττιση. Ανοίξτε το στο Overleaf ή στο TeXstudio για να εντοπίσετε γρήγορα τυχόν προειδοποιήσεις.
Παράδειγμα αιτήματος
curl -X POST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute \
-H "Content-Type: application/json" \
-d '{"content":"...","type":"letter","city":"...","object":"...","opening":"...","closing":"...","sender_address":"...","recipient_address":"...","recipient_name":"...","sender_name":"...","sender_phone":"...","sender_mail":"..."}'
Σχήμα εισόδου
| Πεδίο | Τύπος | Απαιτείται | Προεπιλογή |
|---|---|---|---|
content |
string | ✓ | – |
type |
choice (letter, article) | ✓ | – |
city |
string | ✓ | – |
object |
string | ✓ | – |
opening |
string | ✓ | – |
closing |
string | ✓ | – |
sender_address |
text | ✓ | – |
recipient_address |
text | ✓ | – |
recipient_name |
string | ✓ | – |
sender_name |
string | ✓ | – |
sender_phone |
string | ✓ | – |
sender_mail |
string | ✓ | – |
Σημεία πρόσβασης
GET https://cdrn.fr/api/v1/tools- εμφανίζει όλα τα διαθέσιμα εργαλείαGET https://cdrn.fr/api/v1/tools/html-to-latex-converter- ανακτά το σχήμα αυτού του εργαλείουPOST https://cdrn.fr/api/v1/tools/html-to-latex-converter/execute- εκτελεί αυτό το εργαλείο με payload JSON