Μετατροπή PDF σε HTML

μετατρέπει ένα PDF σε αυτόνομη σελίδα HTML με επιλέξιμο επίπεδο κειμένου, χωρίς καμία αποστολή αρχείου· η μετατροπή γίνεται εξ ολοκλήρου στο πρόγραμμα περιήγησής σας

Σύρετε ένα PDF εδώ ή κάντε κλικ για να το επιλέξετε

Το αρχείο σας δεν εγκαταλείπει ποτέ το πρόγραμμα περιήγησής σας.

Ποιότητα απόδοσης

Σε τι χρησιμεύει η μετατροπή PDF σε HTML;

Αυτό το εργαλείο μετατρέπει ένα αρχείο PDF σε αυτόνομη σελίδα HTML που αναπαράγει πιστά την εμφάνιση του πρωτοτύπου, σελίδα προς σελίδα, διατηρώντας παράλληλα ένα επιλέξιμο και αντιγράψιμο κείμενο.

Το παραγόμενο HTML είναι ένα ενιαίο και αυτοτελές έγγραφο: κάθε σελίδα του PDF γίνεται ένα τοποθετημένο μπλοκ, με την εικόνα της σελίδας στο φόντο και ένα διαφανές επίπεδο κειμένου από πάνω. Μπορείτε να το προεπισκοπήσετε, να το κατεβάσετε ή να το αντιγράψετε με ένα κλικ.

Πώς λειτουργεί το εργαλείο;

Όλη η μετατροπή πραγματοποιείται στο πρόγραμμα περιήγησής σας, χάρη στη μηχανή απόδοσης pdf.js (την ίδια με αυτήν του Firefox). Το αρχείο σας δεν αποστέλλεται ποτέ σε διακομιστή: αυτό αποτελεί καθοριστικό πλεονέκτημα για εμπιστευτικά, συμβατικά ή κανονιστικά έγγραφα.

Κάθε σελίδα αποδίδεται ως εικόνα υψηλής ευκρίνειας (εσείς επιλέγετε την ποιότητα), και στη συνέχεια ένα αόρατο επίπεδο κειμένου υπερτίθεται για να επιτρέψει την επιλογή και την αναζήτηση. Μπορείτε να απενεργοποιήσετε αυτό το επίπεδο αν θέλετε μόνο μια οπτική απόδοση.

Συνήθεις περιπτώσεις χρήσης

  • Ενσωματώστε ένα PDF σε μια ιστοσελίδα διατηρώντας παράλληλα ένα επιλέξιμο κείμενο.
  • Αρχειοθετήστε ή μοιραστείτε ένα έγγραφο σε αναγνώσιμη μορφή χωρίς πρόγραμμα ανάγνωσης PDF.
  • Εξαγάγετε και αντιγράψτε το κείμενο ενός PDF σελίδα προς σελίδα.
  • Προεπισκοπήστε γρήγορα το περιεχόμενο ενός PDF χωρίς εξειδικευμένο λογισμικό.

Τι πιστότητα να περιμένετε;

Η οπτική απόδοση είναι πολύ πιστή, καθώς κάθε σελίδα είναι μια εικόνα που παράγεται από την ίδια τη μηχανή PDF: οι γραμματοσειρές, η διάταξη, τα χρώματα και τα γραφικά εμφανίζονται όπως στο πρωτότυπο.

Αντιθέτως, δεν πρόκειται για „σημασιολογικό" επανεπεξεργάσιμο HTML: τα διανυσματικά γραφικά αποδίδονται ως εικόνα, και το επίπεδο κειμένου χρησιμεύει κυρίως για την επιλογή, με την τοποθέτησή του να είναι κατά προσέγγιση. Για ένα σαρωμένο PDF (εικόνα χωρίς κείμενο), δεν μπορεί να δημιουργηθεί κανένα επίπεδο κειμένου χωρίς οπτική αναγνώριση (OCR).

Συχνές ερωτήσεις

Αποστέλλεται το αρχείο μου κάπου;

Όχι. Η μετατροπή πραγματοποιείται εξ ολοκλήρου στο πρόγραμμα περιήγησής σας· το PDF δεν εγκαταλείπει ποτέ τη συσκευή σας και δεν μεταδίδεται σε κανέναν διακομιστή.

Είναι επιλέξιμο το κείμενο του HTML;

Ναι, εφόσον το PDF περιέχει πραγματικό κείμενο. Ένα διαφανές επίπεδο κειμένου υπερτίθεται στην εικόνα κάθε σελίδας για να επιτρέψει την επιλογή, την αντιγραφή και την αναζήτηση.

Γιατί το κείμενο φαίνεται ελαφρώς μετατοπισμένο κατά την επιλογή;

Η ορατή απόδοση προέρχεται από την εικόνα της σελίδας· το επίπεδο κειμένου τοποθετείται κατά προσέγγιση. Η ενδεχόμενη μετατόπιση επηρεάζει μόνο τη ζώνη επιλογής, όχι την εμφάνιση του εγγράφου.

Λειτουργούν τα σαρωμένα PDF;

Η εικόνα κάθε σελίδας θα αναπαραχθεί σωστά, αλλά κανένα κείμενο δεν θα μπορεί να επιλεγεί: ένα σαρωμένο PDF δεν περιέχει κείμενο, μόνο μια εικόνα. Θα ήταν απαραίτητη μια οπτική αναγνώριση (OCR).

Υποστηρίζονται τα έγγραφα πολλών σελίδων;

Ναι. Όλες οι σελίδες μετατρέπονται και ομαδοποιούνται σε ένα μόνο αρχείο HTML, με τη σειρά του αρχικού εγγράφου.

Παράδειγμα αιτήματος

curl -X POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute \
  -F "file=@/path/to/file"

Σχήμα εισόδου

Πεδίο Τύπος Απαιτείται Προεπιλογή
file file

αυτό το εργαλείο αναμένει αρχείο - χρησιμοποιήστε Content-Type multipart/form-data αντί για application/json

Σημεία πρόσβασης

  • GET https://cdrn.fr/api/v1/tools - εμφανίζει όλα τα διαθέσιμα εργαλεία
  • GET https://cdrn.fr/api/v1/tools/pdf-to-html-converter - ανακτά το σχήμα αυτού του εργαλείου
  • POST https://cdrn.fr/api/v1/tools/pdf-to-html-converter/execute - εκτελεί αυτό το εργαλείο με payload JSON