5× schneller als die Branchenführer

Die schnellste PDF-Bibliothek

Für Rust, Python, JavaScript, TypeScript, Golang, C# und WASM

0.8ms
Durchschnitt pro PDF
100%
Erfolgsrate
3,830
Getestete PDFs
5.1×
Schneller als Nr. 2
Jetzt startenAuf GitHub ansehen

In Sekunden startklar.

Eine Installation. Drei Zeilen Code.

$ cargo add pdf_oxide
use pdf_oxide::PdfDocument; let mut doc = PdfDocument::open("paper.pdf")?; let text = doc.extract_text(0)?; let images = doc.extract_images(0)?;

Eine Bibliothek.
Erstellen|Bearbeiten|Extrahieren

Alle PDF-Operationen in einer einzigen Abhängigkeit.
Keine Wrapper, keine Subprozess-Aufrufe, keine C/C++/Java-Laufzeiten.

01

Erstellen

PDFs aus jedem Quellformat erstellen.

  • Markdown
    Markdown pixelgenau in PDFs konvertieren — mit Überschriften, Listen, Tabellen und Codeblöcken.
  • HTML
    HTML-Markup in strukturierte PDF-Dokumente mit vollständiger CSS-Layout-Unterstützung umwandeln.
  • Bilder
    Ein- oder mehrseitige PDFs aus PNG, JPEG und TIFF mit automatischer Größenanpassung.
  • QR & Barcodes
    Code128, EAN-13, UPC-A und QR-Codes mit konfigurierbarer Fehlerkorrektur.
  • Builder API
    Fluente PdfBuilder-Kette für Seitengröße, Ränder, Schriftarten, Metadaten und Kopfzeilen.
  • Formulare
    Textfelder, Checkboxen, Radiobuttons, Dropdowns, Stempel und Wasserzeichen.
02

Bearbeiten

Jeden Teil eines bestehenden PDFs ändern.

  • DOM-Bearbeitung
    Text suchen, Inhalte ersetzen, Stile ändern — durch das PDF navigieren wie durch eine Webseite.
  • Seiten
    Drehen, Zuschneiden, Dokumente zusammenführen, Seitenbereiche extrahieren und neu ordnen.
  • Formulare
    Feldwerte lesen und setzen, Felder hinzufügen oder entfernen, zu statischem Inhalt reduzieren.
  • Annotationen
    Hervorhebungen, Notizen und Links hinzufügen. Selektiv ändern oder reduzieren.
  • Bilder
    Eingebettete Bilder repositionieren, skalieren und mit exakten Grenzen ersetzen.
  • Sicherheit
    AES-256-Verschlüsselung, Passwörter und detaillierte Berechtigungs-Flags.
03

Extrahieren

Alles aus jedem PDF extrahieren.

  • Text
    Ganzseitiger Text, stilisierte Spans mit Schrift-Metadaten oder zeichenweise Positionen.
  • Bilder
    Content-Streams, verschachtelte Form-XObjects und Inline-Bilder mit Farbräumen.
  • Markdown
    Sauberes Markdown oder HTML mit Überschriftenerkennung und Tabellenerhaltung.
  • Formulare
    Alle Feldwerte und -typen. Export nach FDF oder XFDF. XFA-Analyse.
  • Metadaten
    XMP, Dublin Core, Seitenlabels, Katalog- und Trailer-Dictionaries.
  • Suche
    Volltextsuche mit Regex, Groß-/Kleinschreibung ignorierend und Ganzes-Wort-Modus.

5× schneller als jede Alternative.

Benchmark mit 3.830 realen PDFs aus 3 öffentlichen Test-Suites.

Node.js, Go, and C# share the same Rust core — expect matching numbers.

BibliothekSpracheDurchschnittp99ErfolgsrateLizenz
PDF Oxide7 Sprachen0.8ms9ms100%MIT
PyMuPDFPython4.6ms28ms99.3%AGPL-3.0
oxidize_pdfRust13.5ms11ms99.1%MIT
pypdfium2Python4.1ms42ms99.2%Apache-2.0
pdfminerPython16.8ms124ms98.8%MIT
pdfplumberPython23.2ms189ms98.8%MIT
pypdfPython12.1ms97ms98.4%BSD-3
unpdfRust2.8ms10ms95.1%MIT
pdf_extractRust4.08ms37ms91.5%Apache-2.0
lopdfRust0.3ms2ms80.2%MIT

Gemessen an 3.830 PDFs (veraPDF, Mozilla pdf.js, DARPA SafeDocs).
Einzelner Thread, kein Aufwärmen, 60s Timeout.

100% zuverlässig. Keine Überraschungen.

Getestet an 3.830 PDFs aus drei unabhängigen öffentlichen Test-Suites.
Keine Panics, keine Timeouts, keine Abstürze.

3.823
gültige PDFs geparst
ohne einen einzigen Fehler
99,5%
Textqualitätsparität
gegenüber PyMuPDF & pypdfium2
7
defekte PDFs
korrekt abgelehnt

Das Corpus umfasst alle PDF-Versionen (1.0–2.0), verschlüsselte Dateien, fehlerhafte Dokumente, CJK-Kodierungen und DARPA-SafeDocs-Sicherheits-Grenzfälle, die darauf ausgelegt sind, anfällige Parser zum Absturz zu bringen.

Jetzt loslegen.

Kostenlos für kommerzielle und Open-Source-Projekte.

Dokumentation lesen