У 5 разів швидше за лідерів галузі

Найшвидша PDF-бібліотека

Для Rust, Python, JavaScript, TypeScript, Golang, C# та WASM

0.8ms
Середнє на PDF
100%
Успішність
3,830
PDF протестовано
5.1×
Швидше за №2
ПочатиПереглянути на GitHub

Готово за секунди.

Одна установка. Три рядки коду.

$ cargo add pdf_oxide
use pdf_oxide::PdfDocument; let mut doc = PdfDocument::open("paper.pdf")?; let text = doc.extract_text(0)?; let images = doc.extract_images(0)?;

Одна бібліотека.
Створення|Редагування|Витягування

Усі операції з PDF в одній залежності.
Без обгорток, без викликів підпроцесів, без середовищ C/C++/Java.

01

Створення

Створення PDF з будь-якого формату.

  • Markdown
    Конвертація Markdown у піксельно-точні PDF із заголовками, списками, таблицями та блоками коду.
  • HTML
    Перетворення HTML-розмітки на структуровані PDF-документи з повною підтримкою CSS-макетів.
  • Зображення
    Одно- та багатосторінкові PDF з PNG, JPEG та TIFF з автопідбором розміру.
  • QR & Barcodes
    Code128, EAN-13, UPC-A та QR-коди з налаштовуваним рівнем корекції помилок.
  • Builder API
    Fluent-ланцюжок PdfBuilder для розміру сторінки, полів, шрифтів, метаданих та заголовків.
  • Форми
    Текстові поля, чекбокси, радіокнопки, випадаючі списки, штампи та водяні знаки.
02

Редагування

Зміна будь-якої частини існуючого PDF.

  • DOM Editing
    Пошук тексту, заміна вмісту, зміна стилів — навігація по PDF як по веб-сторінці.
  • Сторінки
    Обертання, обрізка, об'єднання документів, витяг діапазонів сторінок та переупорядкування.
  • Форми
    Отримання та встановлення значень полів, додавання або видалення полів, зведення до статичного вмісту.
  • Анотації
    Додавання виділень, приміток та посилань. Вибіркова зміна або зведення.
  • Зображення
    Переміщення, зміна розміру та заміна вбудованих зображень з точними межами.
  • Безпека
    Шифрування AES-256, паролі та детальні прапорці дозволів.
03

Витягування

Витяг усього з будь-якого PDF.

  • Текст
    Повносторінковий текст, стилізовані фрагменти з метаданими шрифтів або посимвольні позиції.
  • Зображення
    Потоки вмісту, вкладені Form XObject та інлайн-зображення з колірними просторами.
  • Markdown
    Чистий Markdown або HTML з визначенням заголовків та збереженням таблиць.
  • Форми
    Усі значення та типи полів. Експорт у FDF або XFDF. Аналіз XFA.
  • Метадані
    XMP, Dublin Core, мітки сторінок, каталог та словники трейлерів.
  • Пошук
    Повнотекстовий пошук з регулярними виразами, без урахування регістру та по цілих словах.

У 5 разів швидше за будь-яку альтернативу.

Заміряно на 3 830 реальних PDF з 3 публічних тестових наборів.

Node.js, Go, and C# share the same Rust core — expect matching numbers.

БібліотекаМоваСереднєp99УспішністьЛіцензія
PDF Oxide7 мов0.8ms9ms100%MIT
PyMuPDFPython4.6ms28ms99.3%AGPL-3.0
oxidize_pdfRust13.5ms11ms99.1%MIT
pypdfium2Python4.1ms42ms99.2%Apache-2.0
pdfminerPython16.8ms124ms98.8%MIT
pdfplumberPython23.2ms189ms98.8%MIT
pypdfPython12.1ms97ms98.4%BSD-3
unpdfRust2.8ms10ms95.1%MIT
pdf_extractRust4.08ms37ms91.5%Apache-2.0
lopdfRust0.3ms2ms80.2%MIT

Виміряно на 3 830 PDF (veraPDF, Mozilla pdf.js, DARPA SafeDocs).
Один потік, без прогріву, таймаут 60 с.

100% надійність. Без сюрпризів.

Протестовано на 3 830 PDF з трьох незалежних публічних тестових наборів.
Ніяких панік, таймаутів чи падінь.

3 823
валідних PDF розібрано
без жодного збою
99,5%
зіставна якість тексту
порівняно з PyMuPDF та pypdfium2
7
пошкоджених PDF
коректно відхилено

Корпус охоплює всі версії PDF (1.0–2.0), зашифровані файли, пошкоджені документи, кодування CJK та крайові випадки безпеки DARPA SafeDocs, створені для обвалення вразливих парсерів.

Почніть роботу.

Безкоштовно для комерційних та open-source проєктів.

Документація