業界リーダーの5倍高速

最速の PDFライブラリ

Rust、Python、JavaScript、TypeScript、Golang、C#、WASM 対応

0.8ms
PDF平均処理時間
100%
パス率
3,830
テスト済みPDF数
5.1×
2位との速度差
使ってみるGitHubで見る

数秒で動きます。

インストール1回。コード3行。

$ cargo add pdf_oxide
use pdf_oxide::PdfDocument; let mut doc = PdfDocument::open("paper.pdf")?; let text = doc.extract_text(0)?; let images = doc.extract_images(0)?;

ひとつのライブラリで。
作成|編集|抽出

すべてのPDF操作を単一の依存関係で実現。
ラッパーなし。サブプロセスなし。C/C++/Javaランタイム不要。

01

作成

あらゆるソース形式からPDFを生成。

  • Markdown
    見出し、リスト、テーブル、コードブロック付きのMarkdownをピクセルパーフェクトなPDFに変換。
  • HTML
    HTMLマークアップをCSSレイアウト完全対応の構造化PDFドキュメントに変換。
  • 画像
    PNG、JPEG、TIFFから自動サイズ調整で単一・複数ページのPDFを生成。
  • QR & Barcodes
    Code128、EAN-13、UPC-A、QRコード。設定可能な誤り訂正レベル。
  • Builder API
    ページサイズ、余白、フォント、メタデータ、ヘッダーをメソッドチェーンで設定するPdfBuilder API。
  • フォーム
    テキストフィールド、チェックボックス、ラジオボタン、ドロップダウン、スタンプ、ウォーターマーク。
02

編集

既存PDFのあらゆる部分を変更。

  • DOM Editing
    テキスト検索、コンテンツ置換、スタイル変更 — WebページのようにPDFを操作。
  • ページ
    回転、トリミング、ドキュメント結合、ページ範囲抽出、並べ替え。
  • フォーム
    フィールド値の取得・設定、フィールドの追加・削除、静的コンテンツへのフラット化。
  • 注釈
    ハイライト、ノート、リンクの追加。選択的な変更・フラット化。
  • 画像
    埋め込み画像の位置変更、リサイズ、座標指定での置換。
  • セキュリティ
    AES-256暗号化、パスワード、きめ細かな権限フラグ。
03

抽出

あらゆるPDFからすべてを抽出。

  • テキスト
    ページ全体のテキスト、フォントメタデータ付きスタイルスパン、文字単位の位置情報。
  • 画像
    コンテンツストリーム、ネストされたForm XObject、カラースペース付きインライン画像。
  • Markdown
    見出し検出とテーブル保持付きのクリーンなMarkdownまたはHTML。
  • フォーム
    すべてのフィールド値と型。FDFまたはXFDFエクスポート。XFA分析。
  • メタデータ
    XMP、Dublin Core、ページラベル、カタログ、トレーラー辞書。
  • 検索
    正規表現、大文字小文字無視、単語単位の全文検索。

あらゆる代替ライブラリの5倍高速。

3つの公開テストスイートの実データ3,830件でベンチマーク。

Node.js, Go, and C# share the same Rust core — expect matching numbers.

ライブラリ言語平均p99パス率ライセンス
PDF Oxide7 言語0.8ms9ms100%MIT
PyMuPDFPython4.6ms28ms99.3%AGPL-3.0
oxidize_pdfRust13.5ms11ms99.1%MIT
pypdfium2Python4.1ms42ms99.2%Apache-2.0
pdfminerPython16.8ms124ms98.8%MIT
pdfplumberPython23.2ms189ms98.8%MIT
pypdfPython12.1ms97ms98.4%BSD-3
unpdfRust2.8ms10ms95.1%MIT
pdf_extractRust4.08ms37ms91.5%Apache-2.0
lopdfRust0.3ms2ms80.2%MIT

3,830件のPDF(veraPDF、Mozilla pdf.js、DARPA SafeDocs)で計測。
シングルスレッド、ウォームアップなし、60秒タイムアウト。

信頼性100%。想定外ゼロ。

3つの独立した公開テストスイートの3,830件のPDFでテスト済み。
パニック、タイムアウト、クラッシュなし。

3,823
有効なPDF解析成功
失敗ゼロ
99.5%
テキスト品質同等
対 PyMuPDF・pypdfium2
7
意図的に壊れたPDF
正しく拒否

コーパスはすべてのPDFバージョン(1.0–2.0)、暗号化ファイル、不正なドキュメント、CJKエンコーディング、脆弱なパーサーをクラッシュさせるよう設計されたDARPA SafeDocsセキュリティエッジケースをカバーしています。

開発を始めましょう。

商用・オープンソースプロジェクトで無料。

ドキュメントを読む