5× mais rápida que os líderes do mercado

A Mais Rápida Biblioteca PDF

Para Rust, Python, JavaScript, TypeScript, Golang, C# e WASM

0.8ms
Média por PDF
100%
Taxa de aprovação
3,830
PDFs testados
5.1×
Mais rápida que o 2º
Começar agoraVer no GitHub

Funciona em segundos.

Uma instalação. Três linhas de código.

$ cargo add pdf_oxide
use pdf_oxide::PdfDocument; let mut doc = PdfDocument::open("paper.pdf")?; let text = doc.extract_text(0)?; let images = doc.extract_images(0)?;

Uma única biblioteca.
Criar|Editar|Extrair

Todas as operações PDF em uma única dependência.
Sem wrappers, sem chamadas de subprocesso, sem runtimes C/C++/Java.

01

Criar

Gere PDFs a partir de qualquer formato de origem.

  • Markdown
    Converta Markdown para PDFs pixel-perfect com títulos, listas, tabelas e blocos de código.
  • HTML
    Transforme markup HTML em documentos PDF estruturados com suporte completo a layout CSS.
  • Imagens
    PDFs de uma ou várias páginas a partir de PNG, JPEG e TIFF com dimensionamento automático.
  • QR & Barcodes
    Code128, EAN-13, UPC-A e QR codes com correção de erros configurável.
  • Builder API
    Cadeia fluente PdfBuilder para tamanho de página, margens, fontes, metadados e cabeçalhos.
  • Formulários
    Campos de texto, checkboxes, radio buttons, dropdowns, carimbos e marcas d'água.
02

Editar

Modifique qualquer parte de um PDF existente.

  • Edição DOM
    Encontre texto, substitua conteúdo e reestilize — navegue o PDF como uma página web.
  • Páginas
    Rotacione, corte, mescle documentos, extraia intervalos de páginas e reordene.
  • Formulários
    Obtenha e defina valores de campos, adicione ou remova campos, achate para conteúdo estático.
  • Anotações
    Adicione destaques, notas e links. Modifique ou achate seletivamente.
  • Imagens
    Reposicione, redimensione e substitua imagens embutidas com limites exatos.
  • Segurança
    Criptografia AES-256, senhas e flags de permissão detalhados.
03

Extrair

Extraia tudo de qualquer PDF.

  • Texto
    Texto da página inteira, spans estilizados com metadados de fonte ou posições por caractere.
  • Imagens
    Streams de conteúdo, Form XObjects aninhados e imagens inline com espaços de cor.
  • Markdown
    Markdown ou HTML limpos com detecção de títulos e preservação de tabelas.
  • Formulários
    Todos os valores e tipos de campos. Exporte para FDF ou XFDF. Análise XFA.
  • Metadados
    XMP, Dublin Core, rótulos de página, catálogo e dicionários trailer.
  • Busca
    Busca de texto completo com regex, case-insensitive e modos de palavra inteira.

5× mais rápida que qualquer alternativa.

Benchmarks em 3.830 PDFs reais de 3 suítes de teste públicas.

Node.js, Go, and C# share the same Rust core — expect matching numbers.

BibliotecaLinguagemMédiap99AprovaçãoLicença
PDF Oxide7 linguagens0.8ms9ms100%MIT
PyMuPDFPython4.6ms28ms99.3%AGPL-3.0
oxidize_pdfRust13.5ms11ms99.1%MIT
pypdfium2Python4.1ms42ms99.2%Apache-2.0
pdfminerPython16.8ms124ms98.8%MIT
pdfplumberPython23.2ms189ms98.8%MIT
pypdfPython12.1ms97ms98.4%BSD-3
unpdfRust2.8ms10ms95.1%MIT
pdf_extractRust4.08ms37ms91.5%Apache-2.0
lopdfRust0.3ms2ms80.2%MIT

Medido em 3.830 PDFs (veraPDF, Mozilla pdf.js, DARPA SafeDocs).
Thread única, sem warm-up, timeout de 60s.

100% confiável. Sem surpresas.

Testado em 3.830 PDFs de três suítes de teste públicas independentes.
Sem panics, sem timeouts, sem falhas.

3.823
PDFs válidos analisados
sem uma única falha
99,5%
paridade de qualidade de texto
vs PyMuPDF e pypdfium2
7
PDFs intencionalmente quebrados
rejeitados corretamente

O corpus abrange todas as versões de PDF (1.0–2.0), arquivos criptografados, documentos malformados, codificações CJK e casos extremos de segurança DARPA SafeDocs projetados para travar parsers vulneráveis.

Comece a construir.

Gratuito para projetos comerciais e open-source.

Ler a documentação