5× más rápida que los líderes de la industria

La Más Rápida Biblioteca PDF

Para Rust, Python, JavaScript, TypeScript, Golang, C# y WASM

0.8ms
Promedio por PDF
100%
Tasa de éxito
3,830
PDFs probados
5.1×
Más rápida que el 2º
ComenzarVer en GitHub

Listo en segundos.

Una instalación. Tres líneas de código.

$ cargo add pdf_oxide
use pdf_oxide::PdfDocument; let mut doc = PdfDocument::open("paper.pdf")?; let text = doc.extract_text(0)?; let images = doc.extract_images(0)?;

Una sola biblioteca.
Crear|Editar|Extraer

Todas las operaciones PDF en una sola dependencia.
Sin wrappers, sin llamadas a subprocesos, sin runtimes C/C++/Java.

01

Crear

Genera PDFs desde cualquier formato de origen.

  • Markdown
    Convierte Markdown a PDFs pixel-perfect con títulos, listas, tablas y bloques de código.
  • HTML
    Transforma markup HTML en documentos PDF estructurados con soporte completo de layout CSS.
  • Imágenes
    PDFs de una o múltiples páginas desde PNG, JPEG y TIFF con dimensionamiento automático.
  • QR & Barcodes
    Code128, EAN-13, UPC-A y códigos QR con corrección de errores configurable.
  • Builder API
    Cadena fluida PdfBuilder para tamaño de página, márgenes, fuentes, metadatos y encabezados.
  • Formularios
    Campos de texto, checkboxes, botones de radio, dropdowns, sellos y marcas de agua.
02

Editar

Modifica cualquier parte de un PDF existente.

  • Edición DOM
    Busca texto, reemplaza contenido y cambia estilos — navega el PDF como una página web.
  • Páginas
    Rota, recorta, fusiona documentos, extrae rangos de páginas y reordena.
  • Formularios
    Obtiene y establece valores de campos, agrega o elimina campos, aplana a contenido estático.
  • Anotaciones
    Agrega resaltados, notas y enlaces. Modifica o aplana selectivamente.
  • Imágenes
    Reposiciona, redimensiona y reemplaza imágenes incrustadas con límites exactos.
  • Seguridad
    Cifrado AES-256, contraseñas y flags de permisos detallados.
03

Extraer

Extrae todo de cualquier PDF.

  • Texto
    Texto de página completa, spans con estilo y metadatos de fuente, o posiciones por carácter.
  • Imágenes
    Streams de contenido, Form XObjects anidados e imágenes inline con espacios de color.
  • Markdown
    Markdown o HTML limpio con detección de títulos y preservación de tablas.
  • Formularios
    Todos los valores y tipos de campos. Exporta a FDF o XFDF. Análisis XFA.
  • Metadatos
    XMP, Dublin Core, etiquetas de página, catálogo y diccionarios trailer.
  • Búsqueda
    Búsqueda de texto completo con regex, sin distinción de mayúsculas y modos de palabra completa.

5× más rápida que cualquier alternativa.

Benchmark en 3,830 PDFs reales de 3 suites de prueba públicas.

Node.js, Go, and C# share the same Rust core — expect matching numbers.

BibliotecaLenguajePromediop99Tasa de éxitoLicencia
PDF Oxide7 lenguajes0.8ms9ms100%MIT
PyMuPDFPython4.6ms28ms99.3%AGPL-3.0
oxidize_pdfRust13.5ms11ms99.1%MIT
pypdfium2Python4.1ms42ms99.2%Apache-2.0
pdfminerPython16.8ms124ms98.8%MIT
pdfplumberPython23.2ms189ms98.8%MIT
pypdfPython12.1ms97ms98.4%BSD-3
unpdfRust2.8ms10ms95.1%MIT
pdf_extractRust4.08ms37ms91.5%Apache-2.0
lopdfRust0.3ms2ms80.2%MIT

Medido en 3,830 PDFs (veraPDF, Mozilla pdf.js, DARPA SafeDocs).
Un solo hilo, sin calentamiento, timeout de 60s.

100% confiable. Cero sorpresas.

Probado en 3,830 PDFs de tres suites de prueba públicas independientes.
Sin panics, sin timeouts, sin crashes.

3,823
PDFs válidos analizados
sin una sola falla
99.5%
paridad de calidad de texto
vs PyMuPDF y pypdfium2
7
PDFs dañados
rechazados correctamente

El corpus cubre todas las versiones de PDF (1.0–2.0), archivos cifrados, documentos malformados, codificaciones CJK y casos extremos de seguridad DARPA SafeDocs diseñados para hacer fallar parsers vulnerables.

Empieza a construir.

Gratis para proyectos comerciales y open-source.

Leer la documentación