5× más rápida que los líderes de la industria

La Más Rápida Biblioteca PDF

Para Rust, Python, JavaScript, TypeScript, Golang, C# y WASM

0.8ms

Promedio por PDF

100%

Tasa de éxito

3,830

PDFs probados

5.1×

Más rápida que el 2º

Comenzar Ver en GitHub

Listo en segundos.

Una instalación. Tres líneas de código.

$ cargo add pdf_oxide

use pdf_oxide::PdfDocument;

let mut doc = PdfDocument::open("paper.pdf")?;
let text = doc.extract_text(0)?;
let images = doc.extract_images(0)?;

Una sola biblioteca.
Crear|Editar|Extraer

Todas las operaciones PDF en una sola dependencia.
Sin wrappers, sin llamadas a subprocesos, sin runtimes C/C++/Java.

Crear

Genera PDFs desde cualquier formato de origen.

Markdown
Convierte Markdown a PDFs pixel-perfect con títulos, listas, tablas y bloques de código.
HTML
Transforma markup HTML en documentos PDF estructurados con soporte completo de layout CSS.
Imágenes
PDFs de una o múltiples páginas desde PNG, JPEG y TIFF con dimensionamiento automático.
QR & Barcodes
Code128, EAN-13, UPC-A y códigos QR con corrección de errores configurable.
Builder API
Cadena fluida PdfBuilder para tamaño de página, márgenes, fuentes, metadatos y encabezados.
Formularios
Campos de texto, checkboxes, botones de radio, dropdowns, sellos y marcas de agua.

Editar

Modifica cualquier parte de un PDF existente.

Edición DOM
Busca texto, reemplaza contenido y cambia estilos — navega el PDF como una página web.
Páginas
Rota, recorta, fusiona documentos, extrae rangos de páginas y reordena.
Formularios
Obtiene y establece valores de campos, agrega o elimina campos, aplana a contenido estático.
Anotaciones
Agrega resaltados, notas y enlaces. Modifica o aplana selectivamente.
Imágenes
Reposiciona, redimensiona y reemplaza imágenes incrustadas con límites exactos.
Seguridad
Cifrado AES-256, contraseñas y flags de permisos detallados.

Extraer

Extrae todo de cualquier PDF.

Texto
Texto de página completa, spans con estilo y metadatos de fuente, o posiciones por carácter.
Imágenes
Streams de contenido, Form XObjects anidados e imágenes inline con espacios de color.
Markdown
Markdown o HTML limpio con detección de títulos y preservación de tablas.
Formularios
Todos los valores y tipos de campos. Exporta a FDF o XFDF. Análisis XFA.
Metadatos
XMP, Dublin Core, etiquetas de página, catálogo y diccionarios trailer.
Búsqueda
Búsqueda de texto completo con regex, sin distinción de mayúsculas y modos de palabra completa.

5× más rápida que cualquier alternativa.

Benchmark en 3,830 PDFs reales de 3 suites de prueba públicas.

Node.js, Go, and C# share the same Rust core — expect matching numbers.

Biblioteca	Lenguaje	Promedio	p99	Tasa de éxito	Licencia
PDF Oxide	7 lenguajes	0.8ms	9ms	100%	MIT
PyMuPDF	Python	4.6ms	28ms	99.3%	AGPL-3.0
oxidize_pdf	Rust	13.5ms	11ms	99.1%	MIT
pypdfium2	Python	4.1ms	42ms	99.2%	Apache-2.0
pdfminer	Python	16.8ms	124ms	98.8%	MIT
pdfplumber	Python	23.2ms	189ms	98.8%	MIT
pypdf	Python	12.1ms	97ms	98.4%	BSD-3
unpdf	Rust	2.8ms	10ms	95.1%	MIT
pdf_extract	Rust	4.08ms	37ms	91.5%	Apache-2.0
lopdf	Rust	0.3ms	2ms	80.2%	MIT

Medido en 3,830 PDFs (veraPDF, Mozilla pdf.js, DARPA SafeDocs).
Un solo hilo, sin calentamiento, timeout de 60s.

100% confiable. Cero sorpresas.

Probado en 3,830 PDFs de tres suites de prueba públicas independientes.
Sin panics, sin timeouts, sin crashes.

3,823

PDFs válidos analizados
sin una sola falla

99.5%

paridad de calidad de texto
vs PyMuPDF y pypdfium2

PDFs dañados
rechazados correctamente

El corpus cubre todas las versiones de PDF (1.0–2.0), archivos cifrados, documentos malformados, codificaciones CJK y casos extremos de seguridad DARPA SafeDocs diseñados para hacer fallar parsers vulnerables.

Empieza a construir.

Gratis para proyectos comerciales y open-source.

Leer la documentación