Formatos de documentos compatibles
-
Hojas de cálculo de Excel (
.xlsx
,.xls
)- Cada hoja de cálculo se convierte en una tabla HTML
- Las hojas se separan con encabezados H2 con el nombre de la hoja
- Conserva el formato de las celdas y los tipos de datos
-
Documentos de Word (
.docx
,.doc
,.odt
,.rtf
)- Extrae el contenido de texto preservando la estructura del documento
- Mantiene encabezados, párrafos, listas y tablas
- Conserva el formato y el estilo básicos
-
Documentos PDF (
.pdf
)- Extrae el contenido de texto con información de diseño
- Conserva la estructura del documento, incluidas secciones y párrafos
- Procesa tanto PDFs basados en texto como escaneados (con OCR)
- Precio de 1 crédito por página. Consulta la tarifa para más detalles.
Cómo usar el análisis de documentos
Ejemplo: Raspado de un archivo de Excel
Node
Ejemplo: extracción de un documento de Word
Node