Lectura de datos
Archivos CSV
Archivos Parquet
Archivos JSON
Archivos de Excel
Bases de datos SQL
Otros formatos
Escribir datos
to_csv
to_parquet
to_json
to_excel
to_sql
Otros métodos de exportación
Comparación de formatos de archivo
| Formato | Velocidad de lectura | Velocidad de escritura | Tamaño de archivo | Esquema | Mejor para |
|---|---|---|---|---|---|
| Parquet | Rápida | Rápida | Pequeño | Sí | Grandes volúmenes de datos, análisis |
| CSV | Media | Rápida | Grande | No | Compatibilidad, datos simples |
| JSON | Lenta | Media | Grande | Parcial | API, datos anidados |
| Excel | Lenta | Lenta | Medio | Parcial | Compartir con usuarios no técnicos |
| Feather | Muy rápida | Muy rápida | Medio | Sí | Comunicación entre procesos, pandas |
Recomendaciones
-
Para cargas de trabajo analíticas: Use Parquet
- El formato columnar permite leer solo las columnas necesarias
- Excelente compresión
- Preserva los tipos de datos
-
Para el intercambio de datos: Use CSV o JSON
- Compatibilidad universal
- Legible para humanos
-
Para la interoperabilidad con pandas: Use Feather o Arrow
- La serialización más rápida
- Preserva los tipos
Compatibilidad con compresión
Lectura de archivos comprimidos
Escribir archivos comprimidos
Opciones de compresión
| Compresión | Velocidad | Ratio | Caso de uso |
|---|---|---|---|
snappy | Muy rápida | Baja | Por defecto para Parquet |
lz4 | Muy rápida | Baja | Prioridad en velocidad |
gzip | Media | Alta | Compatibilidad |
zstd | Rápida | Muy alta | Mejor equilibrio |
bz2 | Lenta | Muy alta | Máxima compresión |