Selección de API para Databricks
| Estado de Unity Catalog | API recomendada | Notas |
|---|---|---|
| Habilitado (predeterminado) | TableProvider API (basada en formato) | Unity Catalog bloquea el registro de catálogos de Spark |
| Deshabilitado (No isolation shared) | Catalog API | Requiere un clúster con el modo de acceso “No isolation shared” |
Instalación en Databricks
Opción 1: Subir el JAR mediante la UI de Databricks
-
Compila o descarga el JAR de runtime:
-
Sube el JAR a tu espacio de trabajo de Databricks:
- Ve a Espacio de trabajo → navega hasta la carpeta deseada
- Haz clic en Upload → selecciona el archivo JAR
- El JAR se almacenará en tu espacio de trabajo
-
Instala la biblioteca en tu clúster:
- Ve a Compute → selecciona tu clúster
- Haz clic en la pestaña Libraries
- Haz clic en Install New
- Selecciona DBFS o Espacio de trabajo → navega hasta el archivo JAR que subiste
- Haz clic en Install
- Reinicia el clúster para cargar la biblioteca
Opción 2: Instalar con la CLI de Databricks
Opción 3: Coordenadas de Maven (recomendada)
-
Ve a tu espacio de trabajo de Databricks:
- Ve a Compute → Selecciona tu clúster
- Haz clic en la pestaña Libraries
- Haz clic en Install New
- Selecciona la pestaña Maven
- Agrega las coordenadas de Maven:
- Haz clic en Install y reinicia el clúster para cargar la biblioteca
Uso de la TableProvider API
Lectura de datos
- Python
- Scala
Escritura de datos
- Python
- Scala
Este ejemplo asume que los secret scopes de Databricks ya están configurados. Para obtener instrucciones de configuración, consulta la documentación de gestión de secretos de Databricks.
Consideraciones específicas de Databricks
Requisitos del modo de acceso
| Modo de acceso | Unity Catalog | Compatible |
|---|---|---|
| Dedicated (Single User) | Habilitado | ✅ Sí |
| Dedicated (Single User) | Deshabilitado | ✅ Sí |
| Standard (Shared) | Habilitado | ❌ No |
| Standard (Shared) | Deshabilitado | ✅ Sí |
Gestión de secretos
Conexión con ClickHouse Cloud
- Use el protocolo HTTPS (
protocol: https,http_port: 8443) - Habilite SSL (
ssl: true)
Ejemplos
Ejemplo completo de flujo de trabajo
- Python
- Scala
- Guía del conector nativo de Spark - Documentación completa del conector
- Documentación de TableProvider API - Detalles del acceso basado en formatos
- Documentación de Catalog API - Detalles del acceso basado en catálogos