Databricks 的 API 选择
| Unity Catalog 状态 | 推荐 API | 说明 |
|---|---|---|
| 已启用 (默认) | TableProvider API (基于格式) | Unity Catalog 会阻止 Spark 目录注册 |
| 已禁用 (No isolation shared) | Catalog API | 需要使用访问模式为 “No isolation shared” 的集群 |
在 Databricks 上进行安装
选项 1:通过 Databricks UI 上传 JAR
-
构建或下载运行时 JAR:
-
将 JAR 上传到 Databricks 工作区:
- 前往 Workspace → 导航到所需文件夹
- 点击 Upload → 选择 JAR 文件
- JAR 将存储在你的工作区中
-
在集群上安装该库:
- 前往 Compute → 选择你的集群
- 点击 Libraries 选项卡
- 点击 Install New
- 选择 DBFS 或 Workspace → 导航到已上传的 JAR 文件
- 点击 Install
- 重启集群以加载该库
选项 2:通过 Databricks CLI 安装
选项 3:Maven 坐标 (推荐)
-
进入你的 Databricks 工作区:
- 前往 Compute → 选择你的集群
- 点击 Libraries 选项卡
- 点击 Install New
- 选择 Maven 选项卡
- 添加 Maven 坐标:
- 点击 Install,然后重启集群以加载该库
使用 TableProvider API
读取数据
- Python
- Scala
写入数据
- Python
- Scala
此示例假定 Databricks 中已预先配置好 secret scope (机密作用域) 。有关设置说明,请参阅 Databricks 的机密管理文档。
Databricks 特定注意事项
访问模式要求
| 访问模式 | Unity Catalog | 是否支持 |
|---|---|---|
| Dedicated (Single User) | 已启用 | ✅ 是 |
| Dedicated (Single User) | 已禁用 | ✅ 是 |
| Standard (Shared) | 已启用 | ❌ 否 |
| Standard (Shared) | 已禁用 | ✅ 是 |
机密管理
ClickHouse Cloud 连接
- 使用 HTTPS 协议 (
protocol: https,http_port: 8443) - 启用 SSL (
ssl: true)
示例
完整工作流示例
- Python
- Scala
- Spark Native Connector 指南 - 完整的连接器文档
- TableProvider API 文档 - 基于格式的访问详情
- Catalog API 文档 - 基于 目录 的访问详情