Databricks용 API 선택
| Unity Catalog 상태 | 권장 API | 참고 |
|---|---|---|
| 활성화됨 (기본값) | TableProvider API (포맷 기반) | Unity Catalog로 인해 Spark 카탈로그 등록이 차단됩니다 |
| 비활성화됨 (No isolation shared) | Catalog API | ”No isolation shared” 액세스 모드의 클러스터가 필요합니다 |
Databricks에서 설치
옵션 1: Databricks UI를 통해 JAR 업로드
-
런타임 JAR을 빌드하거나 다운로드합니다:
-
Databricks 워크스페이스에 JAR을 업로드합니다:
- Workspace로 이동한 다음 원하는 폴더로 이동합니다
- Upload를 클릭한 다음 JAR 파일을 선택합니다
- JAR 파일은 워크스페이스에 저장됩니다
-
클러스터에 라이브러리를 설치합니다:
- Compute로 이동한 다음 클러스터를 선택합니다
- Libraries 탭을 클릭합니다
- Install New를 클릭합니다
- DBFS 또는 Workspace를 선택한 다음 업로드한 JAR 파일로 이동합니다
- Install을 클릭합니다
- 라이브러리를 로드하려면 클러스터를 다시 시작합니다
옵션 2: Databricks CLI로 설치
옵션 3: Maven 좌표(권장)
-
Databricks 워크스페이스로 이동합니다.
- Compute로 이동한 다음 클러스터를 선택합니다
- Libraries 탭을 클릭합니다
- Install New를 클릭합니다
- Maven 탭을 선택합니다
- Maven 좌표를 추가합니다:
- Install를 클릭한 다음 라이브러리를 로드할 수 있도록 클러스터를 다시 시작하세요
TableProvider API 사용
데이터 읽기
- Python
- Scala
데이터 쓰기
- Python
- Scala
이 예시에서는 Databricks에서 시크릿 스코프가 미리 구성되어 있다고 가정합니다. 설정 방법은 Databricks 시크릿 관리 문서를 참조하십시오.
Databricks 관련 고려 사항
액세스 모드 요구 사항
| 액세스 모드 | Unity Catalog | 지원 여부 |
|---|---|---|
| Dedicated (Single User) | 활성화 | ✅ 예 |
| Dedicated (Single User) | 비활성화 | ✅ 예 |
| Standard (Shared) | 활성화 | ❌ 아니요 |
| Standard (Shared) | 비활성화 | ✅ 예 |
시크릿 관리
ClickHouse Cloud 연결
- HTTPS 프로토콜을 사용합니다 (
protocol: https,http_port: 8443) - SSL을 활성화합니다 (
ssl: true)
예시
전체 워크플로 예시
- Python
- Scala
- Spark 네이티브 커넥터 가이드 - 커넥터 전체 문서
- TableProvider API 문서 - 포맷 기반 접근 방식에 대한 자세한 내용
- Catalog API 문서 - 카탈로그 기반 접근 방식에 대한 자세한 내용