前置条件
- 可使用具有复制权限的用户访问源 PostgreSQL 数据库。
- 准备一个 ClickHouse Managed Postgres 服务作为迁移目标。如果你还没有,请参阅快速入门。
- 在本地计算机上安装
pg_dump和psql。两者都包含在标准 PostgreSQL 客户端工具中。
迁移前的注意事项
- DDL 传播:持续复制 (CDC) 会捕获 DML 操作以及
ADD COLUMN。其他 DDL 变更 (如DROP COLUMN和ALTER COLUMN) 不会自动传播,必须在目标端手动执行。
步骤 1:连接到源数据库
- 初始加载 + CDC — 复制现有数据,然后让目标端持续与后续变更保持同步。
- 初始加载 only — 一次性复制,不进行持续复制。
- CDC only — 跳过初始复制,仅复制从此刻起产生的新变更。
第 2 步:导出您的数据库 schema
pg_dump 命令。请在终端中运行它:
pg.sql。
点击下一步。
第 3 步:将 schema 导入您的 Managed Postgres 服务
psql 命令,用于将 schema 转储导入您的 Managed Postgres 服务。请在终端中运行该命令:
第 4 步:配置摄取设置
| 设置 | 默认值 | 说明 |
|---|---|---|
| 同步间隔 (秒) | 10 | 轮询 replication slot 的频率 |
| 初始加载的并行线程数 | 4 | 批量复制阶段使用的线程数 |
| Pull 批次大小 | 100,000 | 每个复制批次拉取的行数 |
| 每个分区的快照行数 | 100000 | 大表快照的分区大小 |
| 并行快照的表数量 | 1 | 可并发创建快照的表数量 |