メインコンテンツへスキップ
chDB は、ClickHouse v25.8.2.1 を基盤とする高速なインプロセス SQL OLAP エンジンです。 ClickHouse server に接続しなくても、プログラミング言語から ClickHouse の能力を活用したい場合に利用できます。

主な特長

  • インプロセス SQL OLAP エンジン - ClickHouse を基盤としており、ClickHouse server をインストールする必要はありません
  • 複数のデータフォーマット - Parquet、CSV、JSON、Arrow、ORC、さらに70種類以上のフォーマットでの入出力をサポート
  • データコピーを最小化 - C++ から Python への受け渡しに python memoryview を使用
  • 豊富な Python エコシステムとのインテグレーション - Pandas、Arrow、DB API 2.0 をネイティブにサポートし、既存のデータサイエンスワークフローにシームレスに組み込めます
  • 依存関係ゼロ - 外部データベースをインストールする必要はありません
  • DataStore API - SQL 最適化を備えた Pandas 互換 API で、630 以上のメソッドをサポート

DataStore: Pandas互換 API

新機能! DataStore は、使い慣れた pandas 構文と ClickHouse のパフォーマンスを組み合わせた、Pandas互換 API を提供します。
Hex ですぐに始める

ワンライナーでの移行

# インポートを変更するだけ - pandasのコードはそのまま動作します
- import pandas as pd
+ from chdb import datastore as pd

df = pd.read_csv("data.csv")
result = df[df['age'] > 25].groupby('city')['salary'].mean()

パフォーマンスのハイライト

操作pandasDataStore高速化率
GroupBy のカウント347ms17ms19.93x
複雑なパイプライン2,047ms380ms5.39x
フィルタ+ソート+Head1,537ms350ms4.40x
1,000万行でのベンチマーク

DataStore の機能

  • 630+ APIメソッド - 209 の pandas DataFrame メソッドと 185 以上のアクセサメソッド
  • 遅延評価 - 操作は最適化された SQL にコンパイルされます
  • SQL pushdown - フィルターと集計はデータソース側で実行されます
  • 幅広いデータソースに対応 - ファイル、S3、データベース、データレイクから読み取れます
詳細: DataStore ドキュメント

chDB はどの言語に対応していますか?

chDB では、次の言語バインディングを利用できます。

使い始めるにはどうすればよいですか?

pandas ユーザー向け

ClickHouse のパフォーマンスを活かしながら、使い慣れた pandas ライクな操作感を得るには、まず DataStore API から始めてください。

DataStore API リファレンス

SQL API ガイド

紹介ビデオ

chDB の概要を手短に紹介するビデオで、ClickHouse の強力な機能を Python 環境で活用する方法をご覧ください。

パフォーマンスベンチマーク

chDBは、さまざまなシナリオで卓越したパフォーマンスを発揮します。

chDB について

ライセンス

chDB は Apache License 2.0 に基づいて提供されています。詳細については LICENSE を参照してください。
最終更新日 2026年6月10日