跳转到主要内容

ClickHouse 26.4 版本发布,2026-04-30。 演示文稿, 视频

向后不兼容的变更

  • IN 运算符现在对 Bool 类型采用精确值语义:集合中只有 01 才会与 Bool 值匹配。此前,与 Bool 比较时,IN 集合中大于 255 的数值会被错误地钳制为 true,因此 SELECT CAST(1, 'Bool') IN (256) 会返回 1。现在它会正确返回 0。关闭了 #92980#93115 (Ashrith Bandla) 。
  • H3 库已更新到 v4,这提高了长度、面积等度量计算的精度。此更改不向后兼容,因为新结果与之前不同。#100348 (Alexey Milovidov) 。
  • 不再允许在 WITH 表达式列表元素中将 SELECT 用作裸标识符。#101059 (Aruj Bansal) 。
  • 此补丁更改了 Merge 表处理虚拟列的方式。如果底层表包含 _table_database,则会从存储中读取这些列;否则,这些列会在读取步骤之后通过表达式步骤填充。#101742 (Mikhail Artemenko) 。
  • IN 运算符现在也会拒绝复合类型 (TupleArrayMap) 内部发生的有损 Decimal 转换,使其行为与顶层标量比较保持一致。此前,精度检查仅对顶层标量值生效:例如,CAST('33.3', 'Decimal64(1)') IN (33.33) 会正确返回 0,但 CAST(['33.3'], 'Array(Decimal64(1))') IN ([33.33]) 会错误地返回 1,因为有损转换发生在 Array 内部。现在这两种情况都会正确返回 0#101812 (Nihal Z. Miaji) 。
  • 将默认 http_max_fields 从 1,000,000 下调到 1,000,并将 http_max_field_name_size 从 128 KB 下调到 4 KB,以限制 HTTP 连接在身份验证前的内存占用。新增了 http_max_request_header_sizehttp_headers_read_timeout 设置。依赖此前较高限制的用户可通过设置将其恢复。#103285 (Sema Checherinda) 。

新特性

  • 新增自动落盘机制:达到内存限制时,哈希 join 和并行哈希 join 会自动转换为 grace hash join。此行为由 max_bytes_before_external_join 控制。#97813 (János Benjamin Antal) 。
  • 新增对 Arrow Flight SQL 的支持。#91170 (Yakov Olkhovskiy) 。
  • Paimon 表引擎新增增量读取支持,使用 Keeper 支持的快照进度跟踪机制,包括通过 paimon_target_snapshot_id 定向读取快照增量,并扩展类型映射、分区裁剪和增量读取场景的测试覆盖范围。#93655 (XiaoBinMu).
  • stem 函数现已不再处于 Experimental 状态 (此前必须启用 allow_experimental_nlp_functions 设置) 。#102399 (Jimmy Aguilar Mena) 。现在,您可以使用 stem 函数,轻松对 StringFixedStringArray([Fixed]String)NullableLowCardinalityConst 列中的所有单词/标记进行词干提取。#99137 (Jimmy Aguilar Mena) 。
  • 在兼容性设置 use_strict_insert_block_limits 下,为 max_insert_block_size_rowsmax_insert_block_size_bytesmin_insert_block_size_rowsmin_insert_block_size_bytes 引入了 squashing 过程中的新行为。#94207 (Kirill Kopnev) 。
  • 新增函数 arrayAutocorrelation(arr [, max_lag]),用于计算数值数组在各个滞后值下的归一化自相关。支持整数、Float 和 Decimal 数组类型。#94776 (Wenyu Chen) 。
  • 新增 SQL 函数 obfuscateQuery。关闭 #98010#98305 (Xuewei Wang) 。
  • 新增支持将 Map 和 JSON/Object 类型用作字典属性。现在,字典可在 FLAT 和 HASHED 布局中存储和读取复杂类型,包括 Map(String, String)、Map(String, Array(String))、JSON 和 Nullable(JSON)。#98627 (yanglongwei).
  • 新增了两个新的 MergeTree 设置——replicated_fetches_min_part_levelreplicated_fetches_min_part_level_timeout_seconds——允许副本跳过从其他副本拉取新近插入的 (未合并的) parts,从而在高负载摄取期间降低复制开销。#98625 (tanner-bruce).
  • 为使用 JSONAllPaths 且采用 bloom_filter、tokenbf_v1、ngrambf_v1 和 text (倒排) 索引类型的 JSON 列新增 MergeTree 跳过索引支持,从而能够根据每个粒度中存在的 JSON 路径集合跳过相应粒度。#98886 (Pavel Kruglov).
  • printf 函数现已支持非常量格式字符串,因此可根据列值为每一行使用不同的格式模板。#98991 (Yash ).
  • 新增一个名为 commit_order 的投影索引,用于按插入顺序重组数据。#99004 (Mikhail Artemenko) 。
  • 新增 highlight 函数,可将文本字符串中出现的搜索词用 HTML 标签包裹起来 (默认为 <em>/</em>) 。支持 ASCII 不区分大小写匹配、自动合并重叠的匹配项,以及自定义开始/结束标签。#99131 (Peng).
  • 通过按归一化查询哈希实施配额,保护公网 ClickHouse 服务免遭滥用。1. 支持将 NORMALIZED_QUERY_HASH 用作配额键类型——为每个唯一的归一化查询单独划分配额桶,因此 CREATE QUOTA q KEYED BY normalized_query_hash 会分别跟踪每条不同的查询。2. 支持将 QUERIES_PER_NORMALIZED_HASH 用作配额资源类型——限制在一个时间间隔内任意单条归一化查询的最大执行次数,因此 MAX queries_per_normalized_hash = 100 可防止任何单一查询模式的运行次数超过 100 次。#99586 (Alexey Milovidov).
  • 现在,用户可以使用 NATURAL JOIN 语法编写 join 查询,该语法会自动基于所有同名列进行匹配,并在结果中对这些列去重。#99840 (Peter Nguyen).
  • 支持将 SET TIME ZONE 'tz' 用作 SET session_timezone 的别名。#99883 (phulv94).
  • 在 Web UI (play.html) 中新增了对参数化查询的支持:系统会检测诸如 {name:Type} 这样的查询参数,并显示可用于填写其值的输入字段。#100041 (Alexey Milovidov) 。
  • 支持在 FROM 中将 SQL 标准 VALUES 子句作为表表达式使用,例如 SELECT * FROM (VALUES (1, 'a'), (2, 'b')) AS t(id, val)#100143 (Desel72).
  • EXTRACT operator 新增与 PostgreSQL 兼容的单位:EPOCHDOWDOYISODOWISOYEARWEEKCENTURYDECADEMILLENNIUM。同时修复了此前会报错的 EXTRACT(WEEK FROM date)#100274 (Alexey Milovidov).
  • 新增了对带有 TO 范围限定符的 SQL 标准复合时间间隔字面量的支持,例如 INTERVAL '1:30' HOUR TO MINUTE。在内部,它会被分解为多个时间间隔之和。#100453 (Desel72).
  • 为 HTTP 连接池套接字的内核 TCP 接收和发送缓冲区内存 (sk_rmem_alloc, sk_wmem_alloc) 新增异步指标,并按每个连接组以 p50/p75/p90/p95 分位数和总量形式上报。#100575 (Sema Checherinda).
  • 为 ClickHouse Keeper 新增了 jemalloc profiling web UI,可通过 HTTP 控制端口上的 /jemalloc 访问。 #100606 (murphy-4o).
  • 新增命令 SYSTEM FLUSH OBJECT STORAGE QUEUE db.table PATH 'x',适用于 ordered 模式和 unordered 模式。#100709 (Bharat Nallan) 。
  • 新增函数 JSONAllValues,可将 JSON 列中的所有值以 Array(String) 形式返回;这些值会按路径名称排序,并以文本形式序列化。新增对 JSON 列上 JSONAllValues 表达式的文本索引支持。当在 JSONAllValues(json_column) 上创建文本索引时,该索引会自动用于过滤针对 JSON 子列的查询 (例如 json_column.key1 = 'value') 。#100730 (Anton Popov).
  • 新增设置 input_format_column_name_matching_mode,允许为输入格式采用不同的大小写匹配方式。#99346 (manerone) 。
  • clickhouse-keeper-client 新增 watch 命令,并为 getexistsls 命令添加 watch 支持。 #100834 (Den Kalantaevskii).
  • 为 ClickHouse Keeper 新增了 getChildrenRecursive (ListRecursive) 请求,并为 clickhouse-keeper-client 新增了 lsr 命令。此更改关闭了 #99916#100998 (Konstantin Vedernikov) 。
  • 新增函数 arrayTranspose,可接受二维数组 (矩阵) 并对其进行转置:SELECT arrayTranspose([[1, 2, 3], [4, 5, 6]])#101214 (Vitaly Baranov) 。
  • auto_statistics_types mergetree 设置的默认值为 'minmax, uniq' —— 系统会为新表中所有合适的列自动创建 minmax 和 uniq 统计信息 - materialize_statistics_on_insert 的默认值为 false —— 现在统计信息会在合并期间构建,而不是在写入时构建,从而降低写入开销。使用 SET materialize_statistics_on_insert = 1 可恢复旧行为。#101275 (Han Fei).
  • 为 materialized view 依赖链新增 prefer_dependency_replica 刷新设置,以减少跨副本复制延迟导致的数据缺失。#101591 (Seva Potapov) 。
  • 新增 hasPhrase (别名 matchPhrase) 函数,用于短语搜索 (连续的标记序列) 。搜索采用穷举方式,也就是说,文本索引暂未支持该功能。#101997 (Elmi Ahmadov) 。
  • 新增 s3_read_request_duration_microsecondss3_read_request_bytes 直方图指标,用于观测 S3 GET 请求连接的存续时间以及消耗的字节数,可在 system.histogram_metrics 和 Prometheus 端点中查看。 #102058 (Sema Checherinda).
  • 现在可以使用 + 运算符将 DateDate32 值与 TimeTime64 值相加,得到 DateTimeDateTime64 结果。例如,SELECT toDate('2024-01-15') + toTime('14:30:25') 会返回 2024-01-15 14:30:25。结果会按照会话时区计算,超出范围的结果则根据 date_time_overflow_behavior 设置处理。关闭 #95914#102421 (Nihal Z. Miaji).
  • 文本索引现已正式可用,并且无论 compatibility 设置如何都会保持启用状态,从而避免在备份恢复期间或以兼容模式运行时被意外禁用。#101518 (Nikita Fomichev) 。

Experimental 功能

  • 为 Iceberg 表新增 ALTER TABLE ... EXECUTE remove_orphan_files,用于识别并从对象存储中删除未被引用的文件。#99127 (murphy-4o).
  • 新增 query_plan_optimize_join_order_randomize 设置,用于将 join 重排序所依据的统计信息随机化,便于测试。#100643 (Vladimir Cherkasov).
  • 为 ClickHouse 新增 AI 函数支持,允许用户通过 SQL 调用 OpenAI 和 Anthropic 端点。aiGenerate 是首个此类函数。#100831 (George Larionov).
  • 新增 AI 函数:aiClassifyaiExtractaiTranslate,用于在 ClickHouse 中调用 LLM API。#100832 (George Larionov).
  • 新增 system.histogram_metric_log,这是一个新的系统表,会定期对所有直方图指标创建快照 (例如 S3/Azure 延迟、Keeper 请求处理各阶段的耗时) 。此外,system.histogram_metricsvalue 列改为 Float64,因为这样更灵活,也更兼容 Prometheus 数据模型。#103046 (Miсhael Stetsyuk). 该表结构很可能会在未来的发行版中发生变化。

性能提升

  • ClickHouse 现已能够在 SELECT 查询中基于最小/最大统计信息剪枝整个数据分区片段。#94140 (zoomxi).
  • 减少已完成变更的 ReplicatedMergeTree 表在执行只读操作时的锁竞争。#95771 (Eduard Karacharov).
  • 读取投影时遵循 optimize_read_in_order。修复 #89453#95885 (Andrey Zvonov) 。
  • 对 Hash Join 和 Concurrent Hash Join 进行了一些小优化。#96663 (Yarik Briukhovetskyi) 。
  • 通过在输入数据几乎全为唯一值时禁用 LowCardinality 列优化,优化 DISTINCT 转换。#97113 (Nihal Z. Miaji) 。
  • 来自 #97723LIKE 查询性能优化:现在这类查询可以使用文本索引。#98149 (Elmi Ahmadov) 。
  • 向量化数学函数 (explogsigmoidtanh) 现已在 AArch64 (使用 NEON/SVE) 以及 FreeBSD/Darwin 上获得加速;此前这些平台使用的是较慢的标量回退实现。 #98230 (Raúl Marín).
  • 对于按 MergeTree 主键列进行过滤、且使用字面字符串正则表达式交替分支 (例如 ^(abc-1|abc-2)) 的查询,如今只要这些备选分支具有共同前缀,就可以利用主键裁剪。#98988 (Yash ).
  • ORDER BY ... LIMIT 的 top-k 动态过滤扩展为支持 NullableStringCOLLATE 类型。#99033 (murphy-4o) 。
  • 对键值范围较小的 Int32Int64 键,使用直接索引哈希表来加速哈希连接。 #99275 (Hechem Selmi).
  • 使用单个字典的 LowCardinality 列在非连续查询场景下速度更快。#99285 (Ivan Babrou).
  • 通过对内部循环去虚拟化,加快 Float64 列上 var*Stablestddev*Stable 函数的执行速度。注意:这会启用编译器优化 (FMA/寄存器) ,从而在 ULP 级别改变浮点结果。#99460 (Riyane El Qoqui) 。
  • 对 32/64 字节的输入使用优化后的 Firedancer base58 编码 (对 base58Encode 自动启用) 。如果解码结果为 32/64 字节,则可使用优化后的 base58 解码 (需显式指定,如 base58Decode('...', 32) 或类似形式) 。#99461 (Joanna Hulboj) 。
  • 启用基于链接器节的优化 (-ffunction-sections-fdata-sections--icf=all) ,以减小可执行文件体积并提高指令缓存利用率。#99474 (Alexey Milovidov) 。
  • 修复了在多核机器上,带聚合的短查询出现负向扩缩容的问题。当查询读取的标记较少时,管道在聚合后将不再扩展到 max_threads,从而避免了大部分流几乎为空所带来的额外开销。#99493 (Alexey Milovidov).
  • 通过正确选择读取任务大小,利用并行副本提升查询性能。#99801 (Nikita Taranov).
  • 允许在通过用户态页缓存读取远程文件时执行预取。#99919 (Alexey Milovidov) 。
  • 在枚举子列时,避免了对 String .size 子列的不必要计算。#99941 (Pavel Kruglov) 。
  • 在酒店网络环境下使用拥有大量副本的集群时,减少 clickhouse-client 进度条的抖动。#100145 (Alexey Milovidov) 。
  • 当启用页缓存时,在 clickhouse-local 中启动 MemoryWorker,以便真正使用用户态页缓存。#100306 (Alexey Milovidov) 。
  • LIMIT 子句下推至 UNION ALL 中,以优化查询。#100364 (Alexey Milovidov) 。
  • ORDER BYStringFixedString 列的比较新增 JIT 编译支持,使以字符串为主的排序键在合并阶段的排序性能提升了 6–17%。与 @lgbo-ustc 共同完成。#100577 (Raúl Marín).
  • 当启用 read_in_order_use_virtual_row 并配合新的 read_in_order_use_virtual_row_per_block 设置时,现在每次从 MergeTree 读取完一个块后都会输出虚拟行边界信息,使 merge 能够在流处理中途重新调整 source 的优先级,适用于其数据被 WHERE/PREWHERE/JOIN 完全过滤掉的 parts。关闭 #99945#100603 (Vladimir Cherkasov) 。
  • 通过以兼容 dragonbox 的舍入方式扩展 itoa 的快速路径,加快了大整数值的 Float 到 String 转换。#100649 (Raúl Marín).
  • dragonbox 替换为 zmij,使 Float 到 String 的转换速度提高 1.5 倍至 3 倍。#100650 (Raúl Marín) 。
  • 通过以 Barrett reduction 替代软件除法并展开转换循环,加快了 Int128/UInt128 到字符串的转换。#100671 (Raúl Marín) 。
  • 避免在 uniqExact 并行合并时生成冗余线程。#100686 (Jiebin Sun) 。
  • uniqExact 增加批次并行合并支持。#100687 (Jiebin Sun) 。
  • 对于通过并行副本执行、且底层为 MergeTree 表的简单视图查询,并行化效果更佳。#100815 (Igor Nikonov) 。
  • 实现了在 parallel_replicas_allow_view_over_mergetree=1 时对简单视图启用并行副本的支持 (包括基于 MergeTree 表、符合条件的 UNION ALL 视图) 。这样可以并行化视图的外层查询,而不是内层查询,从而提升跨节点的查询并行度。#100958 (Igor Nikonov) 。
  • 当查询计划中存在带有 IN 的过滤器时,优化 full_sorting_merge 按主键顺序读取的性能。 #101261 (Nikita Taranov).
  • 通过缓存采样设置而非遍历整个 memory tracker 层级结构,优化内存分配/释放。#101267 (Azat Khuzhin).
  • 修复在 deduplicate_insert = 'enable' (自 26.2 起默认为启用) 时显著的 INSERT 性能下降问题:将数据哈希计算从 squashing 阶段推迟到 sink,并通过 updateHashWithValueRange 按批次对列进行哈希计算,使 22 列、500 万行数据的开销从约 2.5 秒降至约 0.5 秒。#101494 (Sema Checherinda) 。
  • 通过使用 try_lock 避免为无竞争获取计时,并移除持有时间测量,降低锁分析的额外开销。#101502 (Antonio Andelic) 。
  • arrayDotProduct 中手写的 AVX-512 内建函数替换为与平台无关、可自动向量化的循环,并新增对 AVX2 和 ARM NEON 的支持。#101571 (Peng).
  • 当值以转义字符串形式传入时 (例如 '{\'key\':1}') ,优化 INSERT VALUESMapArrayTuple 列的性能,避免不必要地回退到 SQL 表达式解析器。#102119 (Joanna Hulboj) 。
  • 修复了 RabbitMQ 表引擎 CPU 占用过高的问题。#102711 (Jaap Elst) 。
  • JOIN 顺序优化器现在可以根据现有 JOIN 条件推断传递性的等值 JOIN 谓词。例如,给定 A.x = B.x AND B.x = C.x,就能识别出等价关系 A.x = C.x,从而让优化器可以考虑在通过传递关系相连的表之间直接执行 JOIN。这可以提升星型和雪花 schema 的 plan 质量,因为在这类 schema 中,维度表通过共享的事实表相连。该功能由新的 enable_join_transitive_predicates 设置控制 (默认关闭) 。#98479 (Alexander Gololobov) 。
  • 通过预先并行取消合并操作,优化 TRUNCATE DATABASE TABLES LIKE#98597 (Shaohua Wang) 。
  • 为乘法增加单调性支持,从而使 key * constant 表达式也能进行主键剪枝。#98983 (Amos Bird).
  • 缓存字典在 hasKeys 中不再使用独占锁;改为在缓存读取时使用共享锁,从而减少锁竞争。#100796 (liuguangliang).
  • 在查询树中内联 VIEW 子查询,从而可对 VIEW 应用更多优化。#100830 (Dmitry Novik) 。
  • 优化服务器启动时的缓存加载。#101500 (Kseniia Sumarokova) 。
  • 当谓词选择性足够高时,为带有 FINAL 的 ReplacingMergeTree 实现延迟列物化。#101647 (Nikolai Kochetov) 。
  • 重新启用 optimize_rewrite_array_exists_to_has 优化 (自 23.10 起默认关闭) 。它会将 arrayExists(x -> x = elem, arr) 重写为快得多的 has(arr, elem);现在,当数组元素类型与 elem 不兼容、无法用于 has 时 (例如 DateString) ,会正确跳过此重写,因此此前会报错的查询现在仍可正常工作。关闭了 #71431#100944 (Alexey Milovidov) 。

改进

  • 改进了 EXPLAIN PLAN pretty=1 的输出:打印顶层查询的输出列,显示 join 关系的标签/符号以及预估结果行数和本地性,并包含 join/source 步骤中每一步的输出列。这些变更涵盖了 #98117 中的 Information Deficit 部分。#99462 (Kirill Kopnev) 。
  • 新增 MergeTree 表设置 share_nested_offsets (默认值为 true) 。当其设为 false 时,带点号名称的 Array 列 (例如 n.an.b) 会被视为彼此独立的列,而不再按旧版 Nested 语义共享偏移量文件,也不再校验数组大小是否相等。#98416 (Amos Bird) 。
  • 现在,用户可以在 users.xml/yaml 配置中指定多种身份验证方法 (SQL 中一直都支持) 。#91998 (Flip-Liquid).
  • 自动重新加载启用 TLS 的 Raft 节点间连接。#93455 (Evgeny).
  • cast_keep_nullable 扩展为支持 Dynamic/JSON 类型。启用后,对可为 Nullable 的类型中的 NULL 进行类型转换时会返回 NULL;否则会抛出 CANNOT_INSERT_NULL_IN_ORDINARY_COLUMN 错误。#96504 (Seva Potapov) 。
  • 通过引入对象池,降低了内部数据结构 (ISerialization 对象) 的内存占用。#96563 (Nikita Mikhaylov) 。
  • 为 keeper-client 的 XML 配置新增对 passwordidentity 字段的支持。#96800 (Grigorii Sokolik) 。
  • 改进对 Unity Catalog 的 Iceberg 写入支持。#98162 (Konstantin Vedernikov).
  • 新增设置 finalize_projection_parts_synchronously,支持在 INSERT 期间同步完成 projection parts 的最终化;默认仍保留现有的异步行为,同时可降低具有大量 projections 的表的峰值内存占用。#98228 (Amos Bird) 。
  • system.part_log 添加 projections_duration_ms 列,用于记录各投影合并/重建的耗时 (以毫秒为单位) 。#98292 (Amos Bird) 。
  • 改进了在 clickhouse-client 中通过 KILL QUERY 和取消查询 (Ctrl+C) 来取消使用 ExpressionTransform 和 NumbersRangedSource 的查询。#98908 (Roman Vasin).
  • 将硬编码的 source_table_engines 列表替换为通过 StorageFactory::getAllStorages() 进行运行时查找。这为一些此前缺失的表引擎补充了访问检查,并关闭了 #71544#98984 (pufit) 。
  • 新增一个设置,用于控制 Variant 和 Dynamic 的类型不匹配处理方式 (抛出异常或返回 NULL) 。#99085 (Bharat Nallan).
  • 改进 Iceberg 与 Spark 的兼容性:修复因混用存储路径和元数据路径而导致的路径处理不一致问题;强制 Iceberg 表写入的表位置必须为 URL 或绝对路径;由于某些 ClickHouse 读取器在遍历后不支持按字节计数,因此为 Azure 中的文件大小统计添加回退机制;以与 Spark 兼容的方式处理 version-hint.txt;引入类型级抽象,使今后更不容易混淆不同的路径类型;为 AzureLocal 添加测试,以验证无需中间上传/下载即可实现跨引擎互操作;修复 position delete 的使用问题,此前它依赖基于路径推断的启发式方法,而这种做法在这里并不适用。 #99163 (Daniil Ivanik). #100420 (Daniil Ivanik).
  • 修复了在 https://github.com/ClickHouse/ClickHouse/pull/92844 中引入的 IPartitionStrategy::cached_result 中可能存在的竞态条件。#99400 (Arthur Passos) 。
  • 现在,用户可以在 Arrow 格式中写入 ClickHouse 的 Interval 数据类型。#99519 (Peter Nguyen) 。
  • 新增了在 ArrowParquet 格式中导入和导出 UUID 数据类型的原生支持。现在,用户无需手动将其转换为字符串或采用其他变通方法,即可在 ClickHouse 与其他数据工具之间直接查询和传输 UUID 数据。支持自动推断顶层 UUID 的逻辑类型,并支持为嵌套 UUID 显式提供 schema 提示。#99521 (Ivan).
  • 支持对象存储上的 7z 归档文件。解决了 #70968#99600 (Alexey Milovidov) 。
  • 添加 ObjectStorageListedObjectsObjectStorageGlobFilteredObjectsObjectStoragePredicateFilteredObjectsObjectStorageReadObjects ProfileEvents,用于查看对象存储 (S3Azure 等) 文件列举和读取管道的内部信息。#99778 (Sema Checherinda) 。
  • 修复了在查询并非所有底层分布式/远程表都包含的列时,merge 表函数因 UNKNOWN_IDENTIFIER 错误而失败的问题。#99833 (Alexey Milovidov).
  • 现在,我们将 commit 时间计入 ReplicatedMergeTree 的变更总执行时间指标中。该时间在 #96376 之后丢失了。#99936 (alesapin).
  • MetadataStorageFromDisk 中待移除的 blob 对象添加预写日志,在删除对象时提高元数据与远程对象存储之间的持久性和一致性。#100019 (Maksim Kita) 。
  • 在嵌入式客户端 (SSH 和 WebSocket 协议) 中禁用 AI SQL 生成 (?? 命令) ,以防止访问服务器环境变量。#100290 (Alexey Milovidov) 。
  • 调整通过 catalog 进行 Iceberg 插入的接口。废弃以下设置:storage_catalog_typestorage_aws_access_key_id 等。#100334 (Konstantin Vedernikov).
  • 粘贴到 clickhouse-client 时,将制表符转换为 4 个空格。修复了 #100405#100416 (Raúl Marín) 。
  • show_data_lake_catalogs_in_system_tables 被禁用时,避免为了“Maybe you meant …”表提示而扫描整个远程数据湖目录。#100452 (Alsu Giliazova) 。
  • 在分区裁剪后再应用 distributed_index_analysis_min_indexes_bytes_to_activate#100477 (Azat Khuzhin) 。
  • 修复在使用空 IN/NOT IN 子句时,Parquet bloom 过滤器下推导致的断言失败。#100543 (zoomxi).
  • MinMax 列统计信息现在将最小值和最大值存储为 Field (带类型) ,而非 Float64。序列化格式除这些值外,还会包含列的类型名称。统计信息文件版本已升级到 V2;由旧版本写入的文件需要重新物化 (ALTER TABLE … MATERIALIZE STATISTICS ALL) 。修复 #53140#100605 (Han Fei) 。
  • 更新 cppkafka,包含了消费者关闭死锁问题的修复。#100612 (Azat Khuzhin) 。
  • 用于解析 Iceberg 中数据文件的对象信息现在包含从 manifest 文件中解析得到的文件行数以及以字节为单位的文件大小。#100645 (Daniil Ivanik).
  • 新增 use_separate_cache_arena 配置参数,以便控制是否将缓存内存分配区分离。#100664 (Seva Potapov) 。
  • 新增原生支持将 Apache Arrow 的 StringViewBinaryView 数据类型导入到 ClickHouse String 列中,提升了基于 Arrow 的摄取兼容性。#100762 (Ivan).
  • 如果在运行时更改了配置文件,一些 Keeper server 设置现在支持热重载:max_requests_batch_size、max_requests_batch_bytes_size、max_request_size、quorum_reads。#100773 (Michael Kolupaev) 。
  • 在 release build 中增加 MemoryAllocatedWithoutCheck/MemoryAllocatedWithoutCheckBytes 这两个 profile events 的计数。#100899 (Pavel Kruglov) 。
  • Cgroupv2 内存跟踪现在会将内核内存中的 slab_reclaimable 排除在外,从而能更准确地衡量不可回收的内存使用量。#100901 (Antonio Andelic) 。
  • use_partition_pruning = 0 现在不仅会禁用基于分区键的剪枝,还会禁用 MinMax 索引剪枝以及针对分区键列的计数优化。#100904 (Nihal Z. Miaji) 。
  • EXPLAIN [PLAN] 中,pretty=1 现在会以更易于阅读的格式输出 expression。#100927 (Kirill Kopnev) 。
  • accurateCastOrNullaccurateCastOrDefault 现已支持 Tuple 目标类型,包括元素为 Nullable 的嵌套 Tuples。此前,这些函数会拒绝 Tuple 目标类型,因为 Tuple 不能位于 Nullable 内。已关闭 #100820#100942 (Nihal Z. Miaji) 。
  • 修复了在浅色与深色主题间切换时 Play UI 中图表重复显示的问题。#101058 (Alexey Milovidov).
  • 将 chdig 更新到 v26.3.1 (perfetto UI,为 CPU/内存/合并/查询摘要添加迷你图、system.warnings,以及日志中的正则搜索) 。#101092 (Azat Khuzhin) 。将 chdig 更新到 v26.4.3 (perfetto 改进、修复通过 pastila.nl 共享的问题、火焰图差异对比、实时修改设置) 。#103145 (Azat Khuzhin) 。
  • 现在,WITH 子句在 SELECT 查询前可以带尾随逗号。#101093 (Aruj Bansal) 。
  • 新增 compress_per_column_in_compact_parts MergeTree setting,用于控制 Compact parts 内压缩块的组织方式。当为 true (默认值,保持当前行为) 时,每列都会开启一个新的压缩块,从而支持选择性解压。当为 false 时,一个粒度内的所有列都会打包到同一个压缩块中,从而为始终读取全部列的 workloads 提升压缩率和读取性能。#101114 (Amos Bird) 。
  • 仅在鼠标悬停于表名上时,才在 Play UI 中显示表信息气泡,而不是在悬停于整行时显示。#101118 (Alexey Milovidov).
  • 为 Play UI 侧边栏添加引擎专属图标,并优化表列表的使用体验。#101134 (Alexey Milovidov).
  • 支持 ArrowArrowStreamORC 和旧版 Parquet 格式中的 Nullable(Tuple)#101272 (Nihal Z. Miaji).
  • 在 web UI (play.html) 中将 TOTALS 行显示在表格页脚。#101286 (Alexey Milovidov) 。
  • 在 web UI (play.html) 中支持多查询模式:可一次运行多个查询,支持并行执行类似 SELECT 的查询,并分别显示每个查询的结果。#101290 (Alexey Milovidov) 。
  • 修复将结果表重构为 Web 组件后,play.html web UI 中列宽调整失效的问题。#101295 (Alexey Milovidov).
  • 支持按时间间隔限制在 MEMORY_LIMIT_EXCEEDED 时 jemalloc profile 的刷写次数。#101396 (Azat Khuzhin) 。
  • 新增 Keeper 设置 nuraft_streaming_mode (默认值为 false) 、nuraft_max_log_gap_in_streamnuraft_max_bytes_in_flight_in_stream。已关闭 #90743#101427 (Kseniia Sumarokova) 。
  • 新增了异步指标 CGroupMemoryUsedWithoutPageCache,用于报告排除了内核 OS page cache 和 ClickHouse 用户态页缓存后的 cgroup 内存使用量,对应于 MemoryResidentWithoutPageCache。同时还明确了 CGroupMemoryUsed 指标的说明。#101513 (Francesco Ciocchetti).
  • 在解析器层面为 SQL 标准 OVERLAY 函数语法添加语法糖。overlay 函数已存在;此次新增了对基于关键字形式的支持,使用 PLACINGFROMFOR 作为分隔符。#101681 (Desel72).
  • 为系统表 information_schema.tables 新增了列别名 INDEX_LENGTH,与该表中现有的大写别名保持一致。#101705 (Robert Schulze) 。
  • 系统表 information_schema.tables 现在会忽略非活跃的表 parts。这使显示的表大小数值更接近实际。#101706 (Robert Schulze) 。
  • ngrams 函数现在会拒绝无效的 ngram 长度。示例:SELECT ngrams('abc', 0) 现在会报错。#101922 (Robert Schulze) 。
  • #91820#90837 的后续改进:从错误信息中滤除不受支持的算法;在 FIPS 构建中运行 FIPS 专用测试。#102067 (Mikhail f. Shiryaev) 。
  • 将 Web UI (play.html) 中的单元格高度限制为最多三行,并支持点击展开。#102154 (Alexey Milovidov).
  • 新增了一个选项,可强制 S3 端点使用 (virtual/path) 风格。解决了 #82019#76007,是 https://github.com/ClickHouse/ClickHouse/pull/83168 的延续。 #102378 (Konstantin Vedernikov).
  • 现在,restore_replace_external_engines_to_null 设置也会跳过恢复使用外部引擎 (例如 DataLakeCatalogMySQLPostgreSQLS3) 的数据库,而不再失败或发起外部连接。#102400 (Nikita Fomichev) 。
  • 通过 HINT 模式为 hasPhrase 函数新增文本索引分析支持。#102438 (Elmi Ahmadov) 。
  • 在 ColumnDependency 中将 STATISTICS 设为只读,以修复执行 MATERIALIZE STATISTICS ALL 期间出现的 LOGICAL_ERROR。#102627 (Konstantin Bogdanov) 。
  • 在 keeper-as-server 模式下创建并填充 system.asynchronous_metric_log#102664 (Miсhael Stetsyuk) 。
  • 新增 default_system_log_flush_policy.skip_alias_columns 配置选项,允许在系统日志表中省略 ALIAS 列,从而修复以 S3 为后端且不接受 ALIAS 列的系统日志问题。#102669 (Miсhael Stetsyuk) 。
  • 不要为系统表启用自动统计信息,因为它们几乎没有机会用到这些统计信息。#102862 (Han Fei).
  • 为 LIKE 优化增加对 array 分词器的支持。#102880 (Elmi Ahmadov) 。
  • 即使在正式版构建中,也会发送 MemoryAllocatedWithoutCheck。#103064 (Azat Khuzhin) 。
  • 在 system.stack_trace 中提供每个线程的 untracked_memory 信息。#103065 (Azat Khuzhin) 。

缺陷修复 (官方稳定版本中用户可见的异常行为)

  • 修复了因 Lazy materialization 返回多余列而导致的 Block structure mismatch in stream 错误。修复 #95191#96682 (Nikolai Kochetov) 。
  • 修复了使用 ON CLUSTER 的数据脱敏策略查询中的逻辑错误。#97594 (Bharat Nallan) 。
  • 修复了在 GCS 上使用 Unity Catalog 时的一个 bug。#98456 (Melvyn Peignon) 。
  • DataLakeCatalog 现在在验证 auth_header 设置时,会遵循服务器上的 http_forbid_headers 配置。 #98827 (Michael Anastasakis).
  • 修复 S3 花括号展开通配符中的 N+1 HeadObject 调用问题。#99219 (Konstantin Bogdanov).
  • 当引擎本身也支持设置时,验证 CREATE 查询中的设置变更。#99279 (János Benjamin Antal) 。
  • 修复了以下问题:当表中包含一个表达式依赖于 EPHEMERAL 列的 MATERIALIZED 列时,ALTER TABLE UPDATE/DELETE 会因 Missing columns 错误而失败。#99281 (Yash ).
  • JDBC、ODBC 和 NATS 连接字符串中的凭据现在会在查询日志和 SHOW CREATE 输出中被屏蔽,从而避免敏感信息意外泄露。对于 URI 样式的连接字符串 (例如 {scheme}://{user}:{password}@{host}) ,现在仅屏蔽密码部分,其余内容仍然可见,以便于调试。nats_token 设置现在也会被屏蔽。#99344 (János Benjamin Antal) 。
  • 修复了 parseDateTimeBestEffort 在 DD-month-YYYY 格式中将以月份前缀开头的单词错误解析的问题。关闭 #99345#99350 (Pavel Kruglov) 。
  • 修复了在非 analyzer 下会忽略 TABLE_UUID_MISMATCH 的问题。#99380 (Azat Khuzhin) 。
  • 修复了一个问题:在同一请求中与 compatibility 一起发送显式设置时,如果其值与服务器默认值相同,这些设置可能会被静默忽略。#99402 (Raufs Dunamalijevs) 。
  • 修复了 hive 分区路径中带有前导零的数字导致报错的问题。修复了 #98801#99458 (Yarik Briukhovetskyi) 。
  • 修复在表被删除的同时仍有读取查询在运行时的 heap-use-after-free 问题 (过去 90 天内在 CI 中出现 19 次) 。#99483 (Alexey Milovidov) 。
  • 修复了 Keeper 中的一个 bug:如果同一 server 上另一个不相关的 session 恰好在错误的时机被关闭,读取请求可能会卡住 (导致 session 超时) 。#99484 (Michael Kolupaev).
  • 在应用补丁前验证列结构。#99531 (Seva Potapov) 。
  • 修复在包含 Dynamic 列的表执行合并期间,快速切换 SYSTEM STOP/START MERGES 时出现的垂直合并 rows_sources 断言失败问题。#99532 (Alexey Milovidov).
  • 修复了 toWeek() 的分区裁剪错误:在按 toYYYYMM(date) 分区的表上,带有 WHERE toWeek(date, mode) = N 的查询在第 49–52 周会返回空结果。#99542 (Takumi Hara).
  • 修复了在处理由 JOIN 生成的未引用行时,对 ColumnReplicated 进行操作的函数中出现的异常。#99564 (Hechem Selmi) 。
  • 修复 CLEAR COLUMN 不会重建 projections,也不会重新计算依赖被清除列的 materialized 列的问题,否则可能在后续合并期间导致异常或数据损坏。#99565 (Desel72) 。
  • 修复了 ConditionSelectivityEstimator 中的一个异常 (Bad get: has Tuple, actual type String) :当查询在已启用 use_statistics 且具有列统计信息的表上,对单个标量查询参数使用 IN 时 (例如 WHERE col IN ({p:String})) ,会触发该异常。#99614 (Ilya Yatsishin).
  • 带有未知投影的分片不应被标记为永久丢失。#99623 (Sema Checherinda) 。
  • 修复了一个罕见的逻辑错误异常:并发执行 SYSTEM STOP MERGESSYSTEM START MERGES 时,可能会在 vertical merge 期间抛出该异常。#99628 (Desel72).
  • 修复 injectRequiredColumns 中的悬空引用,避免在合并期间导致崩溃。#99679 (Tuan Pham Anh).
  • 修复了 Avro 格式读取器在读取超出目标列类型可表示范围的数值时的未定义行为。现在发生溢出时,查询会直接失败,而不再静默产生错误的值。 #99697 (asyablue22).
  • 修复了 executable 表函数参数中 shell 风格引号的解析错误。#99794 (Nikita Semenov) 。
  • 修复了 NativeReader 在反序列化行数不匹配的 Native 格式 stream 时误报 abort 的问题:将其从 LOGICAL_ERROR 改为 INCORRECT_DATA,使该错误按数据错误处理,而不会在 sanitizer/debug 构建中触发 abort()#99822 (Rahul Nair).
  • 修复当二进制流中的序列化类型为 DETACHED 时,Tuple 列在反序列化过程中导致进程中止的问题。#99823 (Rahul Nair).
  • 修复了在文件系统缓存动态调整大小期间,由于 SLRU 子队列提升中的竞态条件而误触发 LOGICAL_ERROR 异常的问题。#99850 (Alexey Milovidov) 。
  • 修复 async insert 查询在 query_log 和客户端输出中将 written_rowsread_rowsresult_rows 误报为 0 的问题。#99879 (Sema Checherinda) 。
  • 修复了 KILL QUERY 中的异常 “Bad cast from type X to Y”:当针对系统表的内部查询返回由 ColumnConst 包装的列时,会出现该问题。#99881 (Alexey Milovidov) 。
  • 修复 untuple 参数中关联子查询的逻辑错误。#99917 (Vladimir Cherkasov) 。
  • 修复了调用 rightrightUTF8 或其他子串函数时传入长度为 INT64_MIN (-9223372036854775808) 的值所引发的异常;此前由于整数溢出,会导致未定义行为。现在,这些函数会正确报告 ARGUMENT_OUT_OF_BOUND 错误。#99934 (Jimmy Aguilar Mena) 。
  • 现在 ClickHouse 应该能够正确处理 Spark 风格的表 (即每个文件都有完整的绝对路径,或相对于公共表路径的相对路径) 。修复了 #92348#99935 (alesapin) 。
  • 修复以下问题:当 ALTER 语句本身也带有 SETTINGS 时,对于包含带有 SETTINGS 的嵌套子查询的 ALTER TABLE ... MODIFY QUERY,会抛出“AST 格式不一致”异常。#99938 (Nikita Mikhaylov) 。
  • 由于疑似出现性能回退,撤销 #97114 “将 join step 的行数估算提前到检查是否只有 1 个子节点之前”。#99957 (Alexander Gololobov) 。
  • 修复了一个 bug:如果对文件发起的 HEAD 请求响应中缺少 Content-Length 请求头 (例如由于 GCS 中的解压转码) ,ClickHouse 可能会跳过这些文件。#99971 (Yarik Briukhovetskyi).
  • 修复在将 NumericIndexedVector 聚合状态与偶数整数常量相乘时发生的断言失败问题 (在 debug 构建中会抛出异常,在 release 构建中会产生错误结果) ;其原因是 pointwiseAddInplace 中带别名的 Roaring bitmap 发生了自异或。#99976 (Desel72).
  • 防止在链式 JOIN USING 的旧版过滤器下推中,因 JOIN 转换后键类型发生变化而触发 Unexpected return type 异常。#99999 (Alexey Milovidov) 。
  • 修复了在未解析的表函数参数中使用标量子查询时出现的 LOGICAL_ERROR 异常“表表达式的节点类型异常……实际为 IDENTIFIER”,例如 SELECT * FROM remote('localhost', view(SELECT 2 AS x), concat(x, (SELECT 1)))#100014 (Alexey Milovidov) 。
  • 修复了这样一个问题:当数据后的下一行带有尾随 SQL 注释 (--/* */) 时,INSERT 配合 VALUES 会失败。现在会跳过该注释,而不会将其解析为另一行。#100016 (Pratima Patel) 。
  • 修复了 arrayRemove 在比较包含 NULL 值的元组时出现异常的问题。#100017 (Alexey Milovidov) 。
  • 修复 system.asynchronous_inserts 中的跨用户数据泄露问题:任何对该表具有 SELECT 权限的用户都可能看到其他用户待处理的异步 insert 条目。现在,这些条目会按当前用户进行过滤,除非该用户拥有 SHOW_USERS 权限。#100024 (Shaohua Wang) 。
  • 修复了将 Time64 转换为 UInt64 时,值可能被限制在 24 小时内的问题。#100025 (Yarik Briukhovetskyi) 。
  • 修复了以下问题:当 CREATE DICTIONARY 的定义中包含带有不存在函数的列表值时,本地服务器会崩溃。#100036 (Yakov Olkhovskiy) 。
  • 修复了 CSVMsgPack 格式无法正确解析 Nullable(Tuple) 的问题。关闭 #99753#100038 (Nihal Z. Miaji) 。
  • 修复在将带有 WITH 函数表达式别名 (例如 tuple(...)) 作为 IN 右侧使用时,CREATE VIEWUNKNOWN_IDENTIFIER 而失败的问题。#100042 (Peng) 。
  • 修复时间序列聚合函数 (例如 timeSeriesResampleToGridWithStaleness) 在并行副本下配合 initializeAggregationAggregatingMergeTree 使用时,会因报错 ILLEGAL_TYPE_OF_ARGUMENT 而失败的问题。#100053 (Alexey Milovidov) 。
  • 修正 NumericIndexedVectorDataBSI 内部负值处理的问题。 #100086 (Daniil Ivanik).
  • 修复 accurateCastOrDefaultto*OrDefault 函数在输入为常量时无法保留 Const 列类型的问题。#100132 (Alexey Milovidov) 。
  • 省略的 LowCardinality(Nullable(T)) 类型查询参数现在会像 Nullable(T) 一样,正确默认使用 NULL。#100144 (Denys Melnyk) 。
  • 修复 StringSearcher.h 中使用未初始化值的问题。#100225 (Konstantin Bogdanov) 。
  • 允许通过 Ctrl+C 取消标量子查询及其他分析阶段的管道。此前,在长时间运行的标量子查询执行期间按下 Ctrl+C 不会有任何效果,必须等到子查询完成后才行。同时还修复了进度条和 JSON 统计信息,使其能够在 clickhouse-clientclickhouse-local 中正确报告标量子查询执行期间读取的行数。与 @YjyJeff 共同完成。#100230 (Raúl Marín) 。
  • 修复了涉及 Dynamic 列、交叉连接和运行时过滤器的查询中出现的 LOGICAL_ERROR 异常。该问题的原因是,ColumnVariant::filterhasOnlyNulls 优化路径中共享了 Variant 列指针,而不是对其进行克隆。关闭 https://github.com/ClickHouse/ClickHouse/pull/100147。 #100234 (Pavel Kruglov).
  • 修复了 Variant 数组的一个 bug:调用 arrayFirst/arrayLast 函数时,可能会错误地重新解释数据类型。例如,之前当实际底层的 Variant 类型为 Date 时,Array(Variant(Date, Bool)) 会被转换为 Bool#100255 (timothygk) 。
  • 函数有一些小幅调整:h3 函数现在能更好地校验边界;readWKB 会检查大小限制 (新增设置 max_wkb_geometry_elements) ;随机生成器函数会限制计算中的最大迭代次数。这是对 #93543 的后续修复。#100270 (Alexey Milovidov) 。
  • 修复了一个问题:当某些参数名是其他参数名的子字符串时,cutURLParameter 可能会错误地跳过这些参数。#100280 (Nikita Semenov) 。
  • 修复了 Iceberg metadata 文件路径设置中包含空字节时触发的异常。#100283 (Alexey Milovidov) 。
  • 修复了在 distributed_index_analysis 与包含 IN 子查询的谓词一同使用时,实际执行的查询数量呈二次增长的问题。#100287 (Anton Popov).
  • 修复在将 GROUP BY ... WITH TOTALS HAVINGUNION DISTINCT 及 Nullable 表达式组合使用时出现的 “Block structure mismatch” 异常。 #100293 (Alexey Milovidov).
  • 修复了当 block_size_bytes 参数大到极端时,estimateCompressionRatio 中出现 LOGICAL&#95;ERROR 异常的问题。#100298 (Alexey Milovidov).
  • 修复在调试构建中使用 GROUP BY CUBE(...) WITH ROLLUP 或类似组合时触发的“AST 格式化不一致”异常。#100376 (Alexey Milovidov).
  • 修复了使用列别名以及 SELECT *EXCEPT/INTERSECT 查询创建视图时出现的异常。#100386 (Alexey Milovidov) 。
  • 修复了这样一个问题:在发生心跳错误后,如果消费者卡在重平衡过程中,Kafka 引擎表上的 DROP TABLE 会无限期挂起。#100388 (Alexey Milovidov).
  • 修复了在使用 zip 归档执行备份/恢复操作时出现的 ReadBuffer is canceled. Can't read from it. 异常。#100400 (Alexey Milovidov) 。
  • 修复了以下 TOO_MANY_ROWS 异常:当数据分散在多个粒度边界不对齐的 parts 中时,带有 max_rows_to_read / force_primary_keySELECT count() 查询会触发该异常。#100408 (Alexey Milovidov).
  • 修复 system.completions,使其能够在所有权限授予组合下根据访问权限正确过滤数据库、表和列:按表、按库授权,以及按列 revoke。#100432 (Shaohua Wang).
  • 修复 NuRaft 中由竞态条件导致的 SEGFAULT。 #100444 (Pablo Marcos).
  • min/max/argMin/argMax 现在对 NaN 的处理与 ORDER BY 一致:NaN 始终会被跳过 (仅当所有值均为 NaN 时才返回) 。此前,由于 IEEE 754 的无序比较语义,结果取决于 NaN 在数据中的位置。#100448 (Raúl Marín) 。
  • 修复了一个复制粘贴导致的 bug:如果只设置了 delta_lake_snapshot_end_version 而未设置 delta_lake_snapshot_start_version,此前会被静默忽略,而不是报出 BAD_ARGUMENTS 错误。 #100454 (Mohammad Lareb Zafar).
  • StorageRabbitMQ::shutdown 不是幂等的 (它会无条件地访问弱指针,然后销毁相应的共享指针) ,但现在会被调用两次:一次在 StreamingStorageRegistry 中,随后一次在 DatabaseCatalog 中。此次修复使该方法变为幂等,并添加了防御性的空值检查。#100455 (Miсhael Stetsyuk) 。
  • 修复了将 accurateCastOrNullQBit 目标类型一起使用时触发的 LOGICAL_ERROR 异常。#100470 (Raufs Dunamalijevs).
  • 修复了在 optimize_on_insert=0 的 wide parts 中,向包含嵌套 Array(JSON) 列的表插入数据时出现的 LOGICAL_ERROR 异常 “Stream … not found”。#100475 (Pavel Kruglov).
  • RESTORE 期间,对备份 metadata 中的文件条目路径进行校验,以拒绝路径遍历、绝对路径和空名称。#100483 (Pablo Marcos) 。
  • 修复 LIMIT m OFFSET n WITH TIES 语法无法生效的问题。该语法等同于 LIMIT n, m WITH TIES,后者此前已可正常使用。#100491 (Nihal Z. Miaji).
  • 修复了在对带有命名字段且元素为 LowCardinalityNullable(Tuple) 列使用 IN 时出现的异常 “No set is registered for key”。#100523 (Alexey Milovidov) 。
  • 修复了 usearch sorted_buffer_gt::insert() 中的堆缓冲区溢出问题;该问题可能导致在执行向量相似性搜索时发生崩溃,或静默地损坏内存。#100537 (Dustin Healy) 。
  • 修复了 EXECUTE AS 会忽略查询中指定的 FORMATINTO OUTFILE 子句的问题。#100538 (pufit).
  • 修复 SAMPLE 在查询级 OFFSET 下 AST 格式不一致的问题。关闭 #100576#100579 (Pavel Kruglov) 。
  • 修复 Azure 上的 Polaris 目录问题。自 25.12 起,该目录在 Azure 上会在路径开头附加 bucket。例如,会变成 abfss://polaris-polaris@<some_url>.windows.net/polaris-polaris/<other-path>,而不是 abfss://polaris-polaris@<some_url>.windows.net/<other-path>。此 PR 会从路径中去掉 bucket。#100583 (Konstantin Vedernikov) 。
  • 修复了在某些块中默认列为 const 时,transform 中的类型不匹配异常。关闭了 #100574#100616 (Pavel Kruglov) 。
  • 修复了以下 NOT_FOUND_COLUMN_IN_BLOCK 情况:projection 的 SELECT 部分包含查询原始 SELECT 部分中不存在的列。关闭 #100194#100623 (Yarik Briukhovetskyi) 。
  • 根据文件大小和溢出限制校验 Npy 格式的形状维度,以防止恶意构造、维度大得不合理的 .npy 文件导致拒绝服务。同时还会拒绝空形状,并将每行内存限制在 2 GiB。#100625 (Raúl Marín).
  • 修复了在异步插入 (TCP) 以及所有通过 HTTP 进行的插入中解析 DateTime 值时忽略 session_timezone 的问题。#100647 (Sema Checherinda) 。
  • 当使用表函数作为 source 时,允许向 cluster()clusterAllReplicas() 表函数传递 sharding key (例如 cluster('name', view(...), sharding_key)) 。#100665 (Sergey Veletskiy) 。
  • 修复使用带有 Array 组合器和 NULL 参数的参数化聚合函数时导致的服务端崩溃 (断言失败) 问题,例如 quantileIfArrayArray(0.5)([[NULL]], [[1]])#100679 (nerve-bot) 。
  • 修复在启用 use_variant_as_common_type 时,计算空元组和非空元组的共同超类型时出现的异常。#100699 (Antonio Andelic) 。
  • 当配置了 Azure Blob 存储 disk,但端点暂时无法访问 (例如 DNS 故障) 时,服务器不再启动失败。#100701 (Raúl Marín) 。
  • 修复了 positiveModulo 中的未定义行为:当无符号除数超出有符号结果类型的表示范围时,会出现该问题。#100705 (Raúl Marín).
  • 修复了在启用 use_top_k_dynamic_filteringORDER BY 列为 DynamicVariant 类型时发生的服务器崩溃问题 (逻辑错误“来自 __topKFilter 的返回类型异常”) 。#100742 (Groene AI) 。
  • 修复在包含 LowCardinality 元素的 Tuple 键上,结合 PREWHERE/WHERE 使用 has() 函数时导致的 server 崩溃问题。#100760 (Groene AI) 。
  • 修复在存在并发写入时,从 S3 对象存储上的 LogStripeLog 表读取数据时出现的 file_offset_of_buffer_end <= getFileSize() 断言失败问题 (会在调试构建中抛出异常) 。#100763 (Alexey Milovidov) 。
  • 修复了一个异常:当 WHERE 子句在已启用统计信息的表中包含函数表达式 (例如 toDecimal64(col, 3)) 时,统计信息选择性估算器会触发该异常。现在,估算器会跳过此类谓词,而不再尝试进行无效的类型转换。#100764 (Han Fei) 。
  • 修复了一个罕见问题:带重排序的 join 可能产生错误结果。#100790 (Yarik Briukhovetskyi) 。
  • 修复了优化后的简单 count 中 AggregateFunction 参数类型错误的问题;此前,在分布式表上查询诸如 count(v0 + v1) 之类的表达式时,会触发 NUMBER_OF_ARGUMENTS_DOESNT_MATCH 异常。#100794 (YjyJeff).
  • 某些目录可能会在 select * from system.databases 查询结果的 SETTINGS 部分暴露一些敏感信息。此 PR 可防止这种情况发生。#100800 (Konstantin Vedernikov).
  • 修复了 toStartOfInterval 在使用 Week、Quarter 或 Year 时间间隔、指定 origin 参数且时间间隔值极端时出现的未定义行为 (有符号整数溢出) 。 #100817 (Raúl Marín).
  • 修复了 IfDistinctDistinctIfIfState 聚合函数组合器在返回类型为 Tuple 且一个或多个参数为 Nullable 时,因引入 Nullable(Tuple) 而无法读取旧版已序列化状态的问题。关闭了 #98917#100826 (Nihal Z. Miaji) 。
  • 修复了因连接池释放后仍被使用而导致的 s3Cluster 和分布式查询段错误。#100837 (Konstantin Bogdanov) 。
  • 修复服务器关闭期间加载字典时,因空指针解引用而导致的 segfault。Context::getUserDefinedSQLObjectsStorage (会解引用 user_defined_sql_objects_storage) 会被字典线程并发调用,而此时主线程会调用 Context::shutdown (将 user_defined_sql_objects_storage 设为 null) 。我们需要确保在执行 Context::shutdown 之前,先在字典加载器中禁用后续更新、终止当前正在运行的字典查询,并等待字典加载线程结束。做法与普通查询类似。#100839 (Miсhael Stetsyuk) 。
  • 修复了 ULIDStringToDateTime 在输入包含非 ASCII 字节时发生的缓冲区溢出问题。#100843 (Konstantin Bogdanov).
  • 修复了在启用 distributed_group_by_no_merge=1 时,查询封装多个表 (包括 Distributed 表) 的 Merge 表 (或 merge() 表函数) 时发生的崩溃 (LOGICAL_ERROR) 问题。#100859 (Groene AI).
  • 启用 Cast_keep_nullable 后,将 dynamic null 转换为 variant 时不会抛出异常。#100864 (Seva Potapov) 。
  • 修复了 clickhouse-keeper-clientgetexistsls 命令将重复的 watch_id 错误消息输出到 stdout 而非 stderr 的问题。#100893 (Mohammad Lareb Zafar).
  • 修复了 intDiv/intDivOrZero 在 Nullable Tuple 数组上抛出的异常,例如 SELECT intDiv([divide((1, 2), ... AND NULL)], 2). #100895 (Raúl Marín).
  • 在存储 StorageAlias 的定义之前,先对其引擎参数进行求值,这样像 currentDatabase() 这样的表达式在保存到数据库前就会被解析为字面量。#100902 (Nikolay Degterinsky).
  • 修复在 query_plan_merge_expressions = 0ExpressionStep 直接位于 ReadFromMergeTree 之上时,processAndOptimizeTextIndexFunctions 的问题。修复了 #100879#100909 (Jimmy Aguilar Mena) 。
  • 更新 replxx,纳入对 do_complete_line 中越界访问问题的修复。#100925 (Azat Khuzhin) 。
  • 修复了启用 shard-by-PK 优化的 JOIN 在使用查询条件缓存、且部分 parts 被缓存条件过滤掉时会返回错误结果的问题。 #100926 (Groene AI).
  • 修复了在某些情况下,divideintDiv 在索引分析期间用于过滤表达式时返回 ILLEGAL_DIVISION 的问题。#100928 (Nihal Z. Miaji) 。
  • 修复了异步启动期间因启动依赖顺序错误,导致带内部表的 materialized view 出现“目标表不存在”错误的问题。 #100946 (Nikolay Degterinsky).
  • 修复了 parseDateTimeBestEffort 在解析小数秒超过 18 位的日期时间字符串时出现的未定义行为 (有符号整数溢出) 。#100948 (Vasily Chekalkin) 。
  • 修复了这样一种崩溃:使用文本搜索索引时,如果 IN 子句包含 Tuple 子查询,例如 WHERE (id, str) IN (SELECT (id, str) FROM ...),或者子查询中的列数与 IN 左侧元组中的列数不一致,就会触发该问题。#100959 (Anton Popov).
  • 修复了从使用稀疏列序列化的 MergeTree 表构建 Polygon 字典时的崩溃问题。#100964 (Anton Popov).
  • 修复将 INTERSECT ALL / UNION ALL 与常量折叠表达式一起使用时出现的逻辑错误 “Invalid action query tree node”。#100977 (Alexey Milovidov) 。
  • 修复了 sumCountOrDefault 聚合函数的一个问题:在引入 Nullable(Tuple) 后,当存在一个或多个 Nullable 参数时,无法读取旧版序列化状态。关闭 #100882#101021 (Nihal Z. Miaji).
  • 修复了合并算法中的崩溃问题 (Logical error: isConst/isSparse/isReplicated assertTypeEquality) :当惰性列复制 (enable_lazy_columns_replication) 生成的 ColumnReplicated 列流入归并排序管道,且部分输入延迟到达时,会触发该问题。#101036 (Groene AI).
  • 修复了在 SELECT 中同一别名用于多个表达式时误报 UNKNOWN_IDENTIFIER 错误的问题;现在会正确报告 MULTIPLE_EXPRESSIONS_FOR_ALIAS 错误。#101040 (Alexey Milovidov) 。
  • 修复了这样一个问题:当声明的时区与表达式中的时区不一致时,DateTime/DateTime64 类型的 ALIAS 列不会应用时区转换。#101043 (Alexey Milovidov) 。
  • 修复了 query_log 未记录视图、子查询和 INSERT ... SELECT 所涉及行策略的问题。尽管行策略在查询计划阶段已生效,但此前不会为了记录日志而从子规划器传递到父规划器。现在,行策略 (仅用于日志记录) 会保存在 QueryAccessInfo 中,以便规划器和子规划器都能对其进行填充。#101044 (Narasimha Pakeer).
  • 修复 DirectJoinMergeTreeEntity 中的异常:当管道块包含 ColumnConst 列,且与普通列合并时,会触发该异常。#101046 (Alexey Milovidov).
  • 修复 CTE 列别名格式中的多余空格 (WITH t (a, b)WITH t(a, b)) 。#101049 (Alexey Milovidov).
  • 修复启用 analyzer 时,remote/cluster 表函数与 merge 等嵌套表函数一起使用时失败的问题。#101055 (Alexey Milovidov).
  • 修复了在 prefer_localhost_replica=1 时,分布式查询中 OFFSET 被重复应用两次、导致返回行数少于预期的问题。#101071 (Nihal Z. Miaji).
  • 修复了在 format_regexp 设置中使用无效正则表达式时,使用 Regexp 格式会导致崩溃的问题。 #101074 (Nihal Z. Miaji).
  • 修复在并行副本场景下使用 serialize_query_plan=1 时,timeseries 聚合函数报出“Illegal type Decimal64 of start parameter”错误的问题。#101083 (Groene AI).
  • 修复了在带有 PREWHERE 的投影配合 ORDER BY ... LIMIT 使用时,optimizeLazyMaterialization 中出现的异常。#101115 (Anton Popov) 。
  • 修复了在启用 aggregate_functions_null_for_empty = 1 设置时,使用仅限内部使用的 Null 组合器 (例如 sumNullavgNull) 的聚合函数会导致服务器崩溃 (SIGABRT) 的问题。#101147 (Groene AI).
  • 修复了文件系统缓存写入路径中的一个释放后使用问题;该问题可能会在为已完成的 File 段记录日志时导致从已释放的内存中读取 (由 BuzzHouse 中的 MemorySanitizer 检测到) 。#101161 (Groene AI) 。
  • 修复了以下服务器崩溃问题:当分布式索引分析遇到一个 GLOBAL IN 谓词,且其集合是在未显式指定元素的情况下构建时,会触发 “Trying to attach external table to a ready set without explicit elements”。#101178 (Groene AI).
  • 修复了在启用 JIT 编译时 (达到编译阈值后) ,Decimal 列上的 MAX/MIN 聚合函数返回错误结果的问题。#101203 (Raúl Marín).
  • 修复以下问题:执行轻量级删除后,minmax_count_projection 和简单的 COUNT(*) 优化会被永久禁用,即使所有带有轻量级删除掩码的 parts 都已合并消除。#101212 (Anton Popov).
  • 修复了一种情况:远程对象在 listread 之间被覆盖时,先前会产生过期的对象元数据,从而导致缓存报出 Having zero bytes, ... 逻辑错误。#101219 (Kseniia Sumarokova).
  • 修复了查询带有 ORDER BY CAST(lc_column, 'Type') 的 MergeTree 表时的服务器崩溃问题 (LOGICAL_ERROR: Bad cast from ColumnVector to ColumnLowCardinality) ,其中 lc_column 的类型为 LowCardinality。#101220 (Groene AI).
  • 修复 S3Queue 中失效处理节点的清理问题。#101230 (Kseniia Sumarokova) 。
  • 修复了当 optimizations 参数无效时 mergeTreeAnalyzeIndexes() 中的 UB 问题。 #101253 (Azat Khuzhin).
  • 修复在分区 Iceberg 表上连续执行 ALTER TABLE UPDATE 时出现的 Logical error: 'partitions_count > 0' 异常。#101278 (Desel72).
  • 修复了在 MergeTree 表中,当大整数常量 (例如 256、2147483648) 在带有 AND 的 WHERE 子句中作为布尔谓词使用时导致查询结果错误的问题。例如,SELECT count() FROM t WHERE (2147483648 > b) AND 2147483648 之前会错误地返回 0,而不是匹配所有行。#101287 (Groene AI).
  • 修复在使用 Replicated MergeTree 的 Delta Lake 集群上执行 insert-select 时出现的问题。#101299 (Konstantin Vedernikov) 。
  • 修复了以下崩溃问题:当标量子查询引用一系列存在依赖关系的 materialized CTE 时,会出现“逻辑错误:在 materialized CTE 完成物化之前读取它”。#101305 (Groene AI) 。
  • 修复 IStorage::getDependentViewsByColumnstorage_id 的数据竞争问题。#101385 (Nikolay Degterinsky) 。
  • 修复 BACKUP FROM SNAPSHOT AST 的格式化和克隆相关问题。#101405 (Pablo Marcos) 。
  • 修复在启用 enforce_keeper_component_tracking 时查询 system.part_moves_between_shards 会触发 LOGICAL_ERROR 崩溃,并显示 “Current component is empty” 的问题。#101462 (Groene AI) 。
  • 修复了在 fuzzer 生成格式错误的 Dynamic 类型 AST 时,DataTypeDynamic::create() 中出现的段错误。 #101464 (Groene AI).
  • 在未启用 DeltaKernel 的情况下使用 delta_lake_snapshot_version 或 CDF 版本设置时,将抛出错误,而不是悄然返回错误数据。#101489 (Desel72).
  • 修复了在启用 analyzer_compatibility_join_using_top_level_identifier 设置时,同时使用 ARRAY JOIN 和 JOIN USING 会触发的 NOT_FOUND_COLUMN_IN_BLOCK 异常。关闭 #101240#101507 (Vladimir Cherkasov) 。
  • 修复了以下问题:当表使用 iceberg_metadata_file_path 创建且目标元数据版本已存在时,Iceberg INSERT 重试循环会失败。#101548 (Groene AI) 。
  • 在 arrayIntersect 及相关函数的结果列中去除 Nullable,以避免序列化/反序列化不一致。#101569 (George Larionov) 。
  • 修复从基于 IcebergLocal 表引擎的 materialized view 执行 SELECT 时服务器崩溃 (LOGICAL_ERROR) 的问题。#101577 (Groene AI) 。
  • 修复了使用 NaN 参数调用 intExp10 时错误消息有误的问题——原本显示为 intExp2,而不是 intExp10#101582 (Krishna Chaitanya) 。
  • 修复了在 #100288 重构后,allow_statistics=0 无法阻止 ALTER TABLE ADD STATISTICSALTER TABLE DROP STATISTICS 的问题。#101585 (Krishna Chaitanya) 。
  • 修复 KeeperMap CREATE TABLE 在处理 25.1 之前部分 drop 操作遗留的 ZooKeeper 节点时,若缺少 drop_lock_version 节点,会因“无法为表创建元数据”而失败的问题。#101623 (Antonio Andelic) 。
  • 修复了读取 Map 子列时可能出现的逻辑错误。关闭了 #100769。关闭了 #101336#101641 (Pavel Kruglov).
  • 修复 getSubcolumnData 中精确子列匹配的优先级,使其高于前缀匹配,以避免可能发生的崩溃。关闭 #101271#101645 (Pavel Kruglov) 。
  • 修复了在禁用 use_variant_default_implementation_for_comparisons 时,将 LowCardinality 列与 Variant NULL 常量比较时发生的崩溃问题 (LOGICAL_ERROR: “ColumnUnique 不能包含 null 值”) 。#101690 (Groene AI).
  • 内容:为 Bzip2ReadBuffer 增加了空 stream 保护,因此当内部 stream 为空时,将返回 EOF,而不是抛出 UNEXPECTED_END_OF_FILE。 #101691 (ClickGap AI Bot) 。
  • 内容:修正了 system.s3_queue_settingssystem.azure_queue_settingsalterable 列说明文本前后颠倒的问题——将 01 的含义对调,使其与实际代码行为一致。#101703 (ClickGap AI Bot) 。
  • 修复 positiveModulo(tuple, number) 被错误分派到除法而非取模运算的问题。#101709 (ClickGap AI Bot) 。
  • 修复了在经缓存封装的 disk 上配置 thread_pool_size 时发生的 crash。此前,FileCacheSettings::loadFromConfig() 会将 thread_pool_size 识别为未知设置,从而导致 server 无法启动。该设置是一个有效的 IDisk parameter,用于控制在后台分片 moves 过程中执行 disk 间复制操作时使用的线程数量。#101712 (Francisco).
  • 修复了 RANGE_HASHED 字典创建时静默接受不存在的 MAX 范围属性,以及在最小和最大范围属性类型不一致时使用错误类型配置的问题。该 bug 源于 buildRangeConfiguration 中的一处复制粘贴错误:查找最大属性时误用了 min_attr_name,而不是 max_attr_name#101732 (Yakov Olkhovskiy) 。
  • 修复 CPU 租约调度器中的 use-after-free 崩溃:当等待计时器的生命周期长于其引用的 ProfileEvents::Counters 所属工作线程时,会触发该问题。#101761 (Antonio Andelic).
  • 修复了 arrayLevenshteinDistanceWeighted 和 arraySimilarity 函数中的错误。已关闭 #101725#101767 (Mikhail f. Shiryaev) 。
  • 修复了 Prometheus 查询 API 忽略 POST 表单请求体的问题。#101794 (James Cunningham) 。
  • 修复因 S3 Client::~Client 析构函数中的异常逸出而导致服务器终止的问题。#101798 (Gagan Dhakrey) 。
  • 修复了在并行反序列化 Object 类型动态路径时的 use-after-scope 问题;读取包含大量动态路径的表时,该问题可能导致崩溃。 #101823 (Antonio Andelic).
  • 修复了在某些 (非默认) 格式设置下,函数 formatDateTime 使用格式说明符 %W 时输出错误的问题。#101847 (Robert Schulze) 。
  • 修复了 SYSTEM INSTRUMENT ADDshouldPatchFunction 的假阴性问题:当搜索字符串首次出现在经反修饰的符号名的模板参数中时,会出现该问题。#101885 (Pablo Marcos).
  • 修复在周期性刷新期间因 ZooKeeper 会话过期导致 UDF registry 丢失的问题——在完全刷新成功之前,所有用户自定义函数都可能无法使用。#101891 (Nikita Fomichev).
  • 修正了 system.codecsAES_256_GCM_SIV 的描述,将其显示为 AES-256 而非 AES-128#101917 (Jimmy Aguilar Mena) 。
  • 修复了在 JSON 列上创建的 min-max 索引因使用错误极值而导致查询结果错误的问题。关闭 #101700#101918 (Pavel Kruglov).
  • splitByString 分词器现在会拒绝空字符串分隔符。#101928 (Robert Schulze) 。
  • 修复了 materialize_skip_indexes_on_merge=false 在合并期间未能禁止构建文本 (全文) 索引的问题。此前,只有非文本跳过索引 (minmax、set、bloom_filter) 会被禁止构建;文本索引仍会继续构建,造成 CPU 和 I/O 浪费。#101932 (Groene AI) 。
  • sparseGrams 分词器生成的标记长度超过了指定的最大长度 (原因是实现中将 +2 硬编码了进去) 。#101934 (Elmi Ahmadov) 。
  • 修复 MergeTreeDataPartWriterWide::cancel 中的 SIGSEGV:当流构造函数在 addStreams 期间抛出异常时,column_streams 中会留下一个空条目。#101936 (Antonio Andelic) 。
  • 修复了在启用 query_plan_direct_read_from_text_index 时,查询带有全文索引的 Merge 或 Distributed 表且组合过滤条件中同时混用 has*Tokens 和 LIKE 时出现的异常。#101939 (Jimmy Aguilar Mena).
  • 修复了解析原生协议查询数据包时,QueryProcessingStage 值无效所导致的未定义行为。#101972 (Raúl Marín).
  • 当初始查询解析期间发生异常时,会关闭 TCP 连接,以防止从失去同步的流中读取无效数据。#101989 (Raúl Marín) 。
  • 修复 26.1+ 版本中文件系统缓存的 SLRU 竞争问题,该问题可能导致空间预留逻辑错误。在调试构建中,还可能触发断言失败:'Previous state is Evicting, but expected state to be Active while setting Evicting flag for 2c1e3484ecdc6b78a8978fa5b17c5097:0:339 (state: Evicting)'.#101991 (Kseniia Sumarokova) 。
  • 修复了将带有尾随数据的字符串转换为空 Tuple() 类型时触发的异常。 #102011 (Alexey Milovidov).
  • 修复了在使用 ORDER BY 和 grace_hash join 算法的查询中,行顺序不正确的问题。受影响的查询可能会以错误顺序返回结果,从而在无任何提示的情况下产生错误输出。#102036 (János Benjamin Antal).
  • 修复了一个 LOGICAL ERROR (索引类型大小异常) 问题:配置了 max_bytes_in_join 设置时,RIGHT JOIN 和 FULL JOIN 查询中可能会出现该错误。#102042 (Jimmy Aguilar Mena) 。
  • 修复了 Time 包含负值时与日期时间比较会返回错误结果的问题。关闭了 #101670#102056 (Yarik Briukhovetskyi) 。
  • 修复了 UDF refresh 中的崩溃问题:ZooKeeperRetriesControl 在未续订已失效 (expired) 的 ZooKeeper 会话时进行了 retry,因而导致崩溃。#102059 (Nikita Fomichev).
  • 修复格式化解锁快照时空格缺失的问题。关闭 https://github.com/clickhouse/clickhouse/issues/101723。 #102063 (Han Fei) 。
  • 修复查询带有 WHERE 子句的视图时发生的崩溃 (SIGSEGV) 问题:当内部查询生成的列类型与视图元数据不一致时 (例如,启用 join_use_nulls 的 LEFT JOIN 产生的 Nullable) ,会触发该问题。#102085 (Miсhael Stetsyuk).
  • 修复了因缓存键不匹配,移除分片后 VectorSimilarityIndexCache 缓存项始终无法被淘汰的问题。 #102152 (Seva Potapov).
  • 使用 rabbitmq 存储时,对损坏消息进行 NACK。 #102157 (Seva Potapov).
  • 修复在解析错误的空元组字符串时的逻辑错误。#102289 (Nihal Z. Miaji) 。
  • 修复了在使用 optimize_aggregation_in_order=1 时,若 GROUP BY 列的顺序与表的排序键不同,会导致聚合结果错误 (出现重复行) 的问题。#102299 (Groene AI).
  • 修复了在使用 Avro 格式时,IcebergLocal ALTER TABLE ... UPDATE 发生崩溃的问题,原因是 LowCardinality/Nullable 包装类型在序列化前未先解包。#102337 (Desel72).
  • 修复了在对不带表达式的 materialized 列执行变更时发生的段错误。关闭了 #102185#102342 (zoomxi) 。
  • 修复了 Coalescing merge tree 对 Array 类型的处理问题。此更改关闭了 #89509#102384 (Konstantin Vedernikov) 。
  • 修复了在启用 bloom filter 下推、且 WHERE 子句 包含等值/不等条件时读取 Parquet 文件会触发 segfault (或在调试构建中触发 LOGICAL_ERROR) 的问题。该崩溃是由 Parquet 预取器拉取 bloom filter 数据时发生越界内存访问导致的,还可能造成非确定性的错误查询结果。#102385 (Groene AI).
  • 修复了 SLRU 文件系统缓存动态调整大小期间发生的 LOGICAL_ERROR 异常中止问题;其原因是子队列之间共享了淘汰统计信息,以及对失败候选项采用了错误的恢复路径。#102396 (Antonio Andelic).
  • 修复了 Database Replicated 中不带目标表的别名表在新副本上初始化失败的问题。关闭 #101320#102397 (Nikolay Degterinsky) 。
  • 修复了在字符串搜索函数 (countSubstringsposition 等) 中,搜索由 null byte 完全构成的 needle 时发生的越界读取问题。#102401 (Raúl Marín).
  • compatibility 设置指向早于 26.1 的版本时,全文索引设置 (enable_full_text_indexallow_experimental_full_text_indexuse_skip_indexes_on_data_read) 将不再被禁用。此前,这可能会导致 SharedDatabaseCatalog 无法创建带有文本索引的表。#102422 (Nikita Fomichev) 。
  • 修复 printf 在末尾带有 % 时发生的越界读取问题。#102472 (Raúl Marín) 。
  • 修复了 AsynchronousMetrics 中调试构建里的一个 chassert 异常 ReadBuffer is canceled,其原因是 rewind 没有重置缓冲区的取消标志。 #102524 (Yuri Fedoseev).
  • 修复了在带有文本索引的列上,hasToken / hasTokenOrNull 处理仅由分隔符组成的 needle (例如 '()''!!!') 时的问题:此前,索引会悄然跳过所有粒度,而不是抛出 BAD_ARGUMENTS (对 hasToken 而言) 或返回 NULL (对 hasTokenOrNull 而言) 。#102544 (Jimmy Aguilar Mena) 。
  • 修复 keeper 中超大 multi 请求导致的 OOM。对于 OpenTelemetry tracing,我们此前会在 ZooKeeperRequest 对象中无条件为 OpenTelemetry spans 分配 >1 KiB 的空间——这意味着,对于特别大的 multi 请求,可能会额外尝试分配 >10 GiB 的内存。为解决这一问题,我们现在将 shared data 保存在静态内存中,并在 ZooKeeperOpentelemetrySpans 中使用 std::unique_ptr 替代 std::optional#102586 (Miсhael Stetsyuk) 。
  • 修复了以下问题:对现有 collection 执行 CREATE NAMED COLLECTION IF NOT EXISTS 时,会导致 NamedCollection 的 CurrentMetric 被错误抬高;此外,从配置或 SQL 存储加载的 collection 在启动时不会被初始化。关闭 #102507#102598 (Pablo Marcos) 。
  • 修复了在并发 DDL 导致本地分片返回空列时,getStructureOfRemoteTable 中抛出的异常。#102604 (Alexey Milovidov) 。
  • 修复了多个并发 CREATE TABLE IF NOT EXISTS 查询针对同一个 Shared database 上的 S3Queue 表时触发的 LOGICAL_ERROR 异常。#102610 (Nikita Taranov).
  • 修复了在使用 WHERE 过滤器读取 Nullable 列时,原生 Parquet V3 读取器中出现的 LOGICAL_ERROR 崩溃问题:“列子块中的行数异常”。#102628 (Groene AI) 。
  • 修复了 AzureWriteMicroseconds profile 事件描述中将 “write” 误写成 “read” 的问题。#102639 (Miсhael Stetsyuk).
  • 修复了在某些特殊情况下 row policy 会触发 ‘Not found column in block’ 异常的问题。#102648 (Yarik Briukhovetskyi) 。
  • 修复了 ClusterDiscovery 中的一个服务端异常:当静态集群 (在 config 中定义) 暂时没有存活节点时,会触发该异常。#102661 (Kseniia Sumarokova) 。
  • 修复了时区调整后发生溢出时日期数据类型推断错误的问题。关闭 #102601#102674 (Pavel Kruglov).
  • 修复了在等待过程中删除可刷新materialized view 时,SYSTEM WAIT VIEW 会一直挂起的问题。#102681 (Nikolay Degterinsky).
  • 修复了 CASE 搭配 Dynamic 表达式时对所有行都返回 ELSE 的问题。关闭 #102511#102684 (Pavel Kruglov) 。
  • 修复了使用二进制编码数据类型时,扁平化 Dynamic 类型的序列化问题。关闭了 #101911#102692 (Pavel Kruglov).
  • 修复了 format_schema_source=‘query’ 静默忽略多行结果的问题。关闭 #101905#102698 (Pavel Kruglov) 。
  • 通过 SSH 客户端报告实际退出码,而不是将所有错误统一映射为 1。关闭 #101741#102700 (Konstantin Bogdanov) 。
  • 修复动态/预定义查询处理程序中 HTTP 请求头丢失的问题。关闭 #101846#102706 (Konstantin Bogdanov) 。
  • 对折叠后的 jemalloc 堆内存剖析应用泊松采样校正,使其与 jeprof 的输出一致。此前,折叠格式由于未计入采样概率,低估了实际分配大小。#102759 (Antonio Andelic).
  • 修复了函数 hasPhrase 在参数为 NULL 时发生崩溃的问题。#102802 (Nikita Taranov) 。
  • 修复了在读取包含循环符号类型引用的递归 schema 的 Avro 文件时 server 发生崩溃 (SIGSEGV) 的问题。现在会检测并拒绝此类 schema,并返回清晰的错误消息,而不是直接崩溃。#102853 (Groene AI).
  • 修复服务器崩溃问题 (LOGICAL&#95;ERROR 断言) :当 Variant 列上的函数在 FunctionVariantAdaptor 中对结果进行类型转换时触发内存限制或其他非类型转换异常,异常现在会被正确传播,而不再被误归类为内部错误。#102855 (Groene AI).
  • 修复了在调试/sanitizer 构建中,若在 schema 推断期间抛出 std::length_error (例如由于 input_format_msgpack_number_of_columns 值极端或输入数据格式错误) ,导致服务器崩溃的问题。#102859 (Groene AI) 。
  • 使复制列和稀疏列在序列化时的 null 表示遵循相关设置 (例如 format_tsv_null_representation) 。#102888 (Hechem Selmi) 。
  • 已在 #103499 中回移:修复了这样一个问题:由于 Poco BufferedStreamBuf::flushBuffer 未处理来自套接字层的短写,导致 S3 请求失败且不会重试,而是报出 ios_base::clear: unspecified iostream_category error#102894 (Sema Checherinda) 。
  • 修复了这样一个问题:执行轻量级删除后,minmax_count_projection 和简单的 COUNT(*) 优化会被永久禁用,即使所有带有轻量级删除掩码的 parts 都已合并掉,也不会恢复。#102900 (Anton Popov).
  • 修复了因 LTO 导致的 jemalloc 随机崩溃问题。#102913 (Azat Khuzhin) 。
  • 在新的 analyzer 中,将行策略中的 OR 链优化为 IN。 #102915 (Azat Khuzhin).
  • 修复了因 page cache 以错误对齐方式释放内存而导致的 jemalloc metadata 损坏问题,该问题可能会引发 crash。#102918 (Azat Khuzhin) 。
  • 不带 materialized views 的普通 INSERTs 不再会请求过多的 ConcurrencyControl 槽位和线程 (使用 max_threads 而不是 max_insert_threads) ,从而避免在高 INSERT 吞吐量的集群上出现 CC 槽位饥饿和线程数暴涨。#102961 (Sema Checherinda) 。
  • 重新引入 ArrowMemoryPool,以便在达到内存限制时抛出 MEMORY_LIMIT_EXCEEDED,从而避免内核 OOM。 #102999 (Azat Khuzhin).
  • 修复了将 CAST 转换为 Nullable(DateTime) 时忽略 cast_string_to_date_time_mode 的问题。关闭 #101840#103035 (Pavel Kruglov).
  • 文本索引直接读取优化现已支持 ALIAS 列。#103037 (Anton Popov) 。
  • 已在 #103454 中回移:修复了以下问题:当聚合投影与查询匹配,且表中的某些 parts 没有投影数据时,SELECT DISTINCT 会在无提示的情况下返回不完整的结果 (例如,在已包含数据的表上添加了该投影,但未运行 MATERIALIZE PROJECTION) 。关闭 #102951#103052 (Nihal Z. Miaji) 。
  • 修复了在 MergeTree 表上使用 WHERE x AND toNullable(N) 时返回错误结果的问题:当 N 是位宽大于 UInt8 的整数 (例如 256655352147483648 或任何负整数) 时,就会出现该问题。由于 splitFilterNodeForAllowedInputs 在将化简后 ANDNullable 余项转换为布尔值时错误地使用了 NULL 作为零值,导致在三值逻辑下比较结果变为 NULL,从而错误地丢弃了所有行。#103077 (Groene AI).
  • 修复了字符串搜索函数 (例如 locateposition) 在参数顺序颠倒传递时 (locate(needle, haystack)function_locate_has_mysql_compatible_argument_order = 1) ,在错误消息中报告错误参数类型的问题。#103102 (Alex Kuleshov).
  • 修复了这样一个问题:当 failpoint 处没有线程暂停时调用 disableFailPoint,可能导致 waitForPause 一直挂起。 #103119 (Shaohua Wang).
  • 将预认证 TCP Hello 数据包中的字符串大小限制为 64 KB,并新增 handshake_timeout_milliseconds 服务器级设置,用于限制握手总时长,防止未认证客户端占用过多内存或无限期占用线程。#103284 (Sema Checherinda) 。
  • 修复 Parquet ColumnIndex 统计信息中 String 列出现 min_value > max_value 的问题。#103334 (Saurabh Kumar Ojha) 。
  • 检查 Native 格式中格式不正确的扁平化 Dynamic 数据。#103392 (Pavel Kruglov) 。
  • 支持从 url 表函数填充 _time 列。#103437 (Nikita Taranov) 。
  • 修复了在 SVE 指令不可用时仍用其进行检测的问题。 #103568 (Raúl Marín).

构建/测试/打包改进

  • Libstemmer (Snowball) 依赖现已升级到较新的 v3.0.1 版本。#99256 (Jimmy Aguilar Mena) 。
  • 在 clickhouse-test 中将以下设置随机化:use_skip_indexes_for_top_kuse_top_k_dynamic_filteringquery_plan_max_limit_for_top_k_optimization#91782 (Nikita Fomichev) 。
  • 为函数实现了压力测试,用于检查其各项属性的健全性。#93543 (Michael Kolupaev) 。
  • llvm-project 提供自有的 CMake 配置,而不是导入上游配置。#97453 (Konstantin Bogdanov) 。
  • 在测试基础设施中对更多 optimize_* 设置进行随机化,以提升查询优化各个 pass 的覆盖率。#97547 (Alexey Milovidov) 。
  • 使用 Rust 工具链 nightly-2026-03-22。#98602 (Konstantin Bogdanov) 。
  • 采用 wasmtime v42.0.1。#98603 (Konstantin Bogdanov) 。
  • 改用 llvm-project 22.1.1。#98882 (Konstantin Bogdanov) 。
  • 将用于夜间按测试统计覆盖率的 SANITIZE_COVERAGE (自定义 sanitizer 回调、符号级粒度) 替换为基于 LLVM 源代码的覆盖率 (WITH_COVERAGE, -fprofile-instr-generate -fcoverage-mapping) 。现在,server 会在启动时从 ELF 段中读取自身的覆盖率映射,并通过新的 SYSTEM SET COVERAGE TEST 'name' 命令为每个测试收集 (file, line_start, line_end) 元组。定向 CI check 中的测试选择会针对新的 checks_coverage_lines CIDB 表执行行范围查询,并按候选测试覆盖的变更 diff 行数进行排序。#99513 (Nikita Fomichev).
  • 修复了 -O0 构建中的 llvm-libc 链接错误。#100023 (Zheguang Zhao) 。
  • 修复了容器启动时的两条错误消息:当配置中未包含 logger.loglogger.errorlog 设置时 (例如,所有日志消息都应输出到 STDOUT/STDERR 的情况下) 。#100239 (Simon) 。
  • 在 macOS 构建中,优先使用 ld64.lld,而不是 Apple 的 ld (cctools-port ld64) 。这应能显著缩短 Darwin 的链接时间,因为 cctools-port 的 ld64 在使用 -ffunction-sections-dead_strip 时非常慢。如果 ld64.lld 不可用,则回退到 ld#100275 (Alexey Milovidov) 。
  • 用于确保目录不会注册任何机密信息的测试 (REST + Glue) 。#100307 (Konstantin Vedernikov) 。
  • 在不同的随机化设置下重复运行近期修改过的测试。#100385 (Alexey Milovidov) 。
  • 在 CMake 中跟踪 #embed 文件依赖项,并启用 ccache 的 depend 模式,以确保正确重建。#100411 (Alexey Milovidov) 。
  • 为 TPC-H 查询新增正确性测试。#100580 (Raufs Dunamalijevs) 。
  • 使用 aws-sdk-cpp 1.11.771 版本。 #100582 (Konstantin Bogdanov).
  • 允许性能测试 XML 通过 file 属性引用外部 SQL 查询文件及设置。#100747 (Raufs Dunamalijevs) 。
  • 通过在 LowerUpperImpl.h 中补充缺失的 TargetSpecific.h include,修复了使用 -march=x86-64-v4 时的编译问题。#100932 (Alexey Milovidov) 。
  • 通过在 cxxflags 中添加 —no-default-config,修复了 Gentoo 上的构建问题。#100973 (Isak Ellmer) 。
  • 新增 utils/auto-bisect/——这是一个基于 shell 的二分定位框架,可下载预构建的 CI 二进制文件,并运行用户提供的测试脚本,以找出首次引入回归的提交,无需在本地 build。 #100989 (Nikita Fomichev).
  • 在 CMake 中默认禁用 ThinLTO,这样开发者的本地构建将不再隐式启用它。CI 的发布构建不受影响,因为它们会显式传递 -DENABLE_THINLTO=1#101041 (Alexey Milovidov) 。
  • 在性能测试中新增 TPC-DS SF1 基准测试。#101209 (Raufs Dunamalijevs) 。
  • 新增了针对 MergeTree 轻量级删除的无状态测试,覆盖:has_lightweight_delete 标志的生命周期、启用 optimize_trivial_count_queryCOUNT(*) 的正确性、MATERIALIZED/DEFAULT 列的完整性、ReplicatedMergeTree 标志的恢复、已删除行场景下的 read_in_order、多次删除/合并循环、_row_exists 列隐藏、多种谓词,以及 ALTER DELETE 的 RBAC 权限控制执行。#101792 (Nikita Fomichev) 。
  • 现在,Distroless Docker 镜像已针对带标签的发行版提供 ubuntu 和 alpine 两种变体。#101941 (Rahul Nair).
  • 堆栈跟踪现在会显示干净的纯相对路径 (例如 src/Common/Exception.cpp) ,而不再是夹杂构建目录的路径 (例如 ./ci/tmp/fast_build/./src/Common/Exception.cpp) 。#102000 (Raúl Marín) 。
  • 新增一项 CI 风格检查,禁止将大于 5 MB 的文件提交到仓库,并为现有的合法测试数据设置白名单。移除未使用的 14 MB zookeeper_log.parquet#102080 (Raúl Marín) 。
  • 从头文件中移除约 400 条未使用的 #include 指令,以缩短编译耗时。#102585 (Raúl Marín) 。
  • 使用 wasmtime v43.0.1。 #102603 (Konstantin Bogdanov) 。
  • 使用 openssl 3.5.6。#102606 (Konstantin Bogdanov) 。
  • 使用 xz 5.8.3。 #102607 (Konstantin Bogdanov) 。
  • 将 distroless Docker 镜像的基础从 Debian 12 (glibc 2.36、OpenSSL 3.0) 升级到 Debian 13 (glibc 2.41、OpenSSL 3.5) ,将 CVE 暴露面缩减至零可达漏洞。#101678 (Rahul Nair) 。

ClickHouse 26.3 LTS 发布,2026-03-26。 演示文稿视频

向后不兼容的变更

  • 升级后再降级可能会导致数据丢失。数据类型的序列化版本现在会传播到嵌套数据类型中。例如,String 序列化版本 with_size_stream 以前仅应用于顶层 String 列和 Tuple 元素;现在它会应用于任意嵌套类型中的任何 String 类型,例如 Array/Map/Variant/JSON/等。此行为由 MergeTree setting propagate_types_serialization_versions_to_nested_types 控制,该设置现已默认启用。此变更后,新创建的数据分区片段将无法被旧版本读取,但旧的数据分区片段可以在新版本中正常读取。升级是安全的,但降级不是——如果你在升级到 26.3 后需要回滚,26.3 在包含嵌套类型的列中写入的数据将无法读取! 详情参见 #101429#94859 (Pavel Kruglov) 。
  • 移除 hypothesis 跳过索引类型。它是一个较为冷门的 Experimental 功能,实际用途有限。现在,使用 INDEX ... TYPE hypothesis 创建表会报错。#96874 (Alexey Milovidov) 。
  • 移除实验性的 detectProgrammingLanguage 函数。#99567 (Alexey Milovidov) 。
  • 修复 NOT 运算符的优先级,使其符合 SQL 标准:NOT 现在的结合优先级低于 IS NULLBETWEENLIKE 和算术运算符。例如,NOT (x) IS NULL 现在会被解析为 NOT (x IS NULL),而不是 (NOT x) IS NULL。这可能会改变依赖此前 (非标准) 行为的查询结果。#97680 (Alexey Milovidov).
  • 修复了普通投影的元数据,以便正确识别具有多列排序键的投影。基于 #90429#91352 (Amos Bird) 。
  • 修复了跳过索引文件未遵循 replace_long_file_name_to_hash 设置的问题;该问题会导致出现“File name too long”错误,并使长名称索引无法正常读取。现在,当跳过索引文件名超过 max_file_name_length 时,会像列文件一样对文件名进行哈希处理。此更改向后兼容 (新服务器可以读取旧 parts) ,但降级 (或在滚动升级期间使用旧服务器) 时,长名称索引可能会被忽略。#97128 (Raúl Marín).
  • 默认启用异步插入。ClickHouse 现在默认会将所有小型插入按批次处理。此设置在 compatibility 中配置。如果你设置 compatibility=<version less than 26.2>,则默认值会恢复为之前的 false。你可以在多个级别关闭/开启异步插入:在 users profiles 的 config 中、在 session 级别、在查询级别,或在 MergeTree 表级别。#97590 (Sema Checherinda).
  • mysql_datatypes_support_level 的默认值从空改为 decimal,datetime64,date2Date32,默认启用将 MySQL DATE 正确映射为 Date32、将 DECIMAL/NUMERIC 映射为 Decimal,以及将带精度的 DATETIME/TIMESTAMP 映射为 DateTime64。此前,MySQL DATE 列会映射为 Date,而 Date 无法表示 1970-01-01 之前的日期,从而导致数据损坏。#97716 (Alexey Milovidov).
  • mergeTreeAnalyzeIndexes{,UUID} 现已接受分片名称数组而非 regexp,因为 regexp 较慢 (Experimental 功能) 。#98474 (Azat Khuzhin) 。
  • 将可执行 UDF 的默认 stderr_reactionthrow 调整为 log_last。对于向 stderr 写入警告的 UDF,只要退出码为 0,就不再报错。现在,退出码异常中会包含 stderr 的内容。#99232 (Xu Jia) 。

新特性

  • 为 MergeTree 中的 Map 列新增了分桶序列化 (map_serialization_version = 'with_buckets') 。键会按基于哈希的桶拆分,因此读取单个键 (m['key']) 时只需读取一个桶,而不必读取整个列;根据 Map 的大小不同,单键查找可获得 2-49 倍的加速。桶的数量以及分桶策略可通过新的 MergeTree 设置进行控制:map_serialization_versionmax_buckets_in_mapmap_buckets_strategymap_buckets_coefficientmap_buckets_min_avg_size#99200 (Pavel Kruglov) 。
  • 支持 materialized CTE。允许在查询执行期间仅计算一次 CTE,并将结果存储在临时表中。关闭了 #53449#94849 (Dmitry Novik) 。
  • 出于兼容性考虑,允许某些符合 SQL 标准的函数省略括号使用,例如 NOW。关闭 #52102#95949 (Aly Kafoury) 。
  • 现在可以将自然排序键函数用作 naturalSortKey(s)#90322 (Nazarii Piontko) 。
  • 现在,JSONExtract 函数已支持使用原生 JSON/Object 作为输入。修复了 #88370#96711 (Fisnik Kastrati) 。
  • 如果某个查询参数的类型为 Nullable,且未指定该参数,我们将假定其值为 NULL#93869 (Vikash Kumar) 。
  • 支持 Replicated database 使用辅助 ZooKeeper。 #95590 (RinChanNOW).
  • 支持对 JSON 类型使用 has 函数来检查路径是否存在,类似于 Map。#96927 (DQ).
  • 新增了 mergeTreeTextIndex(database, table, index) 表函数,支持直接从文本索引中读取数据。该函数可用于查看内部信息,或基于文本索引数据执行聚合。#97003 (Anton Popov).
  • 新增 table_readonly MergeTree setting,用于将表标记为只读,防止插入和修改。#97652 (Alexey Milovidov) 。
  • 新增设置 use_partition_pruning 及其别名 use_partition_key。将其设为 false 可禁用基于分区键的分区裁剪。#97888 (Nihal Z. Miaji) 。
  • 支持对 Iceberg 表执行 ALTER TABLE ... EXECUTE expire_snapshots('<timestamp>')#97904 (murphy-4o)。 #99130
  • 允许 <protocols> 中的每个 type=http 条目指定一个自定义 <handlers> 键,使其指向单独的 <http_handlers_*> config 部分,从而可为每个端口启用不同的 HTTP 路由规则。#98414 (Amos Bird) 。
  • EXPLAIN 新增 pretty=1 选项,以生成树状缩进输出;并新增 compact=1,用于折叠 Expression 步骤,使查询计划更易读。#98500 (Kirill Kopnev) 。
  • 新增 restore_access_entities_with_current_grants 服务器设置。启用后,从 backups 中恢复的用户/roles,其授权将限制在执行 restoring 的用户有权授予的范围内 (与 GRANT CURRENT GRANTS 的语义相同) ,而不会因 ACCESS_DENIED 失败。#98795 (pufit).
  • 新增 caseFoldUTF8removeDiacriticsUTF8 函数,用于 Unicode 大小写折叠和去除变音符号。#98973 (George Larionov).
  • 新增 normalizeUTF8NFKCCasefold 字符串函数,用于执行 NFKC_Casefold Unicode 规范化,即将 NFKC 规范化与大小写折叠结合起来。#99276 (George Larionov) 。
  • 为全文索引和 tokens 函数新增 asciiCJK 分词器。它依据 Unicode 单词边界规则拆分文本:ASCII 单词可包含连接符字符 (下划线、冒号、点、单引号) ,而非 ASCII 的 Unicode 字符则会被拆分为单字符标记。#99357 (Amos Bird) 。
  • 新增了 max_skip_unavailable_shards_nummax_skip_unavailable_shards_ratio 设置,用于限制在启用 skip_unavailable_shards 时可静默跳过的分片数。如果不可用分片的数量或占比超过配置的阈值,则会抛出异常,而不是静默返回不完整的结果。#99369 (Alexey Milovidov).
  • 用户现在可以在子查询表达式中使用 SOME 关键字,其行为与 ANY 完全一致。#99842 (Artem Kytkin).
  • 新增 output_format_trim_fixed_string 设置,用于在文本输出格式中去除 FixedString 值末尾的 null 字节。#97558 (NeedmeFordev).
  • 支持在 FROM 子句中使用带括号的表 JOIN 表达式,例如 SELECT * FROM (t1 CROSS JOIN t2)#97650 (Alexey Milovidov) 。
  • 实现函数 toDaysInMonth:返回指定日期所在月份的天数。#99227 (Vitaly Baranov) 。

Experimental 功能

  • 新增对基于 WebAssembly 的用户自定义函数 (UDF) 的实验性支持,允许使用 WebAssembly 实现自定义函数逻辑,并在 ClickHouse 内执行。特别感谢 Alexey Smirnov 贡献了 Wasmtime 后端支持。#88747 (Vladimir Cherkasov) 。另外,WASM UDF 支持也得到了持续改进。#99373 (Vasily Chekalkin) 。
  • 新增通过 polyglot 库支持外部 SQL 方言的功能。#99496 (Alexey Milovidov) 。
  • 新增 ALP 浮点压缩编解码器 (对于不可压缩的 double,不带 ALP_rd 回退机制) 。#91362 (Nazarii Piontko) 。
  • JSON 列新增实验性的惰性类型提示。通过 allow_experimental_json_lazy_type_hints 启用后,ALTER TABLE ... MODIFY COLUMN json JSON(path TypeName) 这类仅添加或修改类型提示的操作会立即完成,作为仅元数据操作执行,无需重写历史数据。对于旧 parts,类型提示会在查询时应用;在 INSERT 和后台 merges 期间则会被 materialized。#97412 (tanner-bruce) 。
  • 启用从 YTsaurus table engine 进行并行读取。#97343 (MikhailBurdukov) 。

性能提升

  • 提升数据湖性能。在早期版本中,从对象存储读取数据时,管道不会按处理线程数进行扩缩。这在多核机器上带来了数量级的性能提升 (约 40 倍) 。#99548 (Alexey Milovidov) 。
  • 现在,enable_parallel_replicasautomatic_parallel_replicas_mode 之间的关系如下:只有当 enable_parallel_replicas > 0 时,查询才能使用并行副本。此外,如果 automatic_parallel_replicas_mode=1,则是否使用并行副本会在规划阶段根据之前收集的统计信息来决定。如果 automatic_parallel_replicas_mode=0,则所有受支持的查询都会使用并行副本,而不受任何统计信息影响。一个值得注意的例外是使用并行副本的 distributed insert-select:在这种情况下,查询始终会按 automatic_parallel_replicas_mode=0 的方式执行。#97517 (Nikita Taranov).
  • 当谓词中包含任意比较运算符 (=, <, >, !=) ,且分区键外层套有确定性函数链时,可进行分区剪枝 (例如,PARTITION BY x,以及 cityHash64(x) % 5 > 2toYYYYMM(x) < 2026toYYYYMM(x) = 2026toYYYYMM(x) != 2026 这样的谓词,都会利用分区键进行剪枝) 。关闭 #28800#98432 (Nihal Z. Miaji) 。
  • CAST 的目标类型为 Nullable 且转换具有单调性时,可启用按序读取优化和主键剪枝;例如,在 PRIMARY KEY x 的情况下,ClickHouse 可对 ORDER BY x::Nullable(UInt64) 使用按序读取优化,并对 WHERE x::Nullable(UInt64) > 500000 这类谓词应用主键剪枝。#98482 (Nihal Z. Miaji).
  • 当整型列与浮点数字面量比较时,现在支持索引裁剪和过滤器下推;例如,WHERE x < 10.5 这类谓词现在可以利用主键进行裁剪,而 prime < 1e9number < 1e5 这类过滤器现在也可下推到 primes()numbers() 表函数,而不再导致无界执行。关闭 #85167#98516 (Nihal Z. Miaji) 。
  • 新增了一个用于 Parquet 元数据的 SLRU 缓存,无需仅为读取元数据而重新下载文件,从而提升了读取性能。#98140 (Grant Holly).
  • 支持根据优化器统计信息交换 ANTI、SEMI 和 FULL join 的左右两侧。#97498 (Hechem Selmi) 。
  • 优化大型多边形场景下 pointInPolygon 的粒度跳过,并修复 pointInPolygon 索引分析在主键剪枝期间抛出异常的问题。#91633 (Nihal Z. Miaji) 。
  • 优化 levenshteinDistance 函数的性能。#94543 (Joanna Hulboj) 。
  • 通过避免对每个元素单独调用函数,优化批次 Decimal 类型转换。 #95923 (Konstantin Bogdanov).
  • Iceberg 表现已支持通过 iceberg_metadata_async_prefetch_period_ms 表设置异步预取元数据,该设置会定期预填充元数据缓存。此外,iceberg_metadata_staleness_ms 查询设置允许 SELECT 查询在缓存元数据的新鲜度高于指定 staleness 时直接使用缓存,从而避免在请求处理期间调用 Iceberg catalog。#96191 (Arsen Muk).
  • S3Queue ordered 模式使用 S3 ListObjectsV2 StartAfter,以避免重新列出此前前缀下的全部历史对象,从而减少 ListObjects 调用。#96370 (Venkata Vineel ).
  • 降低插入去重的内存占用。通常,去重需要保留原始块,但对于同步插入,可以省略它,从而真正节省内存。#96661 (Sema Checherinda) 。
  • 缓存行大小改为使用与架构相关的值,而不是硬编码为 64。#97357 (Nikita Taranov) 。
  • 对文本索引字典的读取进行了小幅优化,提升了文本索引分析的整体性能。#97519 (Anton Popov).
  • 提升 ARM 上 16 字节块的 LZ4 解压缩速度。#97774 (Raúl Marín) 。
  • 将分词重构为新的高性能接口,以替换旧的迭代器风格 API,从而支持 SIMD 和有状态分词器。属于 #90268 的一部分。#97871 (Amos Bird) 。
  • 改进了对同时包含已建立文本索引列和未建立索引列的组合条件查询进行文本索引分析时的性能。此前,在这种情况下,索引分析过程中的提前退出优化会被错误地禁用。#98096 (Anton Popov).
  • 提升包含会生成超长数组或 Map 的常量表达式的查询性能。#98287 (Alexey Milovidov).
  • 修复了 DateTime64 主键与整数常量比较时的键条件分析问题;此前会导致无法进行粒度剪枝。#98410 (Amos Bird).
  • 设置 optimize_syntax_fuse_functions 默认处于启用状态。#98424 (Alexey Milovidov) 。
  • 通过使用本地累加器,而不是按行经由聚合状态进行存储转发,优化了 avgWeighted 聚合函数,对 Nullable 输入的性能最高可提升 27%。#98793 (Antonio Andelic) 。
  • 在某些场景下,可提升并行窗口函数的性能并降低内存占用;对于含大型数组的 arrayFold 工作负载也是如此。这还可以减轻缺页压力,并在内存限制较严时提高受影响查询的稳定性。#98892 (filimonov).
  • 优化有序合并性能。#99013 (Artem Zuikov) 。
  • 优化了 INTERSECT ALLEXCEPT ALL#99097 (Raufs Dunamalijevs) 。
  • 支持在逆序读取时使用 read_in_order_use_virtual_row 优化。#99198 (Vladimir Cherkasov) 。
  • 通过在写入前检查 JoinUsedFlags 是否已设置,减少 RIGHTFULL JOIN 中的缓存争用。#99274 (Hechem Selmi).
  • 通过将浮点运算替换为纯整数运算,优化 PrefetchingHelper::calcPrefetchLookAhead,从而优化指令缓存布局,并减少聚合循环中的 CPU 周期开销。#99327 (Riyane El Qoqui) 。
  • 通过将用于存储节点子节点的 absl::flat_hash_set 替换为 CompactChildrenSet,降低了 Keeper 的内存占用。新容器可将 0–1 个子节点以内联方式存储,无需堆分配,这覆盖了绝大多数 Keeper 节点。这样可将 KeeperMemNode 的大小从 144 字节缩减到 128 字节。#99860 (Antonio Andelic) 。
  • 现已在视图中正确支持聚合投影。修复了 #32753#88798 (Amos Bird) 。
  • 支持在使用 join_use_nulls 时将 OUTER JOIN 转换为 INNER JOIN 的优化。关闭 #90978#95968 (Vladimir Cherkasov) 。
  • 通过在读取前正确计算大小,优化了子列读取。这减少了内存占用,并加快了子列读取速度。#96251 (Pavel Kruglov).
  • 让标记缓存、未压缩缓存和页缓存使用各自独立的 jemalloc arena,以避免将短生命周期的内存分配 (即查询和请求的内存分配) 与缓存的长生命周期内存分配混用时产生内存碎片。 #96812 (Seva Potapov). #98812. #99021
  • 带有 DELETE TTL 规则的表现在也可以使用纵向合并算法。#97332 (murphy-4o).
  • 在分布式索引分析中应用数据跳过索引。#97767 (Azat Khuzhin) 。
  • 启用 prewarm_mark_cache 设置后,次级索引的标记现会被预热 (即在拉取数据分区片段期间以及表启动时加载到索引标记缓存中) 。#97772 (Anton Popov).
  • 降低了访问控制期间的锁争用。#97894 (Nikita Taranov) 。
  • 当 apply_row_policy_after_final 或 apply_prewhere_after_final 处于启用状态时,行策略和 PREWHERE 中的复合 AND 条件现在会被拆解,以提取其中的排序键原子条件,用于主键索引分析。此前,如果延后应用的过滤条件同时包含排序键谓词和非排序键谓词 (例如 x > 1 AND y != ‘foo’) ,整个表达式都会被排除在索引分析之外。现在,即使在嵌套的 AND 表达式中,也可以提取排序键原子条件 (如 x > 1) 并将其用于粒度剪枝。#98513 (Yarik Briukhovetskyi).
  • 通过让任务资源在无需获取锁的情况下释放,减少 MergeTreeBackgroundExecutor 中的锁竞争。关闭 #93620#98604 (Dmitry Novik) 。
  • 修复了在读取非 Arrow 数据时进行 format 自动检测期间内存占用过高 (约 514 MiB) 的问题 (例如来自 urlfile 且未显式指定 format 的 JSON) ;原因是 ArrowStream 读取器将起始字节误识别为一个巨大的 metadata 长度。#98893 (Konstantin Bogdanov).

改进

  • 支持解析在同一列中包含不同 Geo 类型的 GeoParquet 文件。#97851 (Mark Needham).
  • 引入 tokensForLikePattern SQL 函数,用于对 LIKE 模式进行标记拆分,同时遵循通配符语义:%_ 视为通配符,转义后的通配符 (\%\_) 视为字面量,与未转义通配符相邻的标记会被丢弃。#97872 (Amos Bird) 。
  • 为 S3 表引擎新增 {_schema_hash} 占位符,用于将表列定义的哈希值插入到 S3 路径中。#98265 (Miсhael Stetsyuk) 。
  • SymbolIndexaddressToSymbolsystem.symbolsbuildId 现已可在 macOS 上通过解析 Mach-O 符号表使用。#99014 (Alexey Milovidov) 。
  • 现在,system.stack_trace 表已支持 macOS,可用于查看所有 server 线程的堆栈跟踪内部信息。#98982 (Alexey Milovidov) 。
  • 新增每服务器级别的 LDAP 配置选项 <follow_referrals> (默认值为 false) ,用于控制 LDAP 客户端是否跟随转介。禁用转介跟随可避免从 Active Directory 域根 base DN 开始搜索时出现超时和挂起。与转介相关的日志消息已从 warn 调整为 trace#96765 (paf91) 。
  • 我们现在会在 query_log 表新增的 skip_indices 列中,记录查询执行期间使用的所有数据跳过索引。修复了 #78676。原始作者为 @pheepa。#87862 (Grant Holly)。
  • 除非用户有权查看所有必需的列,否则 ACCESS&#95;DENIED 提示将不再暴露列名;数据库/表名在提示中仍然可见。#91067 (filimonov).
  • 为 MergeTree 增加一个专用清理线程,避免在高 merge 负载下出现清理延迟。此更改修复了 #86181#91574 (Amos Bird) 。
  • 仅当本地服务器主机名对应的 IP 发生变化时,才重新加载集群配置,而不是在任意主机的 IP 发生变化时都重新加载。修复了 #81215#70156#65268#93726 (Zhigao Hong) 。
  • 允许 optimize_aggregators_of_group_by_keys 在 GROUPING SETS 查询中正确地优化聚合函数。#93935 (Xiaozhe Yu).
  • Keeper-bench:在指标中报告错误,并为 —input-request-log 模式生成 JSON 指标文件。#95748 (Mohammad Lareb Zafar).
  • 为 CREATE USER 新增 ROLE 子句。#97074 (Vitaly Baranov) 。
  • 现在,您可以为由 Replicated database 创建的集群设置 internal_replication 参数。#97228 (Pervakov Grigorii) 。
  • 新设置 allow_nullable_tuple_in_extracted_subcolumns 用于控制从 TupleVariantDynamicJSON 中提取的 Tuple(...) 子列返回为 Nullable(Tuple(...)) (缺失行返回 NULL) ,还是返回为 Tuple(...) (缺失行返回默认的 Tuple 值) 。该设置默认禁用,并且只能通过重启服务器进行更改。#97299 (Nihal Z. Miaji) 。
  • 在 EXPLAIN 查询输出中,将延迟过滤器的信息单独列出 (在配合行策略/PREWHERE 使用 FINAL 时) 。相关内容:#91065#97374 (Yarik Briukhovetskyi)。
  • 默认启用 type_json_allow_duplicated_key_with_literal_and_nested_object。这样可以避免在解析诸如 {"a" : 42, "a" : {"b" : 42}} 这类 JSON 时因重复键而报错;这类 JSON 可由 ClickHouse 根据原始 JSON 数据 {"a" : 42, "a.b" : 42} 格式化生成。#97423 (Pavel Kruglov) 。
  • Keeper 改进:find_super_nodes 是一个非常有用的命令,可用于调试 Keeper 中节点数量异常增长的问题。遗憾的是,如果存在多个超级节点,几乎不可能找出一个以上,因为该命令在遍历遇到的第一个超级节点的子节点时会一直卡住。此 PR 禁止遍历超级节点的子节点。#97819 (pufit).
  • clickhouse-keeper-client 提供初始补全支持。#97828 (Konstantin Bogdanov) 。
  • 在发生崩溃时,刷新异步日志缓冲区。 #97836 (Azat Khuzhin).
  • 默认启用 impersonate 特性 (参见 EXECUTE AS target_user) 。#97870 (Vitaly Baranov) 。
  • 改进了在 clickhouse-client 中使用 KILL QUERY 和取消查询 (Ctrl+C) 来取消 SQLite 表引擎查询的功能。#97944 (Roman Vasin) 。
  • 新增服务器级设置 jemalloc_profiler_sampling_rate,用于控制 jemalloc 的 lg_prof_sample,并将其作为异步指标 jemalloc.prof.lg_sample 对外暴露。#97945 (Antonio Andelic) 。
  • 为并发有界队列实现增加权重支持。#97962 (Daniil Ivanik) 。
  • 将 sslmode 添加到 PostgreSQL 字典源的允许键中。此前,sslmode 不在 PostgreSQLDictionarySource.cpp 的 dictionary_allowed_keys 允许列表内,因此无法为 PostgreSQL 字典连接配置 SSL 模式。这导致字典无法连接到要求使用 SSL 的 PostgreSQL 服务器 (例如默认强制启用 SSL 的 AWS RDS) ,因为连接会在 TLS 协商阶段失败,而服务器会拒绝未加密的回退连接。#98014 (mcalfin).
  • clickhouseclickhouse-local 传入不存在的文件路径时,显示清晰的 “no such file” 错误,而不是令人困惑的通用消息。#98048 (Raúl Marín).
  • 现在可在 Nullable([Fixed]String)Array(Nullable([Fixed]String)) 列上构建文本索引。#98118 (Jimmy Aguilar Mena).
  • 避免删除被字典源依赖的命名集合。#98127 (Pablo Marcos).
  • 针对带有 totals 的查询,启用 grace_hash JOIN 算法。#98144 (János Benjamin Antal) 。
  • 在 ordinary shared merge tree 的 DROP DATABASE 操作中提前取消后台合并。#98161 (Shaohua Wang) 。
  • 改进了在 clickhouse-client 中使用 KILL QUERY 和取消查询 (Ctrl+C) 来取消 MongoDB 和 MySQL 查询的能力。#98187 (Roman Vasin).
  • 移除 NetlinkMetricsProvider,改为仅使用 procfs 收集每线程的 taskstats 指标。基于 Netlink 的收集方式在容器化环境中存在问题,而且在发生争用时,尾延迟表现更差。#98229 (Amos Bird) 。
  • 重构了 Iceberg manifest 文件处理逻辑,修复了 manifest 文件缓存相关问题。#98231 (Daniil Ivanik).
  • 现在我们也会考虑这样一种情况:表的排序键可以是像 toDate(time) 这样的 expression;如果这类 expression 属于过滤器的一部分,我们就可以决定不延迟对它们的处理。#98237 (Yarik Briukhovetskyi) 。
  • 新增 MaxAllocatedEphemeralLockSequentialNumber 指标,用于表示 ZooKeeper 中为临时锁 znode 分配的最大顺序编号。#98243 (Miсhael Stetsyuk).
  • 将 ClickStack 更新至 2.20.0 版本。#98252 (Aaron Knudtson) 。
  • 新增了一个新的 profile 事件 KeeperRequestTotalWithSubrequests,会将多请求中的每个子请求分别计数,从而更清楚地反映实际的 Keeper workload。现有的 KeeperRequestTotal 事件则仍然将每个多请求计为一次请求。#98348 (Antonio Andelic) 。
  • SYSTEM RELOAD DICTIONARIES 现在会按拓扑顺序重新加载字典,因此将其他字典作为数据源的字典在重新加载后也能读取到最新数据。#98356 (Alexey Milovidov).
  • 更改 MergeTree 设置后,重启统计缓存。#98520 (Han Fei) 。
  • 只有“存活”的 (即能够连接的) 副本会参与分布式索引分析。#98521 (Azat Khuzhin) 。
  • 新增设置 access_control_improvements.disallow_config_defined_profiles_for_sql_defined_users (默认值为 disabled/allowed) ,禁止为通过 SQL 定义的用户使用在 config 中定义的 profile (default profile 除外) 。#98662 (Alexander Tokmakov) 。
  • 将自动并行副本启发式所使用的节点数上限设为集群中的实际节点数 (而不再仅由 max_parallel_replicas 设置决定) 。#98668 (Nikita Taranov).
  • 为分布式索引分析引入对冲请求和异步读取。#98724 (Azat Khuzhin) 。
  • 现在,二进制 AggregateFunction 状态的反序列化要求必须完整读取全部输入。如果存在多余的尾随冗余字节,ClickHouse 将抛出异常,而不再接受格式不正确的状态数据。#98786 (Nihal Z. Miaji) 。
  • 让 TRUNCATE DATABASE 能响应查询取消。#98828 (Shaohua Wang).
  • keeper-bench 增加请求流水线、预热阶段、按操作划分的统计信息、可复现的种子以及更完善的错误处理。#98906 (Antonio Andelic) 。
  • 分布式索引分析现已支持 SAMPLE 子句。 #98931 (Azat Khuzhin).
  • 即使查询返回空结果或发生错误,也会在仪表板中显示图表标题。#98975 (Yash ).
  • analyzer 错误消息不再输出表中的所有列 (这可能会导致产生 150KB+ 的异常信息) 。列列表现在最多只显示 10 项。#99002 (Yash ).
  • 正确返回包含 joins 的子查询中的列统计信息,以便父查询可利用这些信息对 join 顺序进行重排。#99096 (Alexander Gololobov).
  • 在终结过程开始时,立即将 ZooKeeper session 标记为已过期,而不是等待发送线程退出。这样一来,其他线程就能立即建立新的 session,而无需等待。#99102 (Raúl Marín).
  • 开始使用 LLVM-libc 中更多数学函数:expexp2expm1fabsfabslfloorfmodlloglog2logfpowscalbnscalbnlcopysignlnannanfnanl,以及 explogxf 共享常量。#99118 (Konstantin Bogdanov) 。
  • 降低 system.jemalloc_profile_text 折叠格式下的内存占用,并修复潜在的重复输出问题。#99121 (Antonio Andelic) 。
  • system.aggregated_zookeeper_log 添加 is_subrequest 列,用于区分独立请求与 Multi/MultiRead 请求中的子请求。此前,子请求会与独立请求聚合到同一个桶中,而由于每个子操作记录的都是整个多请求的总耗时,因此平均延迟具有误导性。现在,子请求的延迟为零。#99169 (Miсhael Stetsyuk) 。
  • 允许在不指定列类型的情况下执行 ALTER TABLE MODIFY COLUMN x TTL ... 命令。#99208 (Nikolay Degterinsky).
  • 跳过已断开连接的会话对应的过时 Keeper 请求,避免不必要的 Raft 往返。已跟踪的已结束会话数量上限由协调设置 max_finished_sessions_cache_size 控制。#99246 (Antonio Andelic) 。
  • 支持对基于 mapValues(map) 构建的文本索引使用 IN 运算符。#99286 (Anton Popov) 。
  • 在 clickhouse keeper-client 中支持类似 Shell 的自动补全 (支持补全引号中的参数,即 'foo ba';支持转义参数,即 foo\ ba;如果节点名中包含空白字符,则让 ls 输出带引号的节点名) 。#99312 (Azat Khuzhin).
  • 防止 Keeper mntr 命令因锁竞争而发生卡顿。#99472 (Antonio Andelic).
  • 通过在 mutex 作用域之外调用回调函数并分发读取请求,减少 Keeper 分发器中的锁竞争,并添加带 profile 的锁保护机制以增强可观测性。#99751 (Antonio Andelic).
  • 允许 Parquet 文件最后一个块末尾缺少填充。 #99857 (Seva Potapov).

缺陷修复 (官方稳定版本中用户可见的异常行为)

  • 修复了当别名表目标未使用完全限定名称时,将其保存为 DDL 依赖的方式:现在会保存为别名表所在的数据库,而不是会话数据库。 #95175 (Enric Calabuig).
  • 修复读取 ALIAS 列的子列时返回错误结果或抛出异常的问题。#95408 (Pavel Kruglov) 。
  • 修复了在使用旧 analyzer 时,JOIN 中使用非标准标识符别名导致列缺失的问题。修复了 #25594#47288#53263#95679 (Zhigao Hong).
  • 修复了 Kusto 方言函数 bin()bin_at()extract()indexof() 在传入空参数时发生崩溃的问题。#95736 (NeedmeFordev) 。
  • 禁止在 clickhouse-client 中将 local_object_storage (用于基于本地文件系统的数据湖,也可能被 LocalDisk 使用) 挂载到 user_files_path 以外的任何位置。 #96201 (Daniil Ivanik).
  • 修复 DeltaLake 表引擎中快照版本变更时的逻辑竞态问题,并去除冗余且高开销的快照重新加载。#96226 (Kseniia Sumarokova) 。
  • 修复了 MergeTree 中附加分片时的一个逻辑错误:如果在 detach 和 attach 之间经历了多次连续重命名,就会触发该问题。#96351 (Alexey Milovidov).
  • 修复了一个问题:在同一请求中与 compatibility 一并发送显式设置时,如果其值恰好与服务器默认值相同,这些设置可能会被悄然忽略。#97078 (Raufs Dunamalijevs).
  • 修复了以下问题:当启用并行解析的 INSERT 遇到无效数据时,客户端会报告 NETWORK_ERROR,而不是实际的解析错误 (并带有正确的行号) 。#97339 (Alexey Milovidov).
  • 修复了在引入 Nullable(Tuple) 后,sumCount 聚合函数无法读取旧版已序列化状态的问题。关闭 #97370#97502 (Nihal Z. Miaji) 。
  • 修复在配合 GROUPING SETSORDER BY 使用时,包含 Nothing 类型元素的元组比较中出现的异常 (例如与 NULL 元组元素比较时) 。#97509 (Alexey Milovidov) 。
  • 修复了在使用多个压缩编解码器时,Compact MergeTree parts 的 uncompressed_hash 计算非确定性问题,该问题可能导致去重行为不正确。#97522 (Alexey Milovidov).
  • 修复了在共享数据中使用 JSON 和桶执行 INSERT SELECT 时,stream 缺失导致的逻辑错误。关闭 #97331#97523 (Pavel Kruglov) 。
  • 修复了在 SummingMergeTree 和 CoalescingMergeTree 合并过程中,将 MEMORY_LIMIT_EXCEEDED 异常误报为 CORRUPTED_DATA 的问题。#97537 (János Benjamin Antal) 。
  • 修复了包含 url() 等表函数的关联子查询中出现的 “Context has expired” 异常。#97544 (Alexey Milovidov).
  • 修复了 optimize_syntax_fuse_functions 在聚合投影、Date 类型以及列名保留方面的异常和错误行为。#97545 (Alexey Milovidov) 。
  • 移除了将 replaceRegexpOne 查询重写为 extract 的错误优化,该重写在正则表达式不匹配时会产生错误结果;同时修复了在 replaceRegexpOneGROUP BY ... WITH CUBEgroup_by_use_nulls=1 一起使用时出现的异常。#97546 (Alexey Milovidov).
  • 修复了在查询被终止时,启用 database_atomic_wait_for_drop_and_detach_synchronouslyDROP DATABASE 可能会无限期挂起的问题。#97586 (Alexey Milovidov).
  • 修复了 KILL QUERY 无法终止卡在 WITH FILL 生成、通过 dictGet 加载字典,或在 ReplicatedMergeTree 上执行带有 mutations_sync=1ALTER DELETE 时卡住的查询的问题。#97589 (Alexey Milovidov) 。
  • loop 表函数此前直接调用 inner_storage->read(),绕过了解释器层;而行策略、列级授权及其他安全检查正是在这一层执行的。因此,即使直接执行 SELECT 返回零行,受行策略限制的用户仍可通过 loop(table) 读取所有行。#97682 (pufit) 。
  • 修复了在对纪元前的 DateTime64 使用 toDate() 函数时,分区裁剪不正确的问题。 #97746 (Yarik Briukhovetskyi).
  • 应用此补丁后,如果数据分区片段集合中存在另一个分区 ID 更高的分区,hasPartitionId 将返回 false。#97748 (Mikhail Artemenko) 。
  • 修复读取 JSON 中高级共享数据的空粒度时可能发生的崩溃。关闭 #97563#97778 (Pavel Kruglov) 。
  • 修复因 DROPINSERT 之间的竞争条件,导致向 Distributed 执行 INSERT 时出现 Cannot schedule a file LOGICAL_ERROR 错误的问题。#97822 (Azat Khuzhin) 。
  • 修复了在调用 mapContainsKey/mapContainsKeyLike 且使用 tokenbf_v1 跳过索引时,ClickHouse 服务器崩溃/断言的问题。#97826 (Shankar Iyer) 。
  • 修复了在 concatWithSeparatorformatIN 子查询、GLOBAL IN 以及带运行时过滤器的连接操作中,由复合类型 (VariantDynamicTuple) 内的 LowCardinality 引发的 LOGICAL_ERROR 异常。#97831 (Raúl Marín).
  • 修复了在多个分布式表上使用 ARRAY JOINmerge() 表函数并结合 GROUP BY 时出现的 LOGICAL_ERROR 异常:Chunk info was not set for chunk in MergingAggregatedTransform#97838 (Raúl Marín) 。
  • 修复了在高并发情况下,连接组达到硬性上限时,HTTP 连接池析构函数中的未捕获异常导致的服务端崩溃 (std::terminate) 问题。在将连接回收到连接池时,异常 HTTP_CONNECTION_LIMIT_REACHED 可能会从 ~PooledConnection 中泄出,进而导致 SIGABRT#97850 (Antonio Andelic).
  • 修复了在使用 grace_hash 算法进行非等值连接时,若由于连接结果的大小约束导致左侧块无法被完全处理而产生错误结果的问题。#97866 (János Benjamin Antal).
  • 修复了在 #96686 中引入的 DeltaLake 元数据扫描性能问题。#97880 (Kseniia Sumarokova) 。
  • 修复了 ZooKeeper 客户端中 sendThread 与 receiveThread 之间的数据竞争问题。#97887 (Pablo Marcos) 。
  • 修复了一个 bug:此前无法在 distributed insert select 中使用 CTE。延续 https://github.com/ClickHouse/ClickHouse/pull/87789 中的修复。关闭了 #95837#97889 (Yarik Briukhovetskyi) 。
  • 修复 CachedOnDiskReadBufferFromFile::readBigAt 中的异常。关闭 #97325#97890 (Kseniia Sumarokova) 。
  • 修复了 Alias 引擎中因列不匹配导致的带有物化列的 LOGICAL_ERROR 异常。关闭了 #97907#97921 (Kai Zhu) 。
  • 修复了在使用 Azure Blob 存储并将 s3_plain metadata 用于日志存储时,Keeper 重启后出现的数据丢失问题。#97987 (Antonio Andelic).
  • 修复了 sign 函数在比 Int8 更宽的整数类型上的 JIT 误编译问题——超出 -128..127 范围的值可能会得到错误的符号。#98012 (Alexey Milovidov) 。
  • 修复了读取使用列映射 “name” 模式的 Delta Lake 表时出现的 DUPLICATE_COLUMN 异常,以及对名称中包含点号的 struct 字段无提示地返回 NULL 的问题 (例如 STRUCT<`a.foo`: STRING, `b.foo`: STRING>) 。#98013 (Caio Ishizaka Costa) 。
  • 修复轻量级更新和次级索引后的变更问题。#98044 (Raúl Marín) 。
  • 修复混用主键和非主键跳过索引时 FINAL 查询结果错误的问题。#98097 (Raúl Marín) 。
  • 对标量 file() 和 DESCRIBE TABLE file() 强制进行 READ ON FILE 权限检查。#98115 (Nikolay Degterinsky) 。
  • 修复了一个崩溃问题:使用 glob 模式查询文件 (例如 file('dir/**', 'LineAsString')) 时,如果目录中包含悬空符号链接,会抛出未处理的文件系统异常 (STD_EXCEPTION) 。现在会静默跳过悬空符号链接,查询将返回所有有效文件的结果。#98143 (Mark Andreev).
  • 修复了在过滤表达式中使用 arrayJoin 将外连接转换为内连接时,查询计划优化中发生的 segfault。#98147 (Alexey Milovidov) 。
  • 修复了 ProtobufList 格式因消息间读取状态未重置而无法与 Kafka 引擎正常配合的问题。#98151 (Alexey Milovidov) 。
  • 修复了 analyzer_compatibility_join_using_top_level_identifier 与 ARRAY JOIN 相关的逻辑错误,关闭 #98164#98179 (Vladimir Cherkasov) 。
  • aggregated_zookeeper_logwatch 响应的组件字段设为 Watch,而不是留空。#98202 (Antonio Andelic) 。
  • 如果分区键列未包含在排序键中,那么分区裁剪可能会错误地跳过那些包含在 FINAL 去重过程中本应被保留的行的分区。 #98242 (Yarik Briukhovetskyi).
  • 修复了在以常量数组参数调用 kql_array_sort_asc/kql_array_sort_desc 时出现的逻辑错误 “Bad cast from type DB::ColumnConst to DB::ColumnArray”。#98251 (Alexey Milovidov) 。
  • 修复了 ColumnConst::getExtremes 中的越界访问问题;在启用 extremes = 1 时,该问题可能导致崩溃。#98263 (Alexey Milovidov) 。
  • 修复了一种潜在死锁问题:当两个并发的 MOVE PARTITION 操作在同一对表之间沿相反方向执行时,可能会发生死锁。#98264 (Alexey Milovidov).
  • HTTP 服务器现在会在因请求头格式错误而导致的 400 Bad Request 响应体中返回错误消息,而不再返回空响应体。#98268 (Alexey Milovidov).
  • 修复了分布式索引分析 (Experimental 功能) 和查询条件缓存中的错误结果问题。#98269 (Azat Khuzhin) 。
  • 修复了 LOGICAL_ERROR 异常 “MergeTreeSetIndex 中的二分查找结果无效”:当对数据跨越 65535 边界的键列执行 toDate 转换时会触发该异常。#98276 (Alexey Milovidov) 。
  • 修复了在旧版 join 步骤代码路径中,被包裹在 CROSS JOIN 中的 RIGHT JOIN 被 query_plan_join_swap_table 优化交换时触发的 LOGICAL_ERROR 异常。#98279 (Alexey Milovidov) 。
  • DDSketch 反序列化期间对损坏数据进行校验,以防在读取已损坏的 quantilesDD 聚合函数状态时出现段错误、异常、无限循环和 OOM。 #98284 (Alexey Milovidov).
  • 修复了在 arrayMap 等 lambda 函数中引用外层查询中的关联列时出现的 LOGICAL_ERROR “Trying to execute PLACEHOLDER action”。 #98285 (Alexey Milovidov).
  • 修复了 caseWithExpression 中的逻辑错误异常:当 CASE 表达式涉及 materialize(NULL) 或其他 Nullable(Nothing) 参数时会触发该异常。#98290 (Alexey Milovidov) 。
  • 修复在 merge 表函数中过滤 _table 虚拟列时出现的错误类型转换异常。#98291 (Alexey Milovidov) 。
  • 修复了一个偶发的去重故障:由于 blocks/deduplication_hashes/ 这两个 ZooKeeper 目录的清理顺序不一致,重新插入的数据会被错误地去重。#98293 (Alexey Milovidov).
  • 修复了 ORDER BY ... WITH FILLLIMIT BY 一起使用时触发的异常。#98361 (Alexey Milovidov) 。
  • 修复将 Parquet/Arrow Date 列插入 Enum 列时的静默数据损坏问题——现在会正确拒绝不兼容的类型转换,而不会存储无效的枚举值。#98364 (Alexey Milovidov).
  • 修复了将带有 Array 列的 Arrow 文件读入带有 Nested 列的表时出现的异常。#98365 (Alexey Milovidov) 。
  • 修复了以下问题:如果在索引或投影对应的变更完成前将其删除,MATERIALIZE INDEXMATERIALIZE PROJECTION 变更会卡住。#98369 (Alexey Milovidov) 。
  • 修复了读取 Nullable(Tuple(...)) 时出现的异常:Tuple 元素名称与 Nullable 的 null 子列发生冲突。#98372 (Alexey Milovidov) 。
  • 修复将 Merge 表 (底层为 Distributed 表) 与另一张表连接时出现的异常 “Column … query tree node does not have valid source node”。#98376 (Alexey Milovidov) 。
  • 修复 native V3 读取器中将 Parquet Bool 错误转换为 FixedString 的问题,此问题会产生 raw bytes,而不是字符串表示形式。#98378 (Alexey Milovidov).
  • 修复 tryGetColumnDescription:按父列类型筛选子列,使其与其他列查找方法保持一致。#98391 (Alexey Milovidov).
  • 支持在 HTTP Basic Auth 中接受不带填充的 base64 凭据。某些 HTTP 客户端会省略 Authorization: Basic 请求头末尾用于填充的 =,此前这会导致身份验证失败。#98392 (Amos Bird).
  • 修复了合并带有 Nullable 分区键列的 parts 后,因 min-max 索引边界错误导致的分区裁剪结果不正确问题。#98405 (Amos Bird).
  • 修复了管道执行器中的一个罕见异常:当管道扩展与查询取消发生竞态时,可能会表现为 Received signal 6 (仅在调试构建中出现) 。#98428 (Alexey Milovidov) 。
  • 修复在 count_distinct_optimizationQUALIFY 子句一起使用时出现的 “Column identifier is already registered” 异常。#98433 (Alexey Milovidov) 。
  • 修复了将 IN/NOT INLowCardinality 列参数一起使用时出现的异常“cannot be inside Nullable type” (例如 a NOT IN (b),其中 a 的类型为 LowCardinality(String)) 。 #98443 (Alexey Milovidov).
  • 修复了 full_sorting_merge join 中的 “Pipeline stuck” 异常:当 FilterBySetOnTheFly 优化与 MergeJoinTransform 形成循环依赖时,PingPongProcessor 中的死锁会触发该异常。#98454 (Alexey Milovidov).
  • 修复在合并带有会删除所有行的生存时间 (TTL) 且具有常量 GROUP BY 键的聚合投影的 parts 时出现的 LOGICAL_ERROR 异常 “Projection cannot increase the number of rows in a block”。#98458 (Alexey Milovidov).
  • 修复了同时使用 CROSS JOININNER JOIN USING 时出现的逻辑错误异常。#98459 (Alexey Milovidov).
  • 修复了 dictGetOrDefault 在键参数为 Nullable 时的空指针解引用问题。#98460 (Alexey Milovidov) 。
  • 修复了这样一种情况下 DISTINCT 查询中的异常:使用聚合投影时,materialize 会导致查询与投影之间的 LowCardinality 类型不一致。#98462 (Alexey Milovidov).
  • 修复了这样一个问题:启用 join_use_nulls 时,在 OUTER JOIN 的过滤表达式中使用 arrayJoin 会触发 LOGICAL_ERROR 异常。#98464 (Alexey Milovidov) 。
  • 修复在并行副本配合 optimize_aggregation_in_order 使用时出现的逻辑错误异常 “副本决定以 WithOrder 模式读取,而不是 ReverseOrder”。#98467 (Alexey Milovidov) 。
  • 修复了 ClickHouse Keeper 在处理 addWatch 请求后断开 Java ZooKeeper 客户端连接的问题。Java 客户端期望在 addWatch 响应中收到一个 4 字节的 ErrorResponse 响应体,但 Keeper 发送的却是空响应体,从而导致 EOFException 并使会话断开。这会导致 Apache Curator 的 CuratorCache 以及任何使用持久 watch 的 Java 应用程序无法正常工作。修复 #98079#98499 (Antonio Andelic) 。
  • 修复了当跟随者宕机时,zk_followerszk_synced_followers 这两个 Keeper 指标不会随之减少的问题。在 mntr 四字母命令中新增了 zk_learnerszk_synced_non_voting_followers 指标。修复 #54173#98504 (Antonio Andelic) 。
  • 修复了 renameAndCommitEmptyParts 中的 LOGICAL_ERROR 异常:在使用 MergeTree 事务时,若 TRUNCATE TABLEOPTIMIZE TABLE 并发执行,可能会触发该异常。#98508 (Alexey Milovidov) 。
  • 修复了 Keeper 的安全 Raft 端口忽略 openSSL 配置中的 cipherListdhParamsFile、一律使用默认值而非用户指定值的问题。关闭 #51188#98509 (Antonio Andelic) 。
  • 修复了具有误导性的 Keeper 日志消息,例如 “Receiving request for session X took 9963 ms”:其中显示的时间实际上是两次心跳之间在 poll() 中空闲等待的耗时,而非操作本身的执行时间。修复了 #79026#98510 (Antonio Andelic) 。
  • 修复 read_in_order_use_virtual_row 与单调函数配合使用时出现的意外结果,关闭 #97837#98514 (Vladimir Cherkasov) 。
  • 修复了在 MergeTree 表上配合 IN 子查询使用 PREWHERE 时出现的 LOGICAL_ERROR: Not-ready Set is passed as the second argument for function 'in' 问题。#98522 (Alexey Milovidov).
  • 修复了 Keeper TCP 连接未响应关闭信号,导致服务器无法优雅关闭的问题。 #98525 (Alexey Milovidov).
  • 修复了在启用 query_plan_convert_join_to_inquery_plan_merge_expressions = 0 时出现的异常:“在 ActionsDAG 的输出中未找到排序列”。 #98526 (Alexey Milovidov).
  • 修复了使用命名集合时 MongoDB 字典源失效的问题。关闭 #97840#98528 (Pablo Marcos) 。
  • 修复了参数替换后 Identifier 为空时触发的 LOGICAL_ERROR。 #98530 (Pervakov Grigorii).
  • 修复同时使用 sort_overflow_mode = 'break' 和窗口函数时出现的管道死锁问题。#98543 (Alexey Milovidov) 。
  • 修复了 Buffer 引擎在追加新块时处理异常过程中的列回滚问题。旧逻辑可能导致列的内存状态损坏。#98551 (Pavel Kruglov) 。
  • 修复了在常量 DynamicVariant 列与 NULL 进行 NULL 安全比较 (<=> / IS NOT DISTINCT FROM) 时出现的异常 Bad cast from type ColumnConst to ColumnDynamic。同时还修复了 Dynamic/VariantNULL 进行 IS DISTINCT FROM 比较时始终错误返回 0 的问题。#98553 (Alexey Milovidov).
  • 修复了文本索引与其他跳过索引一起使用时的问题。此前,当查询过滤器同时使用文本索引和其他常规跳过索引时,可能会抛出诸如 “Trying to get non-existing mark” 之类的逻辑错误。#98555 (Anton Popov) 。
  • 修复了逻辑错误 “在表达式上下文中不允许使用 TABLE_FUNCTION”:当带有别名的表函数在同一查询作用域中出现多次时 (例如同时出现在 PREWHEREQUALIFY 子句中) 。 #98557 (Alexey Milovidov).
  • 修复了 PK 中针对表达式 (而不只是列) 进行分布式索引分析的问题 (否则会导致远程副本上的冗余粒度完全无法被过滤) 。#98561 (Azat Khuzhin).
  • 当某列的子列被用于其他列的默认值/别名表达式时,禁止删除该列,并在 alter drop column 操作中对默认表达式使用 analyzer。#98569 (Nikita Mikhaylov) 。
  • 修复了 HTTP 客户端在遇到不可重试错误 (包括 HTTP_CONNECTION_LIMIT_REACHED) 时,仍错误重试 S3 请求的问题。#98598 (Sema Checherinda) 。
  • 修复了使用 DateTime64 进行分区裁剪时出现的十进制溢出问题。 #98628 (Yarik Briukhovetskyi).
  • 修复 JIT 表达式编译中的两个 bug:nativeCast 类型检查里的一处复制粘贴错误,导致整数到整数和 Float 到 Float 的 cast 分支不可达;以及向 LLVM PassBuilder 传入了错误的 nullptr TargetMachine,致使无法注册特定目标的优化 pass。#98660 (Alexey Milovidov) 。
  • 修复了一个 RBAC 绕过漏洞:用户此前可通过指向 localhost 的 remote()remoteSecure()cluster()clusterAllReplicas() 对任意表执行 DESCRIBE,且无需 SHOW_COLUMNS 权限。#98669 (pufit).
  • 修复了以下问题:当非布尔表达式 (例如 sin(col)) 在包含 JOIN 的 WHERE 和 SELECT 中同时使用时,过滤器下推优化会破坏共享 DAG 节点,从而导致 BAD_GET 异常和错误的查询结果。#98681 (Alexey Milovidov) 。
  • 修复在使用 read_in_order_through_join 和并行副本时出现的 LOGICAL_ERROR:“副本决定以 Default 模式读取,而不是 WithOrder”。 #98685 (Alexey Milovidov).
  • 修复将 input 表函数用作 remote 参数时出现的异常 “Bad cast from type DB::TableFunctionNode to DB::QueryNode”。#98694 (Alexey Milovidov) 。
  • 修复了因错误清理空的覆盖数据分区片段而导致过期数据分区片段“复活”的问题。 #98698 (Shaohua Wang).
  • 修复了 LogicalExpressionOptimizerPass 中的一个异常:在 equals 比较中,如果布尔函数返回 Variant 类型,就会报异常。#98712 (Alexey Milovidov).
  • 修复 parseDateTimeBestEffort 错误地解析以月份/星期前缀开头的单词的问题。关闭 #97965#98742 (Pavel Kruglov) 。
  • 修复在启用新 analyzer 时,对具有不同参数 (例如不同 SKIP 字段) 且包含引用 JSON 子路径的 ALIAS 列的 JSON 列使用 merge() 表函数或 Merge 引擎进行查询时出现的 UNKNOWN_IDENTIFIER 异常。关闭了 #97812#98753 (Pavel Kruglov) 。
  • 修复了在 View 中使用 Distributed 存储时,analyzer 对 optimize_skip_unused_shards 优化处理不正确的问题。#98754 (Nikolai Kochetov).
  • 修复了在 clickhouse-client 中,通过 --external 传入的外部表无法按名称访问 Tuple 子列的问题 (例如,对 Tuple(a UUID, b Int32) 使用 SELECT x.a) 。关闭 #96925#98755 (Pavel Kruglov) 。
  • 修复 reverseUTF8 在无效 (截断的) UTF-8 输入上抛出异常的问题。#98770 (Alexey Milovidov) 。
  • 修复在带有 false (即 or(x, 0)) 的或谓词中检测 Set 跳过索引有效性的问题。#98776 (Azat Khuzhin) 。
  • 修复一个 LOGICAL_ERROR 异常 (removeUnusedColumns 中出现块结构不匹配) ,该异常可能会在 FINAL + PREWHERE + 常量 WHERE 表达式 + 与列无关的聚合 (如 count()) 的情况下发生。#98778 (Alexey Milovidov).
  • 为 ClickHouse 字典自动重新加载生成的 system.trace_log 条目添加非空查询 ID。#98784 (Miсhael Stetsyuk) 。
  • 修复了一个崩溃问题:对于在 IDatabaseTablesIterator::table() 调用中对表进行快照之后、并在后续迭代期间被另一线程更改的那些表之间这段时间里创建的系统表,我们可能会解引用空指针。 #98792 (Grant Holly).
  • 修复 SYSTEM START REPLICATED VIEW 无法唤醒刷新任务的问题。#98797 (Pablo Marcos) 。
  • 修复了在另一个 JOIN 内使用包含 JOIN 的 view() 表函数时出现的异常 “表名不一致” (仅在旧 analyzer 下) 。#98809 (Alexey Milovidov) 。
  • 修复了通过 pending_signals 调整 RLIMIT_SIGPENDING 时的问题。#98829 (Azat Khuzhin) 。
  • 修复 loop 与 cluster 表函数组合使用时触发的异常。#98860 (Konstantin Bogdanov) 。
  • 使用多个连接键列的 LEFT ANTI JOIN 在 enable_join_runtime_filters=1 (默认开启) 时会返回错误结果。#98871 (Alexander Gololobov) 。
  • 修复 WITH FILL STALENESS 在分多个数据块读取数据时 (例如,index_granularity 较小时) 产生额外填充行的问题。#98895 (Alexey Milovidov).
  • 修复了 “RPNBuilderFunctionTreeNode has A arguments, attempted to get argument at index B” LOGICAL_ERROR。#98900 (Azat Khuzhin) 。
  • 修复了由失败的内存分配未回滚、nallocx(0) 的未定义行为以及全局峰值跟踪中的差一错误导致的内存跟踪偏差。并将跟踪范围扩展到 io_uring 的 Ring buffer。#98915 (Antonio Andelic).
  • 禁止附加用户路径之外的本地数据湖表,而不只是禁止创建这些表。#98936 (Daniil Ivanik) 。
  • 修复了一个竞态条件:在使用 urlCluster 或类似 cluster 表函数的查询中,它可能导致出现 “ReadBuffer is canceled” 异常。#98955 (Alexey Milovidov) 。
  • 修复了在传入 BFloat16 类型参数时,财务函数 (financialNetPresentValuefinancialInternalRateOfReturn 等) 中出现的 LOGICAL_ERROR 异常。#98958 (Alexey Milovidov) 。
  • 修复在禁用查询计划表达式合并时 (query_plan_merge_expressions = 0query_plan_enable_optimizations = 0) ,跳过索引 (以及主键条件) 无法应用于 ALIAS 列的问题。#98960 (Peng).
  • 异步插入现在也会增加 InsertQuery ProfileEvent 计数。关闭 #98626#98962 (Narasimha Pakeer) 。
  • 修复了在调试构建中,当主键包含 NaN 浮点数值时出现的异常 “Inconsistent KeyCondition behavior”:通过让 accurateLessaccurateEquals 按照与 ClickHouse 排序顺序一致的方式处理 NaN。关闭 #98075#98964 (Alexey Milovidov) 。
  • SummingMergeTree 不再对 Bool (以及其他 domain 类型) 的列进行求和。Bool 值会保持原样,不再进行算术求和。#98976 (Yash ).
  • 修复了在设置 optimize_const_name_sizeenable_scalar_subquery_optimization = 0 时,查询远程分片会出现 Scalar doesn&#39;t exist 异常的问题。远程查询中被替换为 __getScalar 引用的大型常量未发送到分片,导致查询失败。#98979 (andriibeee) 。
  • 修复了某些查询中的 NOT_FOUND_COLUMN_IN_BLOCK 问题;这些查询带有 GROUP BY,且表达式中包含反向字典查找、Date/DateTime 转换比较以及元组比较。关闭 #98888#98980 (Nihal Z. Miaji) 。
  • 修复了在 MergeTree 引擎中将 version/sign/is_deleted 列修改为 EPHEMERALALIAS 时出现的未定义行为 (空指针解引用) 问题。现在此类修改会被正确拒绝。#98985 (Alexey Milovidov).
  • 修复了一个问题:system.grantsaccess_object 列中遗漏了 URLS3 授权对应的正则表达式参数。#98987 (DQ).
  • 已修复 Iceberg BigLake 读取问题:ADC 凭据现会传递给 GCS S3 客户端 (修复了 403 错误) ;OAuth2 凭据会在发送前进行 URL 编码 (修复了包含特殊字符的令牌导致的身份验证失败) ;命名空间遍历在遇到 BigLake HTTP 400 响应时也不再中止。#98998 (Nikita Fomichev) 。
  • 修复了 clickhouse-clientTZ 环境变量使用 POSIX 文件路径语法时 (例如 TZ=:/etc/localtime) 无法切换时区的问题。#99000 (Yash ).
  • 修复了将 startsWithLIKENOT LIKE 用于 FixedString 列时出现的剪枝不正确或剪枝不足问题。此外,包裹键列的 FixedStringString 类型转换函数现在也可以进行粒度剪枝。关闭 #98940#99001 (Nihal Z. Miaji) 。
  • 修复了 windowFunnel 在遇到重复事件时,启用 strict_deduplication 会返回错误级别的问题。#99003 (Yash ).
  • 修复了一个问题:EXISTS 会忽略子查询中的 LIMIT 和 OFFSET 子句,导致当子查询因 OFFSET 或 LIMIT 为 0 而未返回任何行时,结果不正确。关闭 #88722#99005 (andriibeee) 。
  • 修复在使用 GROUPING SETS 时,过滤器下推优化遇到可短路为常量的 AND 表达式时触发的 “Block structure mismatch” 异常。 #99010 (Alexey Milovidov).
  • 修复了在查询计划中未包含 _part_offset 列时,读取补丁分区片段 (轻量级更新) 会触发异常的问题。 #99023 (Alexey Milovidov).
  • 对于类似 SELECT * FROM table WHERE pk_id = '' 这样的查询,如果 pk_id 是主键且类型为 String,现在会正确使用主键索引来过滤粒度。 #99027 (Shankar Iyer).
  • 修复了一个问题:当 materialized view 在后台线程流式传输数据时被 detach,Kafka 引擎会抛出 DEPENDENCIES_NOT_FOUND 异常。#99028 (Alexey Milovidov) 。
  • 修复了在创建包含与虚拟列 (如 _part_offset) 同名的 EPHEMERAL 列的表时触发的异常。#99031 (Alexey Milovidov).
  • 修复了通过带有通配符模式的 url() 表函数读取不存在的压缩文件时,误导性的 “inflate failed: buffer error” 报错。现在,当启用 http_skip_not_found_url_for_globs 时,会按预期返回空结果。#99034 (Alexey Milovidov).
  • 修复了在 schema 变更 (例如 ADD COLUMN) 后,对 patch part 执行 ALTER TABLE ... DROP PART 时发生的 server 崩溃 (std::terminate) 问题。该崩溃是由于空 coverage part 的 metadata 中缺少系统列 (_part) ,从而导致在 NOEXCEPT_SCOPE 内部抛出未被捕获的异常。#99036 (Peng) 。
  • 如果在 缓存磁盘读取 期间因超出内存限制而抛出异常,ClickHouse 服务器进程可能会崩溃。该问题现已修复。#99042 (Shankar Iyer) 。
  • 修复了在使用 dictGet 查询同时具有 ROW POLICY 和 ALIAS 列的表时出现的 LOGICAL_ERROR。该问题是由于在新的 analyzer 中解析 ALIAS 列期间过早访问表表达式所致。#99065 (Peng).
  • 修复了用户在仅查询使用 Avro 格式存储数据的 Iceberg 表虚拟列时出现的越界错误。这种情况极其罕见,因此未将其标记为严重问题。修复 #88238#99080 (alesapin).
  • 修复了递归 CTE 中使用 remote() + view() 时出现的段错误。 #99081 (Konstantin Bogdanov).
  • 应用按序读取优化时,跳过不必要的额外索引分析。#99084 (Vladimir Cherkasov) 。
  • 修复了在应用 patch part 期间因抛出内存限制异常而导致的崩溃。#99086 (Anton Popov).
  • 修复了 DDLWorker 中的调试断言问题:在重新初始化恢复期间,ZooKeeper 条目被删除后,first_failed_task_name 变为过期状态,从而触发该问题。#99099 (Antonio Andelic) 。
  • 修复了带有生存时间 (TTL) 的合并过程中重建文本索引的问题。#99107 (Anton Popov).
  • 修复 Iceberg 表引擎中 ALTER TABLE ... REMOVE SETTINGS 查询导致的崩溃问题。修复了 #86330#99108 (alesapin) 。
  • 修复了 query_plan_convert_any_join_to_semi_or_anti_join 优化中的一个 bug,该 bug 会导致不匹配的行返回错误结果。相关链接:https://github.com/ClickHouse/ClickHouse/pull/95995。[#99112](https://github.com/ClickHouse/ClickHouse/pull/99112) (Yarik Briukhovetskyi).
  • 修复 ASTColumnsExceptTransformer::transform 中的 LOGICAL_ERROR 异常。#99119 (Pablo Marcos) 。
  • 修复了一个 RBAC 绕过漏洞:该漏洞允许用户在未具备所需 source 访问特权的情况下,通过对表函数 (mysql()postgresql()sqlite()arrowFlight()jdbc()odbc() 等) 执行 DESCRIBE TABLECREATE TABLE AS 来获取表结构。对于那些从远程服务器推断 schema 的函数,这还会导致用户在未经授权的情况下触发出站连接 (SSRF) 。#99122 (pufit).
  • 修复 Keeper 在动态重新配置和 leader 切换期间发生的崩溃问题 (NuRaft 中的 segfault) 。#99133 (JIaQi Tang) 。
  • 修复了在目标端不支持 SAMPLE 时使用 Buffer 表导致崩溃的问题。#99141 (Kseniia Sumarokova).
  • 修复因补丁分区片段列顺序不一致导致的 LOGICAL_ERROR。#99164 (Pablo Marcos) 。
  • 修复了一个极少见的崩溃问题:当 Iceberg 表包含混合格式 (ORC 和 Parquet) 的文件时可能会发生。修复了 #88126#99168 (alesapin).
  • 修复了备份/恢复时未应用 max_execution_time 的问题。 #99205 (Kseniia Sumarokova).
  • 修复了在未使用 ORDER BY ALLINSERT SELECT 查询中,insert_deduplication_token 会被悄然忽略的问题。此前,对于未排序的 INSERT SELECT,即使提供了显式的用户标记,也会完全禁用去重。现在,只要提供 insert_deduplication_token,无论是否使用 ORDER BY ALL,都足以启用去重。 #99206 (Desel72).
  • 修复 InverseDictionaryLookupPass 优化过程中权限检查过多的问题:不再对遍历到的每个节点都检查一次 CREATE_TEMPORARY_TABLE 权限,而是在该 pass 开始前只检查一次。#99210 (Mikhail Artemenko)。
  • 修复了 clickhouse format --obfuscate 因混淆跳过索引类型、压缩编解码器名称、数据库引擎名称以及字典布局和数据源定义而生成无效 SQL 的问题。#99260 (Raúl Marín) 。
  • 修复了一个 bug:在某些情况下,Time[64]DateTime[64] 类型之间的比较结果容易引起混淆;现在,遇到这类情况时,会通过添加日期部分 1970-01-01,将 Time[64] 值提升为 DateTime[64]#99267 (Yarik Briukhovetskyi) 。
  • 在 DDL 工作线程中收紧分布式 DDL 查询的设置约束。#99317 (Pablo Marcos).
  • 修复 TOTP 身份验证中的一些小问题:--one-time-password CLI 选项在密码为空时的问题,以及对 <digits><period> 配置值的校验。#99322 (Vladimir Cherkasov) 。
  • 修复了 Avro 输出格式中的逻辑错误 unordered_map::at: key not found:序列化值不在枚举定义内的 Enum8/Enum16 列时会报错。#99332 (Desel72).
  • 修复了在包含 Dynamic 的 Tuple 中使用稀疏序列化时 CHECK TABLE 的问题。关闭 #96588#99351 (Pavel Kruglov).
  • 修复了文本索引预处理器验证过于严格的问题。#99359 (Anton Popov) 。
  • 修复带有隐式 minmax 索引的复制表从 25.10 升级到更高版本时的兼容性问题。 #99392 (Raúl Marín).
  • 移除了文本索引分析对否定函数 (notEqualsnotLikenotIn) 的支持。这些函数本来就无法跳过任何粒度,因此为它们进行索引分析只会徒增开销,毫无收益。#99393 (Anton Popov) 。
  • 修复了在 IN 子查询中使用 Distributed 表时,新 analyzer 下 optimize_skip_unused_shards 的问题。#99436 (Nikolai Kochetov).
  • 修复当查询产生重复列名时,INTERSECT/EXCEPT 中的 heap-use-after-free 问题。#99471 (Alexey Milovidov) 。
  • 修复了 ALTER TABLE ... DROP PART 在使用带类型的查询参数作为分片名称时的逻辑错误。#99489 (Alexey Milovidov) 。
  • 修复了 NOT_FOUND_COLUMN_IN_BLOCK 异常:当通过别名在 SELECTWHERE 子句中同时引用文本索引谓词 (如 hasAllTokens) 时,会触发该异常。#99504 (Anton Popov).
  • 修复了在对具有各自独立文本索引的列执行 OR 操作时使用 hasAllTokens 会导致结果不正确的问题。#99505 (Anton Popov).
  • clickhouse-local 中初始化页缓存,使 page_cache_max_size 设置生效。#99510 (Alexey Milovidov) 。
  • 修复了一个罕见问题:在执行 DETACH/ATTACH TABLE 查询后,可能会错误地将数据分区片段标记为损坏并将其分离。#99529 (Anton Popov).
  • 修复了通过 HTTP 接口使用 Pretty 格式查询空系统表时触发的 std::length_error 异常。#99541 (Alexey Milovidov).
  • 修复了使用 ALTER TABLE ADD COLUMN 创建与虚拟列 (如 _part_offset) 同名的 EPHEMERAL 列时触发的 LOGICAL_ERROR#99549 (Alexey Milovidov) 。
  • 修复了因缓存键不匹配导致在移除分片后 VectorSimilarityIndexCache 条目始终无法被淘汰的问题。#99575 (Seva Potapov).
  • 禁止从本地文件读取 Google 凭据。此设置存在安全隐患,因为一旦知道文件路径,就可能读取其他凭据。#99584 (Konstantin Vedernikov).
  • 修复 analyzer 中的性能劣化问题。移除 ARRAY JOIN 中未使用的列。#99587 (Dmitry Novik) 。
  • 修复了在已启用轻量级删除和行策略的表中读取文本索引时的问题。#99661 (Anton Popov) 。
  • 修复 Parquet 读取器在 filter-in-decoder path 遇到已过滤页面时的 nullptr 解引用问题。关闭了 #99676#99677 (Alexey Milovidov).
  • 修复了 AsynchronousReadBufferFromFileDescriptor 在使用 O_DIRECT 时错误的寻道操作。关闭了 #99358#99678 (Pavel Kruglov)。
  • 修复了解压格式错误的压缩数据时,CompressionCodecT64 中的堆缓冲区溢出,以及 CompressionCodecMultiple 中的进程中止问题。这两个问题均由新的 libFuzzer 目标发现。现在这些编解码器会抛出异常,而不是发生崩溃。#99680 (Rahul).
  • 将处理推迟到服务器完成所有表的加载之后。#99700 (Seva Potapov) 。
  • 修复 MySQL 字典源在内联 DDL 参数场景下绕过 RemoteHostFilter 的问题。#99720 (Shaohua Wang) 。
  • 修复遍历 system.tables 中的数据湖表时出现的逻辑错误。#99739 (Konstantin Vedernikov) 。
  • 修复了带有预处理器的文本索引在分析使用 IN 函数的谓词时的问题。修复了文本索引中搜索标记发生冲突的问题,这可能导致结果不正确。#99755 (Anton Popov) 。
  • 修复读取形状维度为负数的 Npy 格式文件时出现的无限循环问题。#99812 (Desel72) 。
  • 修复了在查询计划头部计算过程中、按零行进行求值时,CRC32 函数处理 FixedString 参数会触发的 global-buffer-overflow 问题。 #99835 (Alexey Milovidov) 。
  • 修复在 Iceberg 表上执行 ALTER TABLE ... MODIFY COLUMN ... COMMENT 时因空指针解引用导致的崩溃。#99838 (Desel72).
  • 修复了 aggregate_functions_null_for_empty 设置,使其可与返回非 Nullable 类型 (如 ArrayMap) 的聚合函数配合使用 (例如 groupArraysumMap) 。#99839 (Alexey Milovidov) 。
  • 修复了在 midpoint 函数使用有符号/无符号混合整数类型调用时触发的 LOGICAL_ERROR 异常。#99867 (Alexey Milovidov) 。
  • 修复带有 HAVING 子句的查询中出现的 “块结构不匹配” 异常:当过滤表达式同时包含由会生成 NULL 的函数包装的聚合,以及 materialize(0) 时,会触发该问题。#99915 (Alexey Milovidov).
  • 修复了当 data 参数为键类型为 Array 的 Map 或其他嵌套 Array 类型时,sipHash128Keyed (以及类似的带密钥哈希函数) 中的断言失败问题。#99921 (Alexey Milovidov) 。
  • 修复在使用 convertAnyJoinToSemiOrAntiJoin 优化查询计划期间,IN 函数中出现的 LOGICAL_ERROR 异常 “Set 未就绪”。#99939 (Alexey Milovidov) 。

构建/测试/打包改进

  • 通过移除重量级头文件包含,并将高开销的模板实例化移出头文件,缩短编译时间。#97893 (Raúl Marín).
  • 通过缩减模板分发矩阵并移除重量级包含,缩短算术函数及相关头文件的编译时间。#98204 (Raúl Marín).
  • 使用 mongo-c-driver 2.2.2。#98304 (Konstantin Bogdanov).
  • 使用 postgres REL_18_3。#98306 (Konstantin Bogdanov).
  • 为 UBSan 构建启用 jemalloc 分配器,以避免因 glibc malloc 内存回收能力较差而导致 RSS 累积。#98444 (Alexey Milovidov).
  • 使用 Rust v0 符号修饰,并从 PRQL 库中剥离内部符号,以减少解析器组合器库带来的符号名膨胀。#98446 (Alexey Milovidov).
  • tests/benchmarks 添加 TPC-H 基准测试套件和 TPC-DS README。#98495 (Raufs Dunamalijevs).
  • 为全部 99 个 TPC-DS 查询添加正确性测试。#99204 (Raufs Dunamalijevs).
  • 添加一个集成测试,用于复现离线副本场景下 DDL CREATE TABLE + ALTER 的 bug (#44070) ,并将其标记为预期失败。#99259 (Raufs Dunamalijevs).
  • je_ 前缀集成 jemalloc,并移除对链接器 --wrap 的使用。#99342 (Azat Khuzhin).

ClickHouse 26.2 版本发布,2026-02-26。演示文稿视频

向后不兼容的变更

  • 默认情况下,所有插入操作都启用去重。此前,异步插入和 MV 的默认去重是关闭的,而同步插入则默认开启。此更改的目的是让这两种插入方式使用相同的默认设置。如果你在集群上显式禁用了去重,则必须显式设置 deduplicate_insert='backward_compatible_choice' 以保留原有行为。deduplicate_blocks_in_dependent_materialized_views 也是如此。#95970 (Sema Checherinda) 。
  • 统计信息的存储格式已优化。现在,所有统计信息都存储在一个文件中。#93414 (Anton Popov) 。如果你没有明确启用表统计信息,可以忽略此项。
  • 限制 S3(Azure)Queue 在内存中保存的元数据。系统表已从 azure_queue 更名为 azure_queue_metadata_cache,并将 system.s3queue 更名为 s3queue_metadata_cache#95809 (Kseniia Sumarokova) 。
  • 此前,对 Variant 列应用函数时,如果变体子类型与函数不兼容,会静默返回 NULL;现在则会抛出异常,这可能会导致依赖这种静默返回 NULL 行为的查询失效。 #95811 (Bharat Nallan).
  • 来自 PostgreSQL 的 DATE 列现在在 ClickHouse 中会推断为 Date32 (在之前的版本中,它们会被推断为 Date,这会导致超出较小范围的值发生溢出) 。现已支持将 Date32 值再插入 PostgreSQL。关闭 #73084#95999 (Alexey Milovidov) 。
  • do_not_merge_across_partitions_select_final 设置的语义现在更加明确了。此前,如果未在 config 中显式设置该 setting,这一功能可能会被自动启用。这一行为反复引发困惑,而且遗憾的是,还在生产环境中导致了一些问题。现在,规则更简单了:do_not_merge_across_partitions_select_final=1 会无条件启用该功能。如果 do_not_merge_across_partitions_select_final=0,则仅当新的 setting enable_automatic_decision_for_merging_across_partitions_for_final=1 时才会使用自动模式,否则不会使用。为了尽可能保留旧行为,默认值被设置为 do_not_merge_across_partitions_select_final=0enable_automatic_decision_for_merging_across_partitions_for_final=1#96110 (Nikita Taranov) 。
  • 现在,在创建显式指定列的 S3 表时,ClickHouse 会验证这些列名是否确实存在于远程文件的 schema 中。此前列名不匹配时仍可正常运行的查询,现在会在建表时失败。此更改修复了 #96089#96194 (Konstantin Vedernikov) 。
  • 禁止在 ORDER BY 和其他表键表达式中使用子查询。#96847 (Alexey Milovidov) 。
  • 默认启用 apply_row_policy_after_final。最初,当 optimize_move_to_prewhere_if_final=0 时,ROW POLICY 和 PREWHERE 都会遵循 FINAL,并在 FINAL 之后生效。#87303 破坏了这一行为,因为它在 ROW POLICY 过滤器上忽略了 optimize_move_to_prewhere_if_final。为修复此问题,此 PR 启用了 #91065 中引入的设置 apply_row_policy_after_final。启用 apply_row_policy_after_final 后,ROW POLICY 将像之前一样默认继续遵循 FINAL。此 PR 属于不兼容变更,因为它改变了 optimize_move_to_prewhere_if_final=1 时的行为。现在,如果要让 ROW POLICY 在 FINAL 之前生效,应使用 apply_row_policy_after_final,而不是 optimize_move_to_prewhere_if_final#97279 (Nikolai Kochetov) 。
  • Date 类型现在在 Arrow/ArrowStream 格式中会序列化为 Arrow 原生的 date32 类型,而不再是 uint16。像 PyArrow 这样的工具现在可以正确地将该列识别为日期类型。旧行为可通过 output_format_arrow_date_as_uint16 设置恢复。仍然支持读取旧版 Arrow 文件,这些文件对 Date 列使用了 uint16#96860 (Alexey Milovidov).

新特性

  • 用户现在可以直接在 ClickHouse 中使用 ClickStack (一款可观测性 UI) ,这对调试和本地开发很有帮助。#96597 (Aaron Knudtson) 。
  • 支持将基于时间的一次性密码 (TOTP) 用作身份验证方法。#71273 (Vladimir Cherkasov) 。
  • 新增 lazy_load_tables 数据库设置。启用后,数据库启动时不会加载表,而是先创建一个轻量级的 StorageTableProxy,并在首次访问时再将真实的表引擎 materialized。#96283 (xiaohuanlin) 。
  • 新增了 input_format_max_block_wait_ms 设置,以便在超时后输出数据块,并允许在 HTTP 连接意外关闭时继续处理剩余数据。#94509 (Mostafa Mohamed Salah).
  • Google BigLake catalog 集成。已关闭 #95339#97104 (Konstantin Vedernikov) 。
  • 新增系统表 system.tokenizers,用于展示所有可用的分词器。#96753 (Robert Schulze) 。
  • 新增系统表 system.user_defined_functions,用于监控 UDF 的加载状态及其配置。#90340 (Xu Jia) 。
  • 新增 system.jemalloc_stats 表,用于公开 jemalloc 内存分配器的统计信息 (通过 malloc_stats_print) ,以便诊断使用 jemalloc 构建的服务器上的内存使用情况。另在 ClickHouse HTTP interface 上新增了 /jemalloc.html HTTP 端点,用于以交互方式可视化这些统计信息。#97077 (Antonio Andelic).
  • 新增了 system.jemalloc_profile_text 表,用于读取和分析 jemalloc 堆内存剖析数据。输出格式由 jemalloc_profile_text_output_format 设置控制 (raw、symbolized 或 collapsed;默认为 collapsed) 。内联帧解析由 jemalloc_profile_text_symbolize_with_inline 控制 (启用时,会包含内联帧,但符号化速度会变慢;禁用时,则会跳过内联帧以加快输出) 。对于 collapsed 格式,jemalloc_profile_text_collapsed_use_count 控制技术栈是按存活分配次数 (true) 还是按存活字节数 (false,默认) 加权。这使 jemalloc 堆内存剖析的内存分析和火焰图可视化更加便捷。修复了 #93248#97218 (Antonio Andelic) 。
  • 新增 default_dictionary_database 设置,使 ClickHouse 能够在指定的默认数据库中解析未带数据库限定符的 external dictionaries 引用。这简化了从以 XML 定义的全局字典迁移到以 SQL 定义的按数据库划分的字典——让现有的字典查询 (例如 dictGet(‘name’, …)) 无需修改即可继续使用。#91412 (Dmitrii Plotnikov) 。
  • DatabaseReplicated 添加对辅助 ZooKeeper 的支持。#91683 (RinChanNOW) 。
  • 新增了表函数 primes 和系统表 system.primes,其中包含按升序排列的质数。关闭 #90839#92776 (Nihal Z. Miaji) 。
  • 异步插入支持并行 quorum。插入的数据会复制到满足 quorum 的副本上。如果发现重复项,查询会等待,直到先前插入的数据也完成复制。#93356 (Sema Checherinda).
  • 新增函数 colorOKLABToSRGBcolorSRGBToOKLAB,用于在 sRGB 与 OKLAB 之间相互转换值。#93361 (Pranav Tiwari).
  • 新增 deduplicate_insert 设置,用于覆盖 insert_deduplicateasync_insert_deduplicate#94413 (Sema Checherinda) 。
  • 服务器级设置 insert_deduplication_version 支持迁移到统一的去重哈希。#95409 (Sema Checherinda) 。
  • 新增 xxh3_128 哈希函数。#96055 (Raúl Marín) 。
  • 新增了 OPTIMIZE <table> DRY RUN PARTS <part names> 查询,可在不提交结果分片的情况下模拟合并操作。它可用于测试场景:验证新版本中合并操作的正确性、确定性地复现与合并相关的 bug,以及可靠地对合并性能进行基准测试。#96122 (Anton Popov).
  • 新增一项默认启用的检查,可通过设置 check_named_collection_dependencies 控制,以避免删除被表使用的命名集合。#96181 (Pablo Marcos) 。
  • 新增了 system.fail_points,可用于查看服务器中现有的 failpoint 以及它们是否已启用。这将有助于实现测试自动化。#96762 (Pedro Ferreira) 。
  • 为 Glue catalog 添加基于角色的访问。使用 aws_role_arn 设置,以及可选的 aws_role_session_name 设置。#90825 (Antonio Andelic) 。
  • 新增设置 add_minmax_index_for_temporal_columns;启用后,会自动为所有 DateDate32TimeTime64DateTimeDateTime64 列创建 MinMax 索引。#93355 (Michael Jarrett) 。
  • 支持用于 JOIN 的扩展表别名 (例如 SELECT * FROM (SELECT 1) AS t(a) JOIN (SELECT 1) AS u(b) ON a = b 这样的查询) 。已关闭 #95131#95331 (Yarik Briukhovetskyi) 。
  • 新增了对 Iceberg 表执行 ALTER TABLE RENAME COLUMN 的支持。此前仅支持 ADD COLUMN, DROP COLUMN, and MODIFY COLUMN#97455 (murphy-4o) 。

Experimental 功能

  • 文本索引现已 GA。#96794 (Robert Schulze)。
  • 用于量化位打包向量存储 (用于近似最近邻搜索) 的 QBit 数据类型现已正式可用,不再需要启用实验性设置。#95358 (Raufs Dunamalijevs)。
  • ClickHouse 中的向量搜索现在可以利用集群中的副本来_分摊_负载,并搜索向量索引 parts。这使 ClickHouse 能够支持超出单台 VM 内存容量的大型向量索引。#95876 (Shankar Iyer)。
  • 新增由 ast_fuzzer_runsast_fuzzer_any_query 设置控制的服务端 AST fuzzer。启用后,服务器会在每个查询正常执行完毕后,对其随机变更版本再次执行,并丢弃结果。#97568 (Alexey Milovidov)。
  • 在实验性的 KQL 方言中新增 iif 函数。#94790 (happyso)。
  • schema 推断现在会遵循 allow_experimental_nullable_tuple_type。启用后,推断出的 Tuple 类型可以为 Nullable(Tuple(...)),这样缺失的嵌套对象就会变为 NULL,而不是由 NULL 元素组成的 Tuple。#95525 (Nihal Z. Miaji)。
  • use_statistics_cache 设置现已默认启用,因此列统计信息会缓存在内存中,从而加快查询优化,而无需从每个 part 重新加载。#95950 (Han Fei)。

性能提升

  • 允许将主键中的任何确定性表达式用于数据跳过 (例如 ORDER BY cityHash64(user_id)/ ORDER BY length(user_id)) 。对于确定性表达式,ClickHouse 可以将该表达式应用到查询常量上,并在主键索引中使用其结果来处理 =INhas 等谓词。如果该表达式还是单射的 (例如 ORDER BY hex(p)ORDER BY reverse(tuple(reverse(p), hex(p)))) ,我们还可以有效地将索引用于其否定形式:!=NOT INNOT has。解决了 #10685。解决了 #82161#92952 (Nihal Z. Miaji) 。
  • 优化了统计信息的存储格式。现在,所有统计信息都存储在一个文件中。#93414 (Anton Popov) 。
  • 支持对文件系统缓存中的远程表引擎/函数进行并行读取。#71781 (Kseniia Sumarokova) 。
  • 允许在本地文件和对象存储表函数中使用用户态页缓存。#77874 (Michael Kolupaev) 。
  • 避免用户态页缓存中不必要的 memcpy 操作。#77884 (Michael Kolupaev) 。
  • concurrent_threads_scheduler 的默认值现已由 fair_round_robin 改为 max_min_fair。这一调整通过优先处理已分配槽位较少的查询,提升了高负载下的公平性,从而避免短时查询因长时查询而吃亏。#95300 (Sergei Trifonov).
  • 如果某个 FINAL 查询先使用主键条件进行过滤,再对其他条件使用跳过索引,那么 PrimaryKeyExpand 处理步骤现在只会检查最初筛选出的主键范围是否相交。#94903 (Shankar Iyer) 。
  • 当并行副本与 s3(...) 等表函数配合使用时,仅包含一个封装该表函数的子查询的查询现在也会自动在各个副本间并行执行;而此前只有直接引用表函数的查询才会并行执行。关闭 #92264#96332 (phulv94).
  • 支持将缓存中的数据文件和系统文件分别拆分到独立的分段中。#87834 (MikhailBurdukov) 。
  • 通过为 ColumnVector::replicate 实现动态分派,提升了某些哈希 join 操作的速度。#79573 (Raúl Marín) 。
  • 针对复杂谓词场景下的并行哈希连接进行了性能提升。此前,未连接的行仅由单个线程处理,这样的效率并不理想;此次优化的思路是将未连接行的处理并行化,分配到多个线程中执行。可通过 parallel_non_joined_rows_processing 设置控制。默认启用。 #92068 (Yarik Briukhovetskyi).
  • 小幅优化 JSON 类型的解析。#93614 (Pavel Kruglov) 。
  • 优化 AST 的内存占用。在未启用高亮且不解析 VALUES 时,这些字段不会被使用,因此这项优化是合理的。#93974 (Ilya Yatsishin) 。
  • 优化命名 Tuple AST 对象的内存占用。将列名作为字符串存放在 tuple 对象中,而不是存放在通用的 AST 字面量节点中。#94704 (Ilya Yatsishin) 。
  • 通过增加额外的链接器选项,去虚拟化得到了改进。#94737 (Nikita Taranov).
  • 通过批量处理 ZooKeeper 请求,提升包含大量 parts 的 ReplicatedMergeTree 表的副本克隆性能。#94847 (c-end) 。
  • 当 read step 已有 PREWHERE 过滤器时,就无法再添加新的过滤器。此更改将 PREWHERE 优化推迟到 JOIN 运行时过滤器优化之后,以便也能将运行时过滤器下推到 PREWHERE。 #95838 (Alexander Gololobov).
  • 通过在 x86 上使用动态分派,加速 T64 编解码器的压缩。 #95881 (Raúl Marín).
  • 在可能的情况下,通过对插入操作进行批处理来加速数值类型上的 uniq (非 NULL、非 -If、无 GROUP BY、无 IPv6 或 String) 。#95904 (Raúl Marín) 。
  • Keeper 的底层优化:经发现,ZooKeeper::observeOperations 占 ZooKeeper 接收线程 CPU 占用的 >20%。此次更改通过以下方式对此进行优化:1. 对于 AggregatedZooKeeperLog::stats,使用 CityHash64 替代 SipHash,速度快 >10 倍。2. 对于 Coordination::ErrorCounter,使用 std::array<std::atomic<UInt32>, N> 替代 std::unordered_mapstd::mutex#95962 (Miсhael Stetsyuk) 。
  • 取消 ProfileEvents::Counter 的 64 字节对齐以节省内存。#96097 (Azat Khuzhin) 。
  • 内存优化:将 CachedOnDiskReadBufferFromFile 结构体的大小缩小了 50 倍。#96098 (Azat Khuzhin).
  • 如果哈希表为空,调整大小时不要复制旧数据。#96180 (Raúl Marín).
  • 支持在 RIGHT OUTER JOIN 中使用运行时过滤器。#96183 (Hechem Selmi) 。
  • 优化项 enable_join_runtime_filters 现在默认启用。#89314 (Alexey Milovidov) 。
  • 此前,只有当所有 parts 都具有 materialized 文本索引时,才会应用文本索引直接读取优化。此 PR 新增了部分支持:如果某些 parts 具有 materialized 文本索引,这些 parts 将使用该索引;而没有 materialized 文本索引的 parts 则会回退到执行原始过滤表达式。#96411 (Anton Popov).
  • 为系统日志表中的时间列添加了 minmax 次级索引,并为 query_id/initial_query_id 列添加了 bloom_filter 索引,以提升过滤速度。#96712 (Alexey Milovidov).
  • 现在,惰性物化优化已扩展到 UNION ALL 查询的所有分支,不再仅作用于第一个分支。对于通过 UNION ALL 组合来自不同 MergeTree 表的多个已排序且带 LIMIT 的读取操作的查询,现在每个分支都能受益于延迟列读取,从而减少 I/O。#96832 (Federico Ginosa).
  • 通过移除不必要的数据拷贝,并为数值列启用向量化的最小/最大值计算,优化 INSERT 期间 minmax 跳过索引的计算。#97392 (Raúl Marín).
  • DeltaLake 存储现会从 Delta Lake 元数据中获取 count() 的结果,并在 system.tables 中显示正确的表统计信息 (总字节数/总行数) 。#96190 (Kseniia Sumarokova) 。
  • 如果从 MergeTree 读取,未使用的列也会在读取阶段被移除。当过滤器被下推到 PREWHERE 时,这项优化尤其有用。#89982 (János Benjamin Antal) 。
  • 通过仅拉取表名,优化了 SHOW TABLES 查询的处理,并改进了 getLightweightTablesIterator,使其仅返回包含表名的结构。解决了 #93835#94467 (Smita Kulkarni) 。
  • 改进 assumeNotNullcoalesceifNull:当键列被这些函数包裹时,可针对范围谓词启用主键和跳过索引剪枝。关闭 #94689#94754 (Nihal Z. Miaji) 。
  • 为 Keeper 的 getChildren 请求添加 with_data 和 with_stat 扩展。这样一来,一次操作不仅可以拉取子节点列表,还能获取它们的 stat 和/或 data#94826 (Nikolay Degterinsky) 。
  • 无论最终执行的是本地 plan,还是带有并行副本的 plan,索引分析 (在大多数情况下) 都只需进行一次。 #94854 (Nikita Taranov) 。
  • 支持根据 parts 数量 (distributed_index_analysis_min_parts_to_activate) 和索引大小 (distributed_index_analysis_min_indexes_size_to_activate) 启用分布式索引分析。#95216 (Azat Khuzhin) 。
  • 为 Iceberg 表启用 PREWHERE 优化。#95476 (Konstantin Vedernikov) 。
  • 降低某些 AST 类的内存占用。#95514 (Raúl Marín) 。
  • 限制在启用 split_intersecting_parts_ranges_into_layers 时生成的管道流数量,以避免内存消耗过高。#96478 (Nikita Taranov).
  • 为多个连接实现等价集合优化。包含多个连续 INNER JOIN 操作的查询现在可受益于改进后的过滤器下推优化。当表基于等价列进行连接时 (例如,t1 JOIN t2 ON t1.id = t2.id JOIN t3 ON t2.id = t3.id WHERE t1.id > 10) ,应用于该连接链中任意表的过滤器都会自动下推到所有表。关闭 #96550#96596 (Vladimir Cherkasov) 。
  • 优化 delta lake 元数据扫描。采用了 delta-kernel PR https://github.com/delta-io/delta-kernel-rs/pull/1827 中的变更。#96686 (Kseniia Sumarokova) 。
  • 在 Replicated database 中,不必为每个虚拟查询都更新已缓存的集群。#96897 (Tuan Pham Anh) 。
  • 如果前缀只包含 ASCII 字符,则在使用 startsWithUTF8 进行过滤时会使用主键索引。#97055 (vkcku).

改进

  • 为 Keeper 请求添加 OpenTelemetry 链路追踪。#91332 (Miсhael Stetsyuk) 。
  • 新的配置选项:logger.startup_console_level & logger.shutdown_console_level,分别用于在 ClickHouse 启动和关闭期间覆盖控制台的日志级别。#95919 (Garrett Thomas) 。
  • 重新加载配置时遵循命令行覆盖设置。关闭 #80294#80295 (Alexey Milovidov) 。
  • 允许在 mongodb 表函数中以键值对方式覆盖命名集合参数。#89616 (vanchaklar).
  • 现在,Iceberg 表的按序读取优化也支持 icebergBucketicebergTruncate 这类复杂排序函数,不再局限于简单的列引用。#90256 (Konstantin Vedernikov) 。
  • 在 system.mutations 中新增一个名为 parts_postpone_reasons 的列,以增强诊断能力,用于显示 parts 的延迟原因。#92206 (Shaohua Wang).
  • DataflowStatisticsCache 中跟踪待读取行数的变化 (由插入/删除操作或查询条件缓存的使用导致) 。#93636 (Nikita Taranov) 。
  • 支持 SYSTEM RESET DDL WORKER [ON CLUSTER] 查询。该查询会请求在 DDLWorker 的主线程中重置其状态。当 host ID 更新时,这有助于刷新副本的活跃状态。#93780 (Tuan Pham Anh) 。
  • system.part_log 中为 MUTATE_PARTMUTATE_PART_START 事件类型添加了对 mutation_ids 的支持。#93811 (Shaohua Wang) 。
  • 后台操作 (Mutate、Merge) 现在可通过 ‘background’ profile 单独配置。此前,这类操作通过 ‘default’ profile 与常规查询共用设置。#93905 (Arsen Muk).
  • system.crash_log 中添加更多信息。#94112 #95857 (Miсhael Stetsyuk) 。
  • 新增了 QueryNonInternal 指标,用于跟踪当前正在执行的非内部查询数量。该指标以 ClickHouseMetrics_QueryNonInternal 的形式暴露,帮助运维人员针对 max_concurrent_queries 限制监控查询并发度,而该限制仅适用于非内部查询。#94284 (Ashwath Singh).
  • RuntimeDataflowStatisticsCacheUpdater 中支持收集来自 compact parts 的列的输入字节统计信息。#94626 (Nikita Taranov) 。
  • 增加一项检查,用于发现可能导致集群组建失败的 Keeper 配置错误。关闭了 #60932#94682 (Konstantin Bogdanov) 。
  • 改进分片加载期间对 JSON 前缀的反序列化。#94848 (Pavel Kruglov) 。
  • 将写入流程重构为使用完整的 INSERT 管道,以触发目标表上的 materialized views。 #94890 (Kai Zhu).
  • 仅当搜索列上存在索引时,才使用向量相似性搜索的查询计划优化。#94998 (Eduard Karacharov) 。
  • 在用户身份验证之前检查总内存限制;如果总限制超过允许值,则抛出 (total) memory limit exceeded#95003 (Nikolai Kochetov) 。
  • 新增了 throw_on_unmatched_row_policies 配置选项;启用后,如果用户查询的表存在行策略,但其中没有任何一条适用于该用户,则会抛出异常,从而避免因访问控制配置错误而返回所有行这种语义含糊的行为。 #95014 (Vitaly Baranov).
  • 在使用 Unity Catalog 的长时间运行查询中动态更新 S3 访问令牌。此更改关闭了 #93981#95069 (Konstantin Vedernikov).
  • 如果 ClickHouse 持续处于内存压力下达 memory_worker_decay_adjustment_period_ms 毫秒,则禁用 jemalloc 的脏页衰减。如果 ClickHouse 在相同时间内恢复正常运行,则重新启用 jemalloc 的脏页衰减。#95145 (Antonio Andelic) 。
  • S3Queue 现已支持辅助 ZooKeeper,可使用 s3Queue 中的 keeper_path 设置。#95203 (Diego Nieto) 。
  • 在生存时间 (TTL) drop part merge 中遵循 max_parts_to_merge_at_once 限制。#95315 (Kseniia Sumarokova) 。
  • 向 query_log 添加 connection_addressconnection_port,以反映物理连接 (当通过 proxy 连接且 auth_use_forwarded_address=1 时,addressport 会被替换) 。#95471 (Yakov Olkhovskiy) 。
  • 修复了查询条件缓存的内存统计错误。问题的关键在于,之前没有将由多个字符串组成的缓存键计入统计 (例如 part_name、表 ID 以及整个 SQL 条件) 。#95478 (Nikita Mikhaylov) 。
  • 使用嵌入式配置启动的服务器将像常规配置一样,支持管理用户和授权,并将其保存到 access 目录中。这改进了测试体验。此外,还在嵌入式配置和 clickhouse-local 中启用了所有 access_control_improvements。#95481 (Alexey Milovidov).
  • 改进了 S3 身份验证错误消息:当访问被拒绝时,会提示检查凭据。#95648 (Gerald Latkovic) 。
  • 启用统计信息缓存,并将缓存更新周期设置为 300 秒。#95841 (Han Fei).
  • system.aggregated_zookeeper_log 添加组件名称。#95882 (Antonio Andelic) 。
  • system.tables 查询 DeltaLake 表时,跳过对对象存储的读取。#95899 (Antonio Andelic) 。
  • compatibility 设置为 26.2 或更高版本时,默认启用 enable_max_bytes_limit_for_min_age_to_force_merge#95917 (Christoph Wurm) 。
  • Delta Lake 现已可在 macOS 上使用。修复 #95979。#95985 (Alexey Milovidov) 。
  • 在先前版本中,将存在冲突的 ALTER 表达式与 UPDATE 和 RENAME COLUMN 组合使用时,抛出的是逻辑错误,而不是正确的异常。关闭了 #70678#96022 (Alexey Milovidov) 。
  • 改进所有 ClickHouse 应用程序的帮助输出,新增 --no-sudo 选项,并修复了一些问题。这是对 Ilya Yatsishin 提交的 #58244 的延续。#96025 (Alexey Milovidov) 。
  • cosineDistance 新增 distanceCosine 别名,因为其他所有距离函数都已有这种形式的别名。#96065 (Raufs Dunamalijevs) 。
  • 新增对 with_data Keeper 扩展的支持,以改进 Database Replicated 中的表拉取能力。#96090 (Nikolay Degterinsky).
  • 将 chdig 更新至 v26.2.1 (新增功能并支持 MacOS) 。#96113 (Azat Khuzhin) 。
  • 改进了 numbersprimes 的过滤器下推。现在,当无法推导出精确边界时,ClickHouse 可以根据 WHERE 条件推导出保守的取值边界,并据此限制序列生成 (例如,对于 WHERE number % 5 < 2 AND number > 100 AND number < 300,ClickHouse 只会生成 100 到 300 之间的数字,然后再应用谓词) ,从而避免无界扫描。关闭 #84853。关闭 #93913#96115 (Nihal Z. Miaji) 。
  • 此前,当存在 COMMENT 子句时,为避免解析歧义,格式说明符会用括号将 SELECT 括起来。现在改为在 AS SELECT 之前输出 COMMENT,无需加括号也能消除歧义。#96293 (Alexey Milovidov).
  • allow_impersonate_user 配置项现已移至 access_control_improvements 部分中,不再作为独立的服务器级设置。#96451 (Vitaly Baranov).
  • 使 core_dump.size_limit 配置项支持热重载,避免为使配置更改生效而必须重启服务器。#96524 (Miсhael Stetsyuk) 。
  • 改进了 CPU 和实时 Profiler 与套接字超时机制之间的兼容性。#96601 (Sergei Trifonov) 。
  • 如果在 DROP COLUMN 变更后很快执行 ADD COLUMN,可防止已删除的数据重新出现。#96713 (Alexey Milovidov) 。
  • system.instrumentation 中的 function_id 类型从 LowCardinality(Int32) 改为 Int32。#96726 (Copilot) 。
  • 同步等待变更时,将遵循查询取消和时限。#96756 (Alexey Milovidov).
  • 新增了系统命令 SYSTEM RELOAD DELTA KERNEL TRACING <level>,可用于调整 delta-kernel 日志,这在调试时可能很有帮助。#96763 (Kseniia Sumarokova) 。
  • 按 IP 地址家族进行过滤 (即 dns_allow_resolve_names_to_ipv4/ipv6 设置) 即使在禁用 DNS 缓存时也会生效。#96810 (c-end) 。
  • 改进 jemalloc 内部信息。#96840 (Azat Khuzhin) 。
  • 修复 /play Web UI 查询系统表时抛出 QUERY_CACHE_USED_WITH_SYSTEM_TABLE 的问题。#96869 (Alexey Milovidov).
  • 改进 Web UI:更改 favicon 以指示查询运行状态;显示辅助查询 (加载数据库和表) 返回的错误,而不是悄悄忽略它们。关闭 #85055#96883 (Alexey Milovidov) 。
  • 使 /play UI 中的左侧面板支持点击,以切换数据库列表的显示状态。#96884 (Alexey Milovidov) 。
  • DROP DATABASE 现在会按依赖关系的逆序删除表,从而在数据库包含存在加载依赖项的表 (例如使用 joinGetDistributed 表) 时提高崩溃安全性。#97057 (Alexey Milovidov).
  • 升级 yaml-cpp,以防无效的 YAML 被跳过。#97333 (Azat Khuzhin) 。
  • 在拉取表期间,在 play.html 侧边栏显示加载指示器。#97531 (Alexey Milovidov) 。
  • 在内置 web UI (play.html) 中,为原始查询结果新增了一个复制到剪贴板的按钮。#97532 (Alexey Milovidov) 。
  • 修复查询混淆器 (clickhouse-format --obfuscate) ,使其在更多情况下生成可被解析的 SQL。#97584 (Alexey Milovidov) 。

缺陷修复 (官方稳定版本中用户可见的异常行为)

  • 在仅修改 metadata 的 ALTER 操作 (例如扩展枚举的元素) 之后,使用投影优化聚合时最终可能会导致异常。#84143 (Alexey Milovidov) 。
  • materialized views 现在会使用其创建所在的 database 作为执行上下文,这意味着:- 可以在视图的 select 查询中省略所引用名称的显式 database 限定 - 如果未显式指定 database 限定,则默认使用创建 materialized view 时所在的同一个 database。 #88193 (Dmitry Kovalev).
  • 修复了在使用 ON CLUSTER 时,CREATE USER 身份验证方法中的查询参数替换问题。身份验证方法中的查询参数 (例如密码) 此前不会被替换,导致远程节点上出现 UNKNOWN_QUERY_PARAMETER 错误。#92777 (xiaohuanlin).
  • 修复了 hasmapContainsKeymapContainsValue 函数在文本索引分析中的结果不一致问题。此前,使用这些函数的查询在表达式通过文本索引求值或不通过文本索引求值时,可能返回不同的结果。#93578 (Anton Popov).
  • 修复了在将表附加到 MaterializedPostgreSQL 数据库时,若 dropReplicationSlot 在栈展开过程中抛出异常而导致崩溃的问题。#96871 (Alexey Milovidov) 。
  • 如果同时对同一文件执行大量彼此冲突的备份操作,可能会导致服务器崩溃。#93659 (Alexey Milovidov).
  • 修复了在使用并行副本且对非 MT 表执行 JOIN 时的查询问题。关闭 #92056#93902 (Igor Nikonov) 。
  • 修复了一个问题:当 Iceberg 列名中包含点号时,其值会返回为 NULL。#94335 (Mikhail Koviazin).
  • 修复了 stringJaccardIndexUTF8 中 UTF8 字符串处理的问题,并提升了性能。#94613 (Joanna Hulboj) 。
  • 修复 WITH FILL STALENESS 中可能发生的溢出问题 (会导致 UB 和/或无限循环) 。修复因跨度过大而导致的潜在无限循环。新增对旧 analyzer 的支持 (主要用于压力测试) 。#94663 (Azat Khuzhin).
  • 修复了在主机名解析到多个地址且远程副本冻结时,分布式查询可能挂起的问题。#94726 (c-end).
  • 修复在连接多个表表达式时,当最左侧的表表达式为 -Cluster 表函数时结果无效的问题。解决了 #89996#94748 (Konstantin Bogdanov) 。
  • 修复涉及 toWeektoYearWeektoStartOfWeektoLastDayOfWeektoDayOfWeek 的谓词时,主键和跳过索引剪枝不正确的问题,并修复其中部分函数在对 LowCardinality(String) 执行有效查询时抛出异常的问题。#94816 (Nihal Z. Miaji).
  • 移除了对启用 SQL Security 的视图执行 ATTACH 查询时不必要的权限检查跳过逻辑。这可防止用户在未验证所需访问权限的情况下附加带有 definer 的视图时发生潜在的权限提升。#94865 (pufit).
  • 修复了 ReplicatedMergeTree 启动期间因并发移除 delete_tmp_* 目录而导致的崩溃。#94892 (myeongjun).
  • 修复了对带有 materialized view 的 Iceberg 表执行 INSERT 时丢失去重信息并导致异常的问题。 #94938 (Daniil Ivanik).
  • 修复了一个 bug:SYSTEM DROP QUERY CACHE TAG 'TAGNAME' ON CLUSTER <CLUSTERNAME> 原本会删除整个集群上的全部缓存。#94978 (Rory Crispin).
  • 在 Vertical merge 后保留恒定的索引粒度 (use_const_adaptive_granularity) (包括修复了 Nested 的 v2 以及一般情况) 。#95013 (Azat Khuzhin) 。
  • 修复了在 [ClickHouse/ClickHouse#82764](https://github.com/ClickHouse/ClickHouse/pull/82764) 之后,26.1 版本中文件系统缓存的竞争问题。#95042 (Kseniia Sumarokova) 。
  • 修复在 clickhouse-client 中使用 KILL QUERY 和取消查询 (Ctrl+C) 时,无法取消 postgresql() 表函数的问题。#95136 (Roman Vasin).
  • 修复了在使用多个 join 且带有 USING 子句时,对源表中带限定名前缀的列进行类型推断的问题。此前,后续 join 会错误地将底层源列的类型更新为共同超类型,即使该列并未参与该 join (例如,在 SELECT t2.a FROM t1 LEFT JOIN t2 USING (a) LEFT JOIN t3 USING (a) 中,t2.a 列仅用于第一个 join,因此其类型应为 t1.at2.a 的超类型,不应包含 t3.a) 。当函数预期的列类型与执行计划中实际出现的类型不一致时,这可能会导致逻辑错误或崩溃。#95157 (Vladimir Cherkasov) 。
  • 在获取清单 .avro 列表和文件内容时,仅对列执行一次转换。#95164 (Daniil Ivanik).
  • 修复了 JSON 列大小计算错误的问题,此问题可能导致内存占用过高或列统计信息错误。#95207 (Azat Khuzhin).
  • 修复了在轻量级更新后应用大型补丁分区片段时内存统计不准确的问题。此前,应用大型补丁可能导致内存占用过高,并使服务器进程被 OOM killer 杀死。#95231 (Anton Popov).
  • 修复了一处未定义行为:当启用 max_parallel_replicas 的分布式查询在索引分析期间回退到本地副本时,可能导致结果错误或抛出异常。 #95263 (Azat Khuzhin).
  • 修复在 group_by_overflow_mode 设为 any 时,sum 和时间序列对稀疏列的聚合问题。#95301 (Mikhail Koviazin) 。
  • 修复了 plain_rewritable disk policy 中的一个可靠性问题:如果在解除元数据文件链接的过程中途发生网络错误,可能会导致存储处于不一致状态。#95302 (Mikhail Artemenko) 。
  • 将 Iceberg 的 Date 替换为 Date32。#95322 (Konstantin Vedernikov) 。
  • redis 表函数的密码参数现在会在日志和系统表 (例如:query_log) 中进行脱敏处理。#95325 (János Benjamin Antal) 。
  • 修复了一个 bug:在分布式查询仍在访问某些表时,这些表可能被删除或修改,从而导致异常或错误结果。#95356 (Azat Khuzhin) 。
  • 修复了某些情况下在分布式查询中使用负数 LIMIT/OFFSET 时的逻辑错误。#95357 (Nihal Z. Miaji) 。
  • 修复了一个问题:通过 ssh 连接时,clickhouse-client 会要求输入两次密码。 #95372 (Isak Ellmer).
  • 修复存储 S3(Azure)Queue 中的数据竞争问题。#95385 (Kseniia Sumarokova) 。
  • 修复了由 prewhere 中的 lambda 表达式引发的 prewhere 过滤器错误。#95395 (Xiaozhe Yu) 。
  • 修复 optimize_syntax_fuse_functions:当聚合参数为 Nullable 时,不再将 sum/count/avg 重写为 sumCount()。关闭 #95390#95441 (Nihal Z. Miaji) 。
  • 避免在取消时分布式查询可能发生的崩溃。#95466 (Aleksandr Musorin) 。
  • 修复 S3(Azure)Queue 引擎流式传输时的去重问题。#95467 (Kseniia Sumarokova) 。
  • 修复了在分布式查询中更新分配给初始用户的行策略时出现的问题。#95469 (Vitaly Baranov) 。
  • 修复 plain_rewritable 上加密磁盘的检查问题 (修复了可能出现的 It is not possible to register multiple plain-rewritable disks with the same object storage prefix) 。#95470 (Azat Khuzhin) 。
  • mergeTreeProjection 表函数此前缺少访问检查,导致没有某个表的 SELECT 权限 (但拥有表函数权限) 的用户仍可从其投影中读取数据。此修复补充了与 mergeTreeIndexmergeTreeAnalyzeIndexes 已具备的相同访问检查。#95480 (Alexey Milovidov) 。
  • 修复了从 Dynamic/JSON 类型的动态子列中读取 size 子列时可能出现的逻辑错误。#95573 (Pavel Kruglov) 。
  • 修复了由 #94262 引入的 (Experimental) 零拷贝复制回归问题:共享 parts 可能会在其他副本完成拉取前被删除。#95597 (filimonov) 。
  • 修复对 JSON 数组使用 tupleElement 时发生的崩溃。关闭 #95581#95647 (Pavel Kruglov) 。
  • 修复了在带有 USING 的 JOIN 中,当在 VALUES 子句中的 lambda 函数内使用匹配器 (*) 时会抛出逻辑错误异常的问题。关闭 #93675#95661 (Vladimir Cherkasov) 。
  • 修复了在等待分布式 DDL 且同时删除 Replicated 数据库时出现的 There was an error: Cannot obtain error message 逻辑错误。修复 #95539#95664 (Alexander Tokmakov) 。
  • 修复了在启用 transform_null_in 时,IN 函数对 NULL 值返回不正确结果的问题。关闭 #65776#95674 (Nihal Z. Miaji) 。
  • 当设置 cast_keep_nullable 启用时,在 CAST 中正确处理 LowCardinality Nullable 类型。修复了 #95670#95747 (Alexey Milovidov).
  • 修复分区 delta lake 数据在 squashing 过程中的问题。#95773 (Kseniia Sumarokova).
  • 修复运行时过滤器中 Nullable join 列的竞态条件。#95775 (Hechem Selmi) 。
  • 修复了这样一种查询中可能出现的逻辑错误:当 USING 列在表和选择列表中的类型不同时,查询使用了匹配器 (*table.*) 和 analyzer_compatibility_join_using_top_level_identifier。关闭 #90477#95808 (Vladimir Cherkasov) 。
  • 修复并行线程池操作 (备份、聚合、分布式查询) 中的内存安全问题;这些问题可能会在任务调度期间发生错误时引发异常。 #95818 (Raúl Marín).
  • 修复了这样一个崩溃问题:在与使用即将被删除的 workload 的查询并发执行时运行 DROP WORKLOAD,可能会导致崩溃。#95856 (Alexey Milovidov) 。
  • 修复了当用户仅在许多数据库上具有受限授权时,查询系统表性能缓慢的问题。关闭 #89371#95874 (pufit)。
  • 修复了在带有嵌套路径的 JSON 上执行 tupleElement 时的问题,此前该问题可能导致查询结果错误。#95907 (Pavel Kruglov).
  • 修复了在空 MergeTree 表上使用 direct join 算法时可能出现的 NOT_SUPPORTED 错误。#95935 (Vladimir Cherkasov) 。
  • 修复客户端不会为设置项建议并自动补全别名的问题,关闭 #92190#95945 (phulv94) 。
  • 修复 system.asynchronous_metric_log 中的 event_date 问题。 #95947 (Raúl Marín) 。
  • 修复了 JSON 数据类型中的 skipping paths 问题。此前,使用 JSON(SKIP path) 时,所有以前缀 path 开头的 JSON 键都会被跳过,甚至包括 "pathpath" 这样的键,因此在插入时可能导致这些 paths 的数据丢失。现在该问题已修复,只有键 "path" 会被跳过。#95948 (Pavel Kruglov) 。
  • 包含未知投影的分片不应被永久标记为丢失。#95952 (Mikhail Artemenko).
  • 修复 Join 表中使用 Nullable(String) 键时空字符串变为 NULL 的问题。关闭 #71414#96002 (Alexey Milovidov) 。
  • 现在,PostgreSQL 引擎已能正确读取 BOOLEAN[]。修复了 #72754#96006 (Alexey Milovidov) 。
  • 修复了从空文件读取时 ProtobufList 格式的问题。关闭 #70059#96007 (Alexey Milovidov) 。
  • 修复 ProtobufList format 在空表中产生幽灵记录的问题。关闭 #72596#96010 (Alexey Milovidov) 。
  • 修复了在涉及 distributed queries、PREWHERE 和类型推断的一种特殊情况下,if 函数在 UInt64Int32 之间的类型不匹配问题。关闭 #70017#96012 (Alexey Milovidov) 。
  • 修复了涉及 Bool 类型的 JIT 编译查询问题。#96013 (Alexey Milovidov) 。
  • 修复了从 SQLite 的 TEXT 列读取 UUID 列时出现的逻辑错误。已关闭 #71263#96016 (Alexey Milovidov).
  • 修复 SQLite 引擎对 DateTimeDateUUID 等类型的转换问题。关闭 #73481#96017 (Alexey Milovidov) 。
  • 在对外部数据库 SQLite 和 PostgreSQL 的查询中,FixedString 值的转义方式不正确。已关闭 #73519。与 @jh0x 共同完成。#96019 (Alexey Milovidov) 。
  • 修复了 WindowTransform 在 PRECEDING 偏移量过大时触发的断言失败。已关闭 #75852#96026 (Alexey Milovidov).
  • 修复了一个可能导致数据损坏的问题:当并发异步插入使用相同的参数名但包含不同的值时,会出现该问题。 #96035 (Seva Potapov).
  • 修复全局性能分析器的周期设置问题 (由 global_profiler_real_time_period_nsglobal_profiler_cpu_time_period_ns 控制) 。此前使用的是截断后的值,而不是设定值,导致性能分析器的唤醒频率高于预期。#96048 (Antonio Andelic) 。
  • 此前,如果用于 position delete 的 Iceberg manifest 文件中,引用的数据文件在某个条目里存在但其值为 NULL,我们就无法获取对应数据文件的正确范围。此 PR 修复了这个 bug。#96061 (Daniil Ivanik) 。
  • 修复撤销默认角色时出现的问题。#96103 (Vitaly Baranov) 。
  • 修复了索引分析中的释放后使用问题,该问题会在罕见情况下出现:禁用 use_primary_key,且使用索引的条件析取数量非常大。#96112 (Alexey Milovidov) 。
  • 修复了 Gorilla 编解码器中的一个回归问题:当显式指定的大小与数据类型大小不一致,且缓冲区大小过小时,先前版本会在解压缩时抛出异常。关闭 #78253#96118 (Alexey Milovidov) 。
  • 避免在字典加载时出现死锁:当某个字典引用了一个又递归引用该字典的 Merge 表时。关闭 #78360#96120 (Alexey Milovidov) 。
  • 修复了 formatDateTime 在使用非固定宽度格式说明符 (如 MySQL 和 JODA 风格) 时会使用未初始化值的问题。#96133 (Alexey Milovidov).
  • 设置 use_const_adaptive_granularityindex_granularity_bytes 的组合 (即“非自适应粒度”) 会导致待读取行数计算错误,并引发异常。#96143 (Alexey Milovidov) 。
  • 在对象存储的类文件表 (如 S3 和 Azure) 上执行无效的 ALTER UPDATE 变更,可能会导致空指针解引用。已关闭 #92994#96162 (Alexey Milovidov) 。
  • 修复 AccessRights::contains 在部分撤销权限时返回错误结果的问题。#96170 (pufit) 。
  • 修复了 CTE 折叠常量导致的查询条件缓存哈希冲突问题,该问题可能会导致查询结果错误。关闭 #96060#96172 (Alexey Milovidov) 。
  • 修复 ProcessList 中可能出现的死锁问题。当我们向 cancellation checker 添加任务时,如果此时触发了内存 overcommit 跟踪器,可能会因潜在的锁顺序反转而导致这种情况发生。#96182 (Antonio Andelic).
  • 修复了一个错误:当包含外连接 (LEFT、RIGHT 或 FULL) 的查询与多个 INNER JOIN 结合使用时,由于不合法的 JOIN 重排序,可能会返回错误结果。当外连接的 ON 条件引用了之前已连接的多个表中的列时,优化器未能正确考虑所有表依赖关系,因此可能错误地重排 JOIN,导致部分行丢失。关闭 #95972#96193 (Vladimir Cherkasov) 。
  • 当表未定义统计信息时,ClickHouse 不应尝试加载这些统计信息。这样可避免为检查统计信息文件是否存在而带来的额外开销 (100+ms) 。 (issue #96068) 。#96233 (Han Fei) 。
  • 修复 optimize_syntax_fuse_functions:当聚合参数为 LowCardinality(Nullable) 时,不再将 sum/count/avg 重写为 sumCount()。关闭 #95390#96239 (Nihal Z. Miaji) 。
  • 修复了某些情况下 not INnot has 函数的分区裁剪错误。#96241 (Nihal Z. Miaji) 。
  • 修复向量相似度索引中的 stack-use-after-scope 错误。#96259 (Alexey Milovidov) 。
  • 修复了在查询前有 SQL 注释时,测试运行器无法识别错误提示注释的问题。#96336 (Yakov Olkhovskiy) 。
  • 修复了以下逻辑错误:当表的主键为 Nullable,且查询使用了 coalesce 函数并且其第一个参数为常量时,KeyCondition 会出现逻辑错误。#96340 (Alexey Milovidov) 。
  • GROUPING SETSgroup_by_use_nulls 以及内部包含 LowCardinalityTuple 数据类型相互作用时,可能会在查询管道中产生异常的块结构,进而导致逻辑错误。这个问题是在引入 Nullable Tuple 之后出现的。#96358 (Alexey Milovidov) 。
  • 此前可以创建将空表达式 () 用作索引的表,这会导致无效的内存访问。#96363 (Alexey Milovidov).
  • 修复了旧版 analyzer 在 JOIN 与重复别名同时出现时的崩溃问题。#96405 (Ilya Golshtein).
  • 修复了因对 Variant 列进行错误的原地过滤优化而导致的 Nested columns sizes are inconsistent with local_discriminators 错误。#96410 (Alexey Milovidov).
  • 修复 CREATE TABLE ... CLONE AS ... 忽略源表完整限定名称的问题。#96415 (Hasyimi Bahrudin) 。
  • 修复在 clickhouse-client 中通过 KILL QUERY 和取消查询 (Ctrl+C) 取消 mysql 表函数时的问题。#96437 (Roman Vasin) 。
  • 修复了高 max_execution_time 值查询的取消检查线程中的活锁问题。#96450 (Sergei Trifonov).
  • 修复了在某些情况下,分布式查询中使用带小数的 LIMIT/OFFSET 时出现的逻辑错误。#96475 (Nihal Z. Miaji) 。
  • 修复某些包含 lambda 函数的表达式中的空指针解引用问题。#96479 (Alexey Milovidov) 。
  • 修复将 LowCardinality 列转换为 Nullable 时结果错误的问题。#96483 (Nihal Z. Miaji).
  • 修复了创建 Iceberg 表时的崩溃问题:ORDER BY 子句引用了不存在的列,或使用了位置参数。已关闭 #93280#96484 (Konstantin Vedernikov).
  • 修复了带有 Nullable 子字段的 Tuple 列触发的运行时过滤器异常。#96509 (Alexey Milovidov) 。
  • 修复了 Parquet V3 原生读取器中的 LOGICAL_ERROR 异常:当用于 PREWHERE 过滤的列包含非布尔 UInt8 值时,会触发该异常。#96594 (Alexey Milovidov) 。
  • 修复了在元数据变更期间复制表中隐式索引重新生成的问题。#96600 (Raúl Marín).
  • 修复了执行 DROP WORKLOAD 时的竞态条件。#96614 (Sergei Trifonov).
  • 修复了 Iceberg 表写入中的一个缺陷:分区插入可能导致数据在各分区文件间分布不正确。#96620 (Konstantin Vedernikov) 。
  • 修复了在带约束的 CREATE TABLE 中出现的 heap-use-after-free 问题。#96669 (Nikita Taranov).
  • 在 bech32 中校验 witness version,以避免缓冲区溢出。#96671 (Raúl Marín) 。
  • 修复在使用无效的 auth_header 设置创建数据湖 REST catalog 时,system.tables 报错的问题。#96680 (Han Fei).
  • 修复在生存时间 (TTL) 合并后,当一个块中的所有行都被过滤掉时,_minmax_count_projection 会使 min(timestamp) 返回纪元 (1970-01-01) 的问题。 #96703 (Raquel Barbadillo).
  • 改进了对 iceberg_metadata_file_path 设置项的校验,以防止路径遍历,并确保指定的元数据文件位于表目录内。#96754 (Daniil Ivanik) 。
  • 修复了在 GROUP BY 中使用 Variant 参数时 ifNull 崩溃的问题。#96790 (Alexey Milovidov).
  • 修复了启用 table_disk=1 设置的表之间发生的缓存键冲突。#96818 (Raufs Dunamalijevs) 。
  • 修复了因竞态条件导致 MemoryWorker 的清理线程卡住的问题。#96819 (Antonio Andelic).
  • 不要在 Iceberg 目录中记录包含凭据的数据。#96831 (Konstantin Vedernikov) 。
  • 修复 clickhouse-client 在发生服务器错误后的退出状态。#96841 (Vitaly Baranov).
  • 使用 CROSS JOIN 且启用并行副本的查询可能会返回错误结果。修复了 #74337#96848 (Igor Nikonov) 。
  • 修复了这样一个问题:如果此前已在同一列上执行过轻量级更新,ALTER TABLE DROP COLUMN 查询会失败。#96861 (Anton Popov).
  • 修复在向 plain_rewritable 对象存储磁盘创建基于归档的备份 (.zip.tzst) 时发生的栈溢出 (崩溃) 问题。#96872 (Alexey Milovidov) 。
  • 修复了当目标端文件系统磁盘已满或发生其他 I/O 错误而导致备份失败时,server 崩溃的问题。#96873 (Alexey Milovidov).
  • 修复了 EXCEPT ALLINTERSECT ALL 忽略行重数、表现得与对应的 DISTINCT 版本相同的问题。#96876 (Alexey Milovidov) 。
  • 修复了使用不兼容类型调用 indexOfAssumeSorted 时触发的 std::terminate 异常 (例如,在 IPv4 数组中使用整数作为搜索值) 。#96877 (Alexey Milovidov) 。
  • 修复了在使用窗口函数且 group_by_use_nulls = 1 并配合 CUBE/ROLLUP/GROUPING SETS 时出现的异常 Bad cast from type DB::ColumnNullable to DB::ColumnString#96878 (Alexey Milovidov) 。
  • 修复了 JIT 已编译表达式将 DateTime 转换为 DateTime64 时结果不正确的问题 (例如,在混用 DateTime 类型的 CASE/if/multiIf 中) 。该值此前被重新解释,而不是按正确标度进行缩放,导致表达式编译生效后生成错误的时间戳。#96879 (Alexey Milovidov).
  • 修复了 CoalescingMergeTree 在跳过索引表达式生成常量列时抛出逻辑错误异常的问题 (例如,对整型列上的 ifNotFinite(1, c0) 使用 bloom_filter) 。#96880 (Alexey Milovidov) 。
  • 修复了在误用 HTTP 连接启用 TLS 的原生协议端口时,错误消息中端口号显示错误的问题。#96881 (Alexey Milovidov) 。
  • 修复了在 CTE 和子查询中,按子查询设置的 SETTINGS 未应用到 file 等表函数上的问题。#96882 (Alexey Milovidov) 。
  • 修复读取 X509 证书时 BIO 对象发生的内存泄漏问题。#96885 (Alexey Milovidov) 。
  • 修复了查询分析器中的 LOGICAL_ERROR 异常:当在应传入具体值的位置传入 lambda 表达式时,会触发该异常 (例如作为 arrayFold 的 accumulator 参数) 。#96892 (Alexey Milovidov) 。
  • 修复对复杂嵌套类型 (Array 中包含 Nullable Tuple,而该 Tuple 又包含带有 Nullable 枚举值的 Map) 进行类型转换时出现的 ColumnNullable is not compatible with original 异常。#96924 (Alexey Milovidov) 。
  • 修复了分片 HASHED 字典并行加载中的一个竞态条件,该问题偶尔会导致某些行未能加载。#96953 (Alexey Milovidov) 。
  • 修复了 REPLACE PARTITION 与后台变更之间的竞态条件,该问题可能导致替换后新旧数据同时可见。#96955 (Alexey Milovidov) 。
  • 修复了 arrayJoin 函数在与 INNER JOIN 和 WHERE 子句一起使用时产生重复行的问题。其原因是部分谓词下推优化错误地将包含 arrayJoin 的过滤器下推到 JOIN 之下。#96989 (Alexey Milovidov).
  • 修复了 clearCaches 中的崩溃 (SEGFAULT) :由于 BlockIO::operator= 未移动 query_metadata_cache,导致已缓存的存储快照被过早销毁,并引发对 MergeTreeData 存储的释放后使用。 #96995 (Alexey Milovidov).
  • 修复了 IfTransformStringsToEnumPass 中的断言失败:当 iftransform 函数返回 Nullable(String) 时会触发该问题 (例如使用 GROUP BY ... WITH CUBEgroup_by_use_nulls = true 时) 。#97002 (Alexey Milovidov) 。
  • 修复了在包含 UNION ALLJOININSERT ... SELECT 中写入错误数据的问题:常量字符串列在块合并后可能会写入错误的值。#97019 (Hasyimi Bahrudin).
  • 修复在 ALTER TABLE MODIFY COLUMN 更改列类型后构建列统计信息时触发的 assert_cast 异常 (或在 release 构建中导致静默数据损坏) 问题。#97027 (Alexey Milovidov).
  • 修复 Azure Blob 存储、SSH 协议和 Arrow Flight 接口中读取未初始化内存的问题。#97053 (Alexey Milovidov).
  • 修复了在带有 ROW POLICY/PREWHERE 和 FINAL 的查询中,索引会对结果产生影响的问题。#97076 (Yarik Briukhovetskyi) 。
  • 修复了 MergeTree 表中 REPLACE PARTITION 与后台变更之间仍然存在的竞态条件,该问题可能导致旧数据重新出现。#97105 (Alexey Milovidov) 。
  • 修复包含别名列的隐式索引,并在创建前执行完整验证。#97115 (Raúl Marín) 。
  • 修复了 FunctionVariantAdaptor 在处理需要常量参数的函数 (如 arrayROCAUC) 时出现的逻辑错误。#97116 (Bharat Nallan) 。
  • 修复以下问题:当 PartCheckThread 为已变更的 part 重新将 GET_PART 入队时,会导致变更卡住,并在 parts_to_do 中留下幽灵条目。#97162 (Alexey Milovidov) 。
  • 修复了带有 ORDER BY ... LIMIT 的子查询在查询计划中的行数估算问题,该问题可能导致优化器选择次优的 JOIN 顺序。#97193 (Alexander Gololobov).
  • 修复了 FunctionVariantAdaptor 中的 LOGICAL_ERROR 异常:当作用于 Variant 列的函数返回 Nothing 类型时,可能会出现该问题;这种情况可能发生在 UNION ALL 查询中的空数组场景下。#97213 (Alexey Milovidov) 。
  • 修复了 S3 多部分复制操作 (例如向 S3 执行 BACKUP/RESTORE 时) 中的数据竞争问题,该问题在并发访问时可能导致异常。#97227 (Azat Khuzhin).
  • 修复了这样一个 LOGICAL_ERROR 异常:当 WHERE 子句中的 arrayJoin 引用 JOIN 两侧的列时会触发该异常。#97239 (Alexey Milovidov).
  • 修复在带有 PREWHERE 的 Tuple 中读取稀疏 Nullable(String).size 子列时触发的 LOGICAL_ERROR 异常。#97264 (Alexey Milovidov) 。
  • 修复在使用 ORDER BY ... LIMIT 从采用非自适应索引粒度 (index_granularity_bytes = 0) 的表读取数据时,LazyMaterializingTransform 中出现的异常 “lazy chunk 中的行数与 offsets 数量不一致”。#97270 (Alexey Milovidov).
  • 修复了一个问题:当因非 ZooKeeper 异常 (例如 memory limit) 导致表重建失败时,SYSTEM RESTART REPLICA 会使该表从数据库中丢失,从而导致 DatabaseReplicated 中的元数据摘要不匹配。#97276 (Alexey Milovidov) 。
  • system.merge_tree_settings 中的 readonly 字段现在会正确显示某些 merge tree 设置 (例如 index_granularity) 为无条件只读。#97277 (Robert Schulze).
  • 修复了在对 MergeTree 表进行 count() 优化时的崩溃问题:当存储快照是在没有数据的情况下创建时,会触发该问题。 #97281 (Pablo Marcos).
  • 修复了在从堆栈跟踪的调试信息中解析函数名时可能发生的崩溃问题。#97294 (Azat Khuzhin) 。
  • 修复 analyzer&#95;compatibility&#95;join&#95;using&#95;top&#95;level&#95;identifier 与 ALIAS 列有关的逻辑错误。关闭 #96228#97297 (Vladimir Cherkasov) 。
  • 修复了在配合 QUALIFY 子句使用带有文本索引的列时,applyOrder 中出现的 LOGICAL_ERROR 异常。#97313 (Alexey Milovidov) 。
  • 系统表 system.functions 现在会将内部函数显示为 categories = 'Internal',而不是 categories = ''#97315 (Robert Schulze) 。
  • 启用并行副本时,包含 RIGHT JOIN 链的查询可能会产生错误结果。修复了 #74341#97316 (Igor Nikonov) 。
  • 修复了在可刷新materialized view 以及其他表被重命名的场景中可能出现的误报 TABLE_UUID_MISMATCH 错误。#97323 (Azat Khuzhin) 。
  • 修复 StorageKeeperMap 备份中的 segfault,原因是在惰性备份批次中对悬空存储指针发生了释放后使用。 #97336 (Alexey Milovidov).
  • 修复了在启用 mutations_execute_subqueries_on_initiator 时,ALTER UPDATE/DELETE 中带有标量子查询的 exists 函数。此前该标量子查询会被错误地求值,可能导致报错,或生成损坏的变更命令,从而使表在下次服务器重启时无法加载。#97347 (Kirill Kopnev).
  • 修复了在将 NULL 与包含 LowCardinality 类型的 Variant 列比较时出现的逻辑异常 Unexpected return type from equals. Expected Nullable(UInt8). Got Const(LowCardinality(Nullable(UInt8)))#97379 (Alexey Milovidov).
  • 修复了在启用分片查询缓存时并行执行 EXCHANGE TABLES 可能引发的竞态条件。#97411 (Konstantin Vedernikov) 。
  • 修复了 Array 到 QBit 转换中的 LOGICAL_ERROR 异常:当外层 Tuple 包装器中的 nullable_source 以不匹配的列类型替换已转换的数组列时,会触发该异常。关闭 #97389#97413 (Alexey Milovidov) 。
  • 修复括号内带别名的元组字面量在 AST 格式化往返时出现的不一致问题。例如,(('a', 'b') AS x) 之前会被错误地重新格式化为 tuple(('a', 'b') AS x)#97418 (Alexey Milovidov).
  • 修复了在启用去重的异步插入过程中,因解析失败生成零行空块时引发的异常。 #97460 (Sema Checherinda).
  • 修复在使用 ORDER BY ... LIMIT 从采用非自适应索引粒度 (index_granularity_bytes = 0) 的表读取数据时,LazyMaterializingTransform 中出现的异常 “lazy chunk 中的行数与 offsets 数量不匹配”。 #97482 (Alexey Milovidov).
  • 修复向 Iceberg 插入数据的相关设置问题。为 allow_experimental_insert_into_iceberg 设置添加别名。#97483 (Konstantin Vedernikov) 。
  • 修复了一个问题:当 optimize_inverse_dictionary_lookup 优化重写 dictGet(...) 谓词时,没有 CREATE TEMPORARY TABLE 权限的用户会收到 ACCESS_DENIED。ClickHouse 现在会跳过该重写,执行原始表达式。关闭 #97269#97484 (Nihal Z. Miaji) 。
  • 修复了 SetMergeTreeIndexSet 在处理包含内部稀疏子列的列时触发的断言失败问题 (在 debug/sanitizer 构建中表现为异常) ,例如来自具有不同稀疏序列化 profile 的 MergeTree parts 的 Tuple 列。#97493 (Alexey Milovidov).
  • 修复了 StorageKafka2 中一个可能的释放后使用 (use-after-free) 问题。#97520 (Bharat Nallan).
  • 修复当输出路径包含目录时,INTO OUTFILETRUNCATEinto_outfile_create_parent_directories 设置配合使用时的问题。#97549 (Alexey Milovidov) 。
  • 修复了在启用 analyzer 时,通过 merge() 表函数查询其 ALIAS 列中包含 lambda 表达式的表时出现的 BAD_ARGUMENTS 错误。#97551 (Alexey Milovidov) 。
  • 修复 Keeper zxid 为 0 时 system.zookeeper_info 抛出异常的问题。#97553 (Alexey Milovidov) 。
  • 修复了 ip_trie 字典在键类型不是 String 时可能存在的逻辑错误。#97555 (Bharat Nallan).
  • 修复了基础 RestCatalog 的 REST catalog OAuth 身份验证失效的问题 (此前仅对 OneLakeCatalog 等派生 catalog 生效) 。这导致在引入 BigLake catalog 后,默认 REST catalog 无法正常工作。 #97561 (Konstantin Vedernikov).
  • Geometry 函数 (perimeterSphericalareaSpherical 等) 现在除了 Geometry Variant 类型外,也接受单独的几何子类型 (PolygonRingPoint 等) 。#97571 (Alexey Milovidov) 。
  • 修复了在对 Nullable(Tuple(... Nullable(T) ...)) 类型的子列使用 isNull/isNotNull 时触发的 LOGICAL_ERROR 异常。关闭 #97224#97582 (Alexey Milovidov) 。
  • 修复了在轻量级更新期间应用补丁分区片段时的空指针解引用问题。#97583 (Alexey Milovidov).
  • BaseSettings::readBinaryaccessor.find 返回的索引直接传给 field_infos[],但没有检查“未找到”的哨兵值 (即 -1) ,这可能导致 std::vector 越界访问。这个问题得益于 libcxx 的加固机制才被发现。它很可能发生在查询计划反序列化期间:较新的服务器向较旧的服务器发送了后者无法识别的 setting。基于字符串的读取方法已经正确处理了这种情况;readBinary 则缺少同样的检查。#97585 (Miсhael Stetsyuk).
  • 修复了 UNION ALL 查询在某个分支的谓词恒为假时返回错误结果的问题——该分支本应不返回任何内容,却会错误地读取数据。#97620 (Bharat Nallan).
  • 修复了 IN (col) 在仅引用单个列时会失败并报 UNSUPPORTED_METHOD 错误的问题。#97646 (Alexey Milovidov) 。
  • 修复了在 GROUP BY ... WITH ROLLUP/CUBE 期间,当键在 Nullable(Tuple(...)) 内包含 LowCardinality(Nullable(...)) 时出现的逻辑错误异常。#97647 (Alexey Milovidov) 。
  • 修复了 NOT (1, 1, 1) 的 AST 格式化不一致问题,该问题可能会在调试构建中触发 LOGICAL_ERROR#97653 (Alexey Milovidov) 。
  • 修复 keeper-converter 在遇到空的 ZooKeeper 事务日志文件时发生异常的问题。 #97673 (Alexey Milovidov).

构建/测试/打包改进

  • ClickHouse 现已可使用 clang-23 (master) 构建。#95578 (Alexey Milovidov).
  • 修复:当配置了 bind_host 时,强制将 is_local 设为 false,并改为使用集成测试。对 #74741 的后续跟进。#93109 #96018 (Zhigao Hong) 。
  • 压力测试:修复 CI 中的压力测试和升级测试;忽略 no-{build} 标签;增加兼容性随机化。#94693 (Nikita Fomichev) 。
  • 从构建产物中发布 parser_memory_profiler 二进制文件。该工具可用于分析 AST 的内存占用。#95826 (Ilya Yatsishin).
  • parser_memory_profiler 工具新增 --symbolize 标志,使其在结果中生成包含已解析符号的 .heap.sym 文件。#96477 (Ilya Yatsishin).
  • 将集成测试中使用的第三方 Docker 镜像固定为特定版本。#96500 (Alexey Milovidov).
  • 恢复了对 OpenSSL 进行动态链接的能力。不建议这样做,而且任何生产构建都不会使用它,但互联网上的爱好者仍然可以使用这个选项。#96506 (Govind R Nair).
  • 通过为 Coordination::OpNum 进行按类型特化,将 magic_enum 的范围从 [-100, 1000] 缩小到默认的 [-128, 127],从而缩短构建时间。#96632 (Alexey Milovidov).
  • 从 Function 类中移除不必要的 C++ 模板,以减少构建时间。#96646 (Alexey Milovidov) 。
  • StorageSystemLicenses 的生成提前到配置时,以提升构建并行度。#96697 (Alexey Milovidov) 。
  • 将许可证扫描并行化。#96727 (Raúl Marín) 。
  • 新增支持 SSH 协议的无状态功能测试。#96996 (Alexey Milovidov).
  • 在无状态功能测试基础设施中新增 Kafka 3.9.0,使得可以使用 ClickHouse Keeper 充当 ZooKeeper,直接测试 Kafka 和 Kafka2 表引擎。六个新的无状态测试涵盖基础的生产/消费、虚拟列、INSERT、多种格式、损坏消息处理,以及基于 Keeper 的偏移量存储。#96997 (Alexey Milovidov) 。
  • 新增一个 CI 工作流,用于构建经 PGO+BOLT 优化的 clang 工具链。#96991 (Alexey Milovidov) 。
  • 在 CI 中使用经过 PGO 优化的 LLVM/Clang 构建,可将构建速度提高 20..30%。 #97031 (Alexey Milovidov).
  • 用 llvm-libc 的实现替换 glibc 中的数学函数。 #90151 (Konstantin Bogdanov).
  • 将 Boost 从 1.83 升级到 1.90,修复了调试构建中 devector 断言失败的问题。#97037 (Alexey Milovidov) 。
  • postgres 升级到 REL_18_1。#95189 (Konstantin Bogdanov) 。
  • 改用 libexpat 2.7.3。#95218 (Konstantin Bogdanov) 。
  • 使用 OpenSSL 3.5.5。 #95345 (Konstantin Bogdanov) 。
  • 使用 simdjson v4.2.4。#97129 (Konstantin Bogdanov) 。
  • 升级到 libarchive 3.8.5。#97131 (Konstantin Bogdanov) 。
  • 使用 fast_float v8.2.3。 #97133 (Konstantin Bogdanov) 。
  • 使用 abseil-cpp 20260107.1,并将 s2geometry 升级至 v0.13.1。#97134 (Konstantin Bogdanov) 。
  • libxml2 更新至 2.15.1。 #95574 (Robert Schulze).
  • 将 7 个 Tier-3 集成测试 Docker 镜像所用的、已停止支持或已移除的基础镜像升级到了当前受支持的版本。#97314 (Rahul) 。
  • 新增 TPC-DS 基准测试查询。#97349 (Raufs Dunamalijevs) 。
  • 将各个单独的 x86 指令集 CMake 选项 (ENABLE_SSSE3ENABLE_AVX2NO_SSE3_OR_HIGHERARCH_NATIVE 等) 替换为一个数值型 X86_ARCH_LEVEL 选项 (1/2/3/4) ,与运行时分发系统已采用的标准 x86-64 微架构级别保持一致。#97354 (Raúl Marín) 。
  • 避免在 FunctionBinaryArithmetic 中为非除法操作实例化 division_by_nullable=true 的模板变体,从而缩短编译时间并减小二进制文件体积。#97496 (Raúl Marín) 。
  • 通过将 Exception.htypeid_cast.hassert_cast.hContext_fwd.hIDataType.h 以及各类 Column 头文件中移除,缩小 Exception.h 的包含范围。#97497 (Raúl Marín).
  • 始终使用随附的 compiler-rt 头文件 (sanitizer 和 XRay 接口) ,而不要使用宿主编译器的头文件,并且默认从源码构建 compiler-rt 库。#97499 (Raúl Marín) 。
  • 在具备足够 long double 支持的平台上,避免在 wide_integer_impl.h 中包含 boost/multiprecision 头文件,以缩短构建时间。#96633 (Alexey Milovidov).
  • 实现 LLVM 代码覆盖率任务,并先在 master 分支上启用。#90952 (Alexey Bakharew) 。
  • 为正式版构建启用快速 libcxx 加固。这主要用于越界检查。根据性能测试结果,预计不会对性能产生明显影响。#94757 (Miсhael Stetsyuk) 。

ClickHouse 26.1 版本发布,2026-01-29。 演示文稿, 视频

向后不兼容的变更

  • 修复了因在格式说明符中错误替换别名而导致的格式不一致问题。此项更改关闭了 #82833。此项更改关闭了 #82832。此项更改关闭了 #68296。此项更改可能会带来向后不兼容:当 analyzer 被禁用时,某些在 IN 中引用别名的 CREATE VIEW 查询将无法处理。为避免这种不兼容,请启用 analyzer (自 24.3 起默认已启用) 。#82838 (Alexey Milovidov).
  • 编解码器 DEFLATE_QPLZSTD_QAT 已移除。建议用户在升级前,将现有使用 DEFLATE_QPLZSTD_QAT 压缩的数据转换为使用其他编解码器压缩。请注意,要使用这些编解码器,必须启用设置 enable_deflate_qpl_codecenable_zstd_qat_codec#92150 (Robert Schulze) 。
  • 通过在 system.query_log.exception 中启用 stderr 捕获,改进了 UDF 调试体验。此前,UDF 的 stderr 只会记录到文件中,不会显示在查询日志里,因此几乎无法调试。现在,stderr 默认会触发异常,并且会在抛出前完整收集 (最多 1MB) ,因此完整的 Python 回溯信息和错误消息都会出现在 system.query_log.exception 中,从而便于故障排查。#92209 (Xu Jia).
  • JOIN USING () 子句中的空列列表现在会被视为语法错误。此前,它原本应在查询执行期间报为 INVALID_JOIN_ON_EXPRESSION。在某些情况下,例如与 Join 存储进行连接时,还会导致 LOGICAL_ERROR,修复 #82502#92371 (Vladimir Cherkasov) 。
  • 默认在 JSON 类型中对 SKIP REGEXP 使用部分匹配。解决了 #79250#92847 (Pavel Kruglov) 。
  • 撤销“允许向简单 ALIAS 列执行 INSERT” (回退了 ClickHouse/ClickHouse#84154) 。它无法与自定义格式配合使用,也没有任何设置项加以保护。#92849 (Azat Khuzhin) 。
  • 新增一项设置:当数据湖目录无法访问对象存储时抛出错误。#93606 (Konstantin Vedernikov) 。
  • Lazy 数据库引擎已移除,不再可用。已关闭 #91231#93627 (Alexey Milovidov) 。
  • 移除 metric_logtransposed_with_wide_view 模式——由于存在缺陷,该模式不可用。现在已无法再以此模式定义 system.metric_log。这部分回退了 #78412 中的更改。#93867 (Alexey Milovidov) 。
  • 工作负载的 CPU 调度现已默认采用抢占式。参见 cpu_slot_preemption 服务器级设置。#94060 (Sergei Trifonov).
  • 对索引文件名进行转义,以避免 parts 损坏。此更改后,ClickHouse 将无法加载由旧版本创建、名称中包含非 ASCII 字符的索引。要处理这个问题,你可以使用 MergeTree 设置 escape_index_filenames#94079 (Raúl Marín) 。
  • 格式设置 exact_rows_before_limitrows_before_aggregationcross_to_inner_join_rewriteregexp_dict_allow_hyperscanregexp_dict_flag_case_insensitiveregexp_dict_flag_dotalldictionary_use_async_executor 现已改为普通设置 (非格式设置) 。这是一项纯内部变更,除非你在 Iceberg、DeltaLake、Kafka、S3、S3Queue、Azure、Hive、RabbitMQ、Set、FileLog 或 NATS 表引擎定义中指定了这些设置 (这种情况不太可能发生) ,否则不会产生用户可见的副作用。在这些情况下,这些设置以前会被忽略,而现在此类定义会报错。#94106 (Robert Schulze).
  • joinGet/joinGetOrNull 函数现在会对底层 Join 表强制检查 SELECT 权限。此变更后,执行 joinGet('db.table', 'column', key) 时,用户必须同时拥有 Join 表中定义的键列以及要获取的 attribute 列的 SELECT 权限。缺少这些权限的查询将因 ACCESS_DENIED 而失败。迁移时,可使用 GRANT SELECT ON db.join_table TO user 授予整表访问所需的授权;或使用 GRANT SELECT(key_col, attr_col) ON db.join_table TO user 授予列级访问权限。此变更会影响所有依赖 joinGet/joinGetOrNull 且此前未显式配置 SELECT 授权的用户和应用程序。#94307 (Vladimir Cherkasov) 。
  • CREATE TABLE ... AS ... 查询检查 SHOW COLUMNS。此前检查的是 SHOW TABLES,但对这类权限检查而言,这并不是正确的 grant。 #94556 (pufit).
  • 使 Hash 输出格式不再依赖块大小。#94503 (Alexey Milovidov) 。请注意,与之前的版本相比,这会改变输出的哈希值。

新特性

  • ClickHouse Keeper 的 HTTP API 和内嵌 Web UI。 #78181 (pufitspeeedmaster) 。
  • 异步插入去重现在可用于带有依赖 materialized view 的场景。当发生 block_id 冲突时,系统会先过滤原始块,移除与该 block_id 相关的行,再通过所有相关 materialized view 的 SELECT 查询转换剩余行,从而重建不含冲突行的原始块。#89140 (Sema Checherinda)。当涉及 materialized view 时,现在允许将去重与异步插入结合使用。#93957 (Sema Checherinda)。
  • 引入了新的语法和框架,用于简化并扩展投影索引功能。这是对 https://github.com/ClickHouse/ClickHouse/pull/81021 的后续完善。#91844 (Amos Bird) 。
  • 新增对 Array 列的文本索引支持。#89895 (Jimmy Aguilar Mena) 。
  • 默认启用 use_variant_as_common_type,这样你就可以在 Array 中、在 UNION 查询中,以及在 if/multiIf/case 的分支中使用不兼容的类型。#90677 (Alexey Milovidov) 。
  • 新增系统表 zookeeper_info。实现 #88014#90809 (Smita Kulkarni) 。
  • 所有函数现已支持 Variant 类型。#90900 (Bharat Nallan) 。
  • 向 Prometheus 的 /metrics 端点添加了 ClickHouse_Info 指标,其中主要包含版本信息,因此可以构建图表来跟踪详细版本信息随时间推移的变化。#91125 (Christoph Wurm) 。
  • 为 keeper 新增了一个四字母命令 rcfg,可用于更改集群配置。与标准的 reconfigure 请求相比,该命令在配置变更方面提供了更广泛的能力。该命令接受 json 字符串作为参数。发送到 TCP 接口的完整字节序列应如下所示:rcfg{json_string_length_big_endian}{json_string}。该命令的一些示例如下:{"preconditions": {"leaders": [1, 2], "members": [1, 2, 3, 4, 5]}, "actions": [{"transfer_leadership": [3]}, {"remove_members": [1, 2]}, {"set_priority": [{"id": 4, "priority": 100}, {"id": 5, "priority": 100}]}, {"transfer_leadership": [4, 5]}, {"set_priority": [{"id": 3, "priority": 0}]}]}#91354 (alesapin) 。
  • 新增函数 reverseBySeparator,用于将字符串中按指定分隔符分隔的各个子字符串顺序反转。解决 #91463#91780 (Xuewei Wang) 。
  • 新增设置 max_insert_block_size_bytes,可更细致地控制插入块的形成方式。#92833 (Kirill Kopnev) 。
  • 如果启用了 ignore_on_cluster_for_replicated_database 设置,则可对 Replicated 数据库执行带有 ON CLUSTER 子句的 DDL 查询。在这种情况下,将忽略集群名称。#92872 (Kirill) 。
  • 新增 mergeTreeAnalyzeIndexes 函数。#92954 (Azat Khuzhin) 。
  • 新增设置 use_primary_key。将其设为 false,以禁用基于主键的粒度剪枝。#93319 (Nihal Z. Miaji).
  • 新增了 icebergLocalCluster 表函数。#93323 (Anton Ivashkin) 。
  • 新增了 cosineDistanceTransposed 函数,可近似计算两点之间的余弦距离#93621 (Raufs Dunamalijevs) 。
  • 为 system.parts 表新增 files 列,用于显示每个数据分区片段中的文件数量。#94337 (Match) 。
  • 新增了一个用于并发控制的 max-min fair 调度器。在高超额订阅场景下 (即大量查询竞争有限的 CPU 插槽时) ,可提供更好的公平性。短时运行的查询不会因为长期运行、且随着时间推移占用更多插槽的查询而受到影响。可通过将 concurrent_threads_scheduler 服务器设置设为 max_min_fair 来启用。#94732 (Sergei Trifonov) 。
  • 支持 ClickHouse client 在连接到服务器时覆盖 TLS SNI。#89761 (Matt Klein) 。
  • 支持在 joinGet 函数调用中使用临时表。#92973 (Eduard Karacharov) 。
  • DeltaLake 表引擎现已支持删除向量。#93852 (Kseniia Sumarokova) 。
  • deltaLakeCluster 增加对删除向量的支持。#94365 (Kseniia Sumarokova) 。
  • 支持 Google 云存储数据湖。#93866 (Konstantin Vedernikov) 。

Experimental 功能

性能提升

  • 设置 use_skip_indexes_on_data_read 现已默认启用。该设置支持在读取数据的同时以流式方式进行过滤,从而提升查询性能并缩短启动时间。#93407 (Shankar Iyer) 。
  • 提升 LowCardinality 列上 DISTINCT 的性能。关闭 #5917#91639 (Nihal Z. Miaji) 。
  • 优化 distinctJSONPaths 聚合函数,使其仅从数据分区片段中读取 JSON 路径,而非整个 JSON 列。#92196 (Pavel Kruglov) 。
  • 更多过滤器可下推到 JOIN 中。 #85556 (Nikita Taranov).
  • 当过滤器只使用一侧输入时,支持更多将 JOIN ON 条件下推的场景。支持 ANYSEMIANTI JOIN。#92584 (Dmitry Novik) 。
  • 允许使用等价集合将过滤器下推到 SEMI JOIN。已关闭 #85239#92837 (Dmitry Novik).
  • 当右侧为空时,跳过读取 hash join 的左侧。此前,我们会一直读取左侧,直到遇到第一个非空块;而在过滤或聚合开销较大的情况下,这可能会导致大量额外工作。#94062 (Alexander Gololobov).
  • 在查询管道中使用 “fastrange” (Daniel Lemire) 方法对数据进行分区。这有望提升并行排序和 JOIN 的性能。#93080 (Alexey Milovidov) 。
  • 当 PARTITION BY 与排序键一致或为其前缀时,窗口函数性能得到提升。#87299 (Nikita Taranov) 。
  • 外层过滤器可下推到视图中,从而能够在本地和远程节点上应用 PREWHERE。已解决 #88189#88316 (Igor Nikonov) 。
  • 为更多函数实现了 JIT 编译。关闭 #73509#88770 (Alexey MilovidovTaiyang Li) 。
  • 如果在 FINAL 查询中使用的跳过索引位于主键列上,那么就无需再额外检查其他 parts 中的主键交集,现已不再执行该步骤。解决了 #85897#93899 (Shankar Iyer) 。
  • 优化对小数 LIMITOFFSET 的性能及内存占用。#91167 (Ahmed Gouda).
  • 修复 Parquet Reader V3 预取器未使用更快随机读取逻辑的问题。关闭 #90890#91435 (Arsen Muk) 。
  • 提升 icebergCluster 性能。关闭 #91462#91537 (Yang Jiang) 。
  • 不要在常量过滤条件中按虚拟列进行过滤。#91588 (c-end) 。
  • 通过启用自适应写入缓冲区,利用 wide parts 降低超宽表在 INSERT/merges 时的内存占用。新增对加密磁盘的自适应写入缓冲区支持。#92250 (Azat Khuzhin).
  • 通过减少索引中需要搜索的标记数量,提升了使用文本索引和 sparseGrams 分词器进行全文检索的性能。#93078 (Anton Popov) 。
  • 函数 isValidASCII 已针对返回正向结果的情况进行了优化,即输入值全部为 ASCII 时。#93347 (Robert Schulze) 。
  • 现在,按序读取优化已能够识别因 WHERE 条件而变为常量的 ORDER BY 列,从而实现高效的逆序读取。这让多租户查询 (如 WHERE tenant='42' ORDER BY tenant, event_time DESC) 也能从中受益,因为它们现在可以使用 InReverseOrder,而无需再进行完整排序。”. #94103 (matanper).
  • 引入一个专门的 Enum AST 类,以 (string, integer) 成对形式存储值参数,替代 ASTLiteral 子节点,从而优化内存占用。#94178 (Ilya Yatsishin) 。
  • 支持在多个副本上执行分布式索引分析。对于共享存储场景以及集群中的海量数据尤为有利。该功能适用于 SharedMergeTree (ClickHouse Cloud) ,也可能适用于共享存储上的其他 MergeTree 表类型。#86786 (Azat Khuzhin) 。
  • 在以下情况下禁用 join 运行时过滤器,以降低开销:- bloom filter 中置位过多 - 运行时被过滤掉的行过少。#91578 (Alexander Gololobov) 。
  • 对关联子查询的输入使用内存缓冲区,以避免被多次求值。属于 #79890 的一部分。#91205 (Dmitry Novik).
  • 允许所有副本在并行副本读取期间并行接管孤立范围。这有助于改善负载均衡并降低长尾延迟。#91374 (zoomxi).
  • 外部聚合/排序/连接现在会在所有上下文中遵循查询设置 temporary_files_codec。修复了 grace hash join 缺少 profile events 的问题。#92388 (Vladimir Cherkasov) 。
  • 提升了在聚合/排序过程中对落盘场景下查询内存使用情况检测的稳健性。#92500 (Azat Khuzhin) 。
  • 估算聚合键列的总行数以及 NDV (不同值数量) 统计信息。#92812 (Alexander Gololobov) 。
  • 利用 simdcomp 优化倒排列表压缩。#92871 (Peng Jian) 。
  • 使用桶机制重构 S3Queue 的 ordered 模式处理流程。这也应提升性能,减少 Keeper 请求次数。#92889 (Kseniia Sumarokova) 。
  • 函数 mapContainsKeyLikemapContainsValueLike 现在可分别利用 mapKeys()mapValues() 上的文本索引。#93049 (Michael Jarrett) 。
  • 降低非 Linux 系统上的内存占用 (启用 jemalloc 脏页的即时清理) 。#93360 (Eduard Karacharov).
  • 当脏页大小占 max_server_memory_usage 的比例超过 memory_worker_purge_dirty_pages_threshold_ratio 时,强制清理 jemalloc arena。 #93500 (Eduard Karacharov).
  • 减少 AST 的内存占用。#93601 (Nikolai Kochetov) 。
  • 在某些情况下,我们发现 ClickHouse 在从表中读取数据时不会遵守内存限制。此问题已修复。#93715 (Nikita Mikhaylov) 。
  • 默认启用 CHECK_STATTRY_REMOVE 这两个 Keeper 扩展。#93886 (Mikhail Artemenko) 。
  • 解析 Iceberg manifest 文件条目中与位置删除对应的文件名上下界,以便更准确地筛选相应的数据文件。#93980 (Daniil Ivanik).
  • 新增两个设置,用于控制 JSON 列中动态子列的最大数量。第一个是 MergeTree 设置 merge_max_dynamic_subcolumns_in_compact_part (类似于已添加的 merge_max_dynamic_subcolumns_in_wide_part) ,用于限制合并到 Compact 分片时创建的动态子列数量。第二个是查询级设置 max_dynamic_subcolumns_in_json_type_parsing,用于限制解析 JSON 数据时创建的动态子列数量,从而支持在 insert 时指定该限制。#94184 (Pavel Kruglov) 。
  • 在某些情况下,对 JSON 列的压缩合并进行了小幅优化。 #94247 (Pavel Kruglov).
  • 根据生产环境中的实践经验,下调线程池队列大小。在从 MergeTree 读取任何数据之前,增加显式的内存占用检查。#94692 (Nikita Mikhaylov) 。
  • 确保调度器在 CPU 资源严重不足时优先调度 MemoryWorker 线程,因为这可以保护 ClickHouse 进程免受致命威胁。#94864 (Nikita Mikhaylov) 。
  • 将 jemalloc 脏页的清理放到独立于 MemoryWorker 主线程的其他线程中执行。如果清理速度较慢,可能会延迟 RSS 使用量的更新,从而导致进程因内存不足而被杀死。引入新的 config memory_worker_purge_total_memory_threshold_ratio,根据总内存使用量的比例开始清理脏页。#94902 (Antonio Andelic) 。

改进

  • 现已支持在 Azure Blob 存储中使用 system.blob_storage_log#93105 (Alexey Milovidov) 。
  • 为 Local 和 HDFS 实现 blob_storage_log。修复了 S3Queueblob_storage_log 中记录日志时未使用磁盘名称而导致的错误。为 blob_storage_log 添加 error_code 列。拆分测试配置文件,以简化本地测试。#93106 (Alexey Milovidov).
  • clickhouse-clientclickhouse-local 现在会在输入时高亮数字字面量中的数字分组 (千位、百万位等) 。此更改解决了 #93100#93108 (Alexey Milovidov) 。
  • clickhouse-client 增加了对命令行参数中等号前后带空格写法的支持。已关闭 #93077#93174 (Cole Smith) 。
  • 启用 <interactive_history_legacy_keymap>true</interactive_history_legacy_keymap> 后,CLI client 现在可以像以前一样使用 Ctrl-R 进行常规搜索,同时 Ctrl-T 用于模糊搜索。#87785 (Larry Snizek).
  • 用于清除缓存的语句 SYSTEM DROP [...] CACHE 容易让人误以为该语句会禁用缓存。ClickHouse 现已支持语句 SYSTEM CLEAR [...] CACHE,含义更直观。旧语法仍然可用。#93727 (Pranav Tiwari) 。
  • 支持在 EmbeddedRocksDB 中使用多列作为主键。已关闭 #32819#33917 (usurai) 。
  • 现在支持对标量使用非常量 IN (例如 val1 NOT IN if(cond, val2, val3) 这样的查询) 。#93495 (Yarik Briukhovetskyi) 。
  • 防止将 x-amz-server-side-encryption 请求头传递到 HeadObjectUploadPartCompleteMultipartUpload 的 S3 请求中,因为这些请求不支持该请求头。#64577 (Francisco J. Jurado Moreno).
  • 为 S3Queue 的 ordered 模式添加对 Hive 分区的跟踪支持。解决了 #71161#81040 (Anton Ivashkin) 。
  • 优化文件系统缓存中的空间预留。FileCache::collectCandidatesForEviction 将在不加 unique lock 的情况下执行。#82764 (Kseniia Sumarokova) 。
  • 支持服务器日志的组合轮换策略 (大小 + 时间) 。#87620 (Jianmei Zhang).
  • CLI 客户端现在可指定 <warnings>false</warnings>,无需再使用命令行参数 --no-warnings#87783 (Larry Snizek).
  • 新增了对 avg 聚合函数的支持,可将 Date、日期时间和 Time 值用作参数。解决了 #82267#87845 (Yarik Briukhovetskyi).
  • 优化项 use_join_disjunctions_push_down 默认处于启用状态。#89313 (Alexey Milovidov) 。
  • 关联子查询现已支持更多表引擎和数据源类型。关闭了 #80775#90175 (Dmitry Novik).
  • 如果显式指定了参数化视图的 schema,则会显示该 schema。已关闭 #88875#81385#90220 (Grigorii Sokolik) 。
  • 如果日志早于最后一个已提交索引,能够正确处理 Keeper 日志条目中的空缺。#90403 (Antonio Andelic) 。
  • 改进 min_free_disk_bytes_to_perform_insert 设置,使其在 JBOD 卷上也能正常工作。#90878 (Aleksandr Musorin) 。
  • 现在可以在用于 S3 表引擎和 s3 表函数的 named collections 中指定 storage_class_name 设置。#91926 (János Benjamin Antal) 。
  • 支持通过 system.zookeeper 向辅助 ZooKeeper 插入数据。#92092 (RinChanNOW).
  • 为 Keeper 新增以下指标:KeeperChangelogWrittenBytesKeeperChangelogFileSyncMicrosecondsKeeperSnapshotWrittenBytesKeeperSnapshotFileSyncMicroseconds profile events,以及 KeeperBatchSizeElementsKeeperBatchSizeBytes 直方图指标。#92149 (Miсhael Stetsyuk) 。
  • 新增设置 trace_profile_events_list,将 trace_profile_event 的 tracing 限定为指定的事件名称列表,从而能够在大型工作负载上更精确地收集数据。#92298 (Alexey Milovidov).
  • 支持可暂停 failpoint 的 SYSTEM NOTIFY FAILPOINT。- 支持 SYSTEM WAIT FAILPOINT fp PAUSE/RESUME。#92368 (Shaohua Wang) 。
  • system.data_skipping_indices 新增 creation (隐式/显式) 列。#92378 (Raúl Marín) 。
  • 允许将 YTsaurus dyn tables 的列描述传递给字典源。#92391 (MikhailBurdukov) 。
  • #63985 中,我们实现了可按端口分别指定 TLS 配置所需的全部参数 (参见可组合协议) ,因此不再依赖全局 TLS 配置。不过,当前实现仍会隐式要求存在全局 openSSL.server 配置节,这与不同端口需要不同 TLS 配置的场景存在冲突。比如,在 keeper-in-server 部署中,我们需要为 keeper 之间的通信和 clickhouse client 连接分别配置独立的 TLS。#92457 (Miсhael Stetsyuk).
  • 引入新设置 input_format_binary_max_type_complexity,用于限制以二进制格式解码的类型节点总数,以防止恶意载荷。#92519 (Raufs Dunamalijevs) 。
  • system.background_schedule_pool{,_log} 中体现正在运行的任务。补充文档。#92587 (Azat Khuzhin) 。
  • 如果在客户端的 Ctrl+R 搜索中未找到匹配的历史记录,就执行当前查询。#92749 (Azat Khuzhin) 。
  • 支持将 EXPLAIN indices = 1 用作 EXPLAIN indexes = 1 的别名。关闭了 #92483#92774 (Pranav Tiwari).
  • Parquet 读取器现已支持将 Tuple 或 Map 列按 JSON 读取:select x from file(f.parquet, auto, 'x JSON') 即使 f.parquet 中的列 x 类型为 tuple 或 map,也能正常工作。#92864 (Michael Kolupaev) 。
  • 支持 Parquet reader 处理空元组。#92868 (Michael Kolupaev) 。
  • 当原生复制因 BadRequest 失败时 (例如块列表无效) ,会回退为对 Azure Blob 存储执行读写复制。此前,只有在将 blob 复制到不同存储账户时遇到 Unauthorized 错误,才会执行这种回退。但我们有时也会遇到“指定的块列表无效”错误。因此,现在已更新条件:只要原生复制失败,都会回退到读写方式。#92888 (Smita Kulkarni).
  • 修复了在使用 EC2 实例 profile 凭证运行大量并发 S3 查询时,EC2 metadata 端点遭到限流的问题。此前,每个查询都会各自创建一个 AWSInstanceProfileCredentialsProvider,从而并发请求 EC2 metadata 服务,这可能导致超时和 HTTP response code: 403 错误。现在,凭证提供商会被缓存,并在所有查询间共享。#92891 (Sav).
  • 调整 insert_select_deduplicate 设置,新增保持向后兼容的能力。#92951 (Sema Checherinda) 。
  • 将慢于平均水平的后台任务记入日志 (background_schedule_pool_log.duration_threshold_milliseconds=30) ,以避免记录过多任务日志。#92965 (Azat Khuzhin) 。
  • 在早期版本中,system.trace_logsystem.symbols 中部分 C++ 函数名显示不正确 (“mangled”) ,而且 demangle 函数也无法很好地处理这些名称。关闭 #93074#93075 (Alexey Milovidov) 。
  • 引入了 backup_data_from_refreshable_materialized_view_targets 备份设置,用于跳过可刷新materialized views 目标表数据的备份。采用 APPEND 刷新策略的 RMV 始终会被备份。 #93076 (Julia Kartseva). #93658 (Julia Kartseva)
  • 对于较大的编译单元 (如函数) ,使用最少的调试信息,而不是完全禁用调试信息。#93079 (Alexey Milovidov).
  • 通过为 MinIO 特有错误实现错误码映射,AWS S3 C++ SDK 现已增加对 MinIO 的兼容性支持。此变更使 ClickHouse 在使用 MinIO 部署而非 AWS S3 时,能够正确处理并重试 MinIO 服务器错误,从而提升在 self-hosted MinIO 集群上运行对象存储的用户的可靠性。#93082 (XiaoBinMu).
  • 写入带符号信息的 jemalloc 配置文件 (生成堆内存剖析时无需二进制可执行文件) 。#93099 (Azat Khuzhin) 。
  • 恢复 clickhouse git-import 工具——此前它在处理过大或无效的提交时会失效。参见 https://presentations.clickhouse.com/2020-matemarketing/。 #93202 (Alexey Milovidov).
  • 不要在查询日志中显示 URL 存储中的密码。#93245 (Konstantin Vedernikov) 。
  • flipCoordinates 新增对 Geometry 类型的支持。#93303 (Bharat Nallan) 。
  • 改进 SYSTEM INSTRUMENT ADD/REMOVE 的用户体验:对函数名使用 String 字面量,修正所有匹配的函数,并允许在 REMOVE 中使用 function_name。#93345 (Pablo Marcos) 。
  • 新增设置 materialize_statistics_on_merge,用于在 merge 期间启用/禁用统计信息物化。默认值为 1#93379 (Han Fei) 。
  • ClickHouse 现在可以解析 DESCRIBE SELECT 查询中不带括号的 SELECT。修复了 #58382#93429 (Yarik Briukhovetskyi) 。
  • 为缓存正确性检查增加了按概率随机执行的机制。#93439 (Kseniia Sumarokova) 。
  • 新增设置 type_json_allow_duplicated_key_with_literal_and_nested_object,允许 JSON 中出现重复路径,其中一个为字面量,另一个为嵌套对象,例如 {"a" : 42, "a" : {"b" : 42}}。在 https://github.com/ClickHouse/ClickHouse/pull/79317 中引入这一重复路径限制之前,某些数据可能已经创建;现在若继续操作这些数据,可能会导致错误。启用此设置后,这类旧数据仍可继续使用而不会报错。#93604 (Pavel Kruglov).
  • 不要在 Pretty JSON 中将简单类型的值单独打印成一行。#93836 (Pavel Kruglov) 。
  • 当存在大量 alter table ... modify setting ... 语句时,可能会在 5 秒内无法获取锁。与其返回 logical error,不如返回 timeout#93856 (Han Fei) 。
  • 防止在出现语法错误时输出过多内容。此前,它会输出整个 SQL 脚本,其中可能包含大量查询。#93876 (Alexey Milovidov) 。
  • 在 Keeper 中,正确计算带统计信息的 check 请求的字节大小。#93907 (Mikhail Artemenko).
  • 新增 use_hash_table_stats_for_join_reordering 设置,用于控制在 join 重排序时是否使用运行时哈希表大小统计信息。该设置默认启用,因此会保留 collect_hash_table_stats_during_joins 的现有行为。#93912 (Vladimir Cherkasov) 。
  • 现在,用户可以在 system.server_settings 表中部分查看嵌套的全局服务器设置 (例如 logger.level) 。这仅适用于具有固定结构的设置 (不包括列表、枚举、重复项等) 。#94001 (Hechem Selmi) 。
  • QBit 现已支持相等比较。#94078 (Raufs Dunamalijevs) 。
  • 当 Keeper 检测到损坏的快照或不一致的更新日志时,会抛出异常,而不是要求手动中止或自动清理文件。这会让 Keeper 采用更安全的行为,即依赖人工干预。#94168 (Antonio Andelic).
  • 修复了 CREATE TABLE 失败时可能留下残留内容的问题。#94174 (Azat Khuzhin) 。
  • 修复在使用受密码保护的 TLS 私钥时对未初始化内存的访问问题 (OpenSSL 中的一个缺陷) 。#94182 (Konstantin Bogdanov) 。
  • 将 chdig 更新至 v26.1.1#94290 (Azat Khuzhin) 。
  • 支持 S3Queue ordered 模式下更通用的分区方式。#94321 (Bharat Nallan) 。
  • 为设置 allow_statistics_optimize 新增了别名 use_statistics。这与现有设置 use_primary_keyuse_skip_indexes 的命名更加一致。#94366 (Robert Schulze).
  • 启用了设置 input_format_numbers_enum_on_conversion_error,以在从 Numbers 转换为枚举类型时检查元素是否存在。#94384 (Elmi Ahmadov) 。
  • 在 S3(Azure)Queue 的 ordered 模式下,借助跟踪限制清理失败节点 (此前仅在 Unordered 模式下对失败节点和已处理节点执行此操作;现在 Ordered 模式下也会执行,但仅限失败节点) 。#94412 (Kseniia Sumarokova).
  • clickhouse-local 中为 default 用户启用访问管理。此前,clickhouse-local 中的 default 用户缺少 access_management 权限,导致 DROP ROW POLICY IF EXISTS 之类的操作会因 ACCESS_DENIED 错误而失败,尽管该用户本应拥有不受限制的访问权限。#94501 (Alexey Milovidov).
  • 为 YTsaurus 字典和表启用 named collection 功能。#94582 (MikhailBurdukov).
  • 为 BACKUP/RESTORE 添加了对用于 S3 和 Azure Blob 存储的 SQL 定义命名集合的支持。已关闭 #94604#94605 (Pablo Marcos) 。
  • 支持在 S3Queue 的 ordered 模式下按分区键分桶。#94698 (Bharat Nallan) 。
  • 新增一个异步指标,用于显示耗时最长的 merge 的运行时间。#94825 (Raúl Marín).
  • 在使用 IcebergBitmapPositionDeleteTransform 应用位置删除前,先添加归属文件检查。#94897 (Yang Jiang) 。
  • 现在,view_duration_ms 显示的是 group 处于活跃状态的时长,而不是其中各线程耗时的总和。#94966 (Sema Checherinda) 。
  • 移除了 hasAnyTokenshasAllTokens 函数中搜索标记最大数量的限制,此前上限为 64。示例:SELECT count() FROM table WHERE hasAllTokens(text, ['token_1', 'token_2', [...], 'token_65']]); 该查询会因包含 65 个搜索标记而报 BAD_ARGUMENTS 错误。通过此 PR,该限制已被完全移除,因此相同的查询现在可以无错误运行。#95152 (Elmi Ahmadov).
  • 新增设置项 input_format_numbers_enum_on_conversion_error,用于在从 Numbers 转换为枚举时检查相应元素是否存在。关闭:#56144#56240 (Nikolay Degterinsky) 。
  • 在 Iceberg 表中,在读取数据文件和位置删除文件时共享 format 解析器资源,以减少内存分配。#94701 (Yang Jiang).

缺陷修复 (官方稳定版本中用户可见的异常行为)

  • 修复了一个问题:在执行插入时,预定义查询处理程序会将末尾空白解析为数据。#83604 (Fabian Ponce).
  • 修复了在 Join 存储上应用 outer to inner join 优化时出现的 INCOMPATIBLE_TYPE_OF_JOIN 错误。解决了 #80794#84292 (Vladimir Cherkasov) 。
  • 修复了在启用 allow_experimental_join_right_table_sorting 时使用 hash join 会报出异常 “Invalid number of rows in Chunk” 的问题。#86440 (yanglongwei).
  • 如果 filesystem 大小写不敏感,则在 MergeTree 中始终将文件名替换为哈希。此前,在使用大小写不敏感 filesystem (如 MacOS) 的系统上,如果多个列/子列名称仅大小写不同,可能会导致数据损坏。#86559 (Pavel Kruglov).
  • 在创建阶段,对 materialized view 中的底层查询执行完整的权限检查。#89180 (pufit) 。
  • 修复了 icebergHash 函数在常量参数情况下发生崩溃的问题。#90335 (Michael Kolupaev) 。
  • 修复了以下逻辑错误:无事务的变更会修改处于活动事务中的 parts,而该事务最终会被回滚。#90469 (Shaohua Wang).
  • 在普通数据库转换为 atomic 数据库后,system.warnings 会被正确更新。#90473 (sdk2) 。
  • 修复了以下断言问题:从 Parquet 文件读取数据时,如果 prewhere 表达式的一部分也在查询的其他位置使用,就会触发该断言。#90635 (Max Kainov).
  • 修复了在 split-by-buckets 模式下从 Iceberg 读取时单节点集群发生崩溃的问题。此更改关闭了 #90913#91553 (Konstantin Vedernikov) 。
  • 修复了 Log 引擎在读取子列时可能出现的逻辑错误。关闭 #91710#91711 (Pavel Kruglov) 。
  • 修复 ATTACH AS REPLICATED 期间出现的逻辑错误:‘Storage 不支持事务’。#91772 (Shaohua Wang).
  • 修复了在 LEFT ANTI JOIN 带有额外后置条件时,运行时过滤器无法正常工作的问题。#91824 (Alexander Gololobov) 。
  • 修复了一个在涉及 Nothing 类型的 NULL 安全比较时出现的错误。关闭 #91834。关闭 #84870。关闭 #91821#91884 (Yarik Briukhovetskyi) 。
  • 修复 native Parquet reader 中影响高度重复字符串数据的 DELTA_BYTE_ARRAY 解码问题。#91929 (Daniel Muino) 。
  • 在 schema inference 期间,对于通配符中的文件,仅缓存推断出该 schema 的那个文件的 schema,而不是缓存所有文件的 schema。关闭了 #91745#92006 (Pavel Kruglov) 。
  • 修复了因归档条目大小头部信息错误导致的 Couldn't pack tar archive: Failed to write all bytes 错误。修复 #89075#92122 (Julia Kartseva) 。
  • 在 insert select 中释放请求流,以避免关闭 HTTP 连接。#92175 (Sema Checherinda) 。
  • 修复了在使用 USING 子句和 join_use_nulls 时,包含多个 JOIN 的查询中的逻辑错误。#92251 (Vladimir Cherkasov) 。
  • 修复启用 join_use_nulls 时进行 join 重排序时的逻辑错误,关闭 https://github.com/clickhouse/clickhouse/issues/90795。 #92289 (Vladimir Cherkasov)。
  • 修复了 arrayElement 与取反字面量一起使用时 AST 格式不一致的问题。关闭了 #92288 关闭了 #92212 关闭了 #91832 关闭了 #91789 关闭了 #91735 关闭了 #88495 关闭了 #92386#92293 (Pavel Kruglov).
  • 修复了 join_on_disk_max_files_to_merge 设置可能引发崩溃的问题。#92335 (Bharat Nallan).
  • 相关 issue:#https://github.com/ClickHouse/support-escalation/issues/6365。[#92339](https://github.com/ClickHouse/ClickHouse/pull/92339) (Tuan Pham Anh) 。
  • 修复了 SYSTEM SYNC FILE CACHE 中遗漏的访问检查。关闭了 #92101#92372 (Kseniia Sumarokova).
  • 修复 count_distinct_optimization 在窗口函数和多个参数场景下的处理问题。#92376 (Raúl Marín) 。
  • 修复了在某些聚合函数与窗口函数一起使用时出现的 “Cannot write to finalized buffer” 错误。关闭 #91415#92395 (Jimmy Aguilar Mena) 。
  • 修复了 CREATE TABLE ... AS urlCluster() 与数据库引擎 Replicated 搭配使用时的逻辑错误。关闭 #92216#92418 (Kseniia Sumarokova) 。
  • 在 MergeTree 中执行变更时,继承源数据分片的序列化信息设置。这样可修复在数据类型序列化发生变化后,查询已变更分片时可能返回错误结果的问题。#92419 (Pavel Kruglov) 。
  • 修复列与同名子列之间可能存在的冲突,该问题会导致使用错误的序列化方式并引发查询失败。关闭 #90219。关闭 #85161#92453 (Pavel Kruglov).
  • 修复了一个 LOGICAL_ERROR:其原因是在将 outer join 转换为 inner join 时,对查询计划进行了非预期的修改。同时放宽了该优化的适用条件,使其也能用于在 join 过程中对聚合键应用单射函数的情况。#92503 (János Benjamin Antal).
  • 修复了对空 Tuple 列排序时可能出现的错误 SIZES_OF_COLUMNS_DOESNT_MATCH。关闭了 #92422#92520 (Pavel Kruglov) 。
  • 检查 JSON 类型中不兼容的类型化路径。关闭 #91577#92539 (Pavel Kruglov) 。
  • 修复对 Backup 数据库执行 SHOW CREATE DATABASE 时出现的死锁问题。#92541 (Azat Khuzhin) 。
  • 验证 hypothesis 索引时使用正确的错误代码。#92559 (Raúl Marín).
  • 修复 analyzer 中列别名里的动态子列解析问题。此前,列别名中的动态子列会被包裹在 getSubcolumn 中,因此在某些情况下可能根本无法解析。关闭了 #91434#92583 (Pavel Kruglov) 。
  • 防止 tokens() 在第二个参数为 NULL 时发生崩溃。#92586 (Raúl Marín) 。
  • 修复了一个潜在崩溃问题:其原因是底层 const PREWHERE 列被原地变更。这种情况可能发生在列收缩 (IColumn::shrinkToFit) 或过滤 (IColumn::filter) 时,并且可能被多个线程同时触发。#92588 (Arsen Muk) 。
  • 在包含大型 parts (超过 4,294,967,295 行) 的表上创建和物化文本索引的功能已被暂时禁用。此限制可防止查询结果出错,因为当前的索引实现尚不支持如此大的 parts。#92644 (Anton Popov) 。
  • 修复了执行 JOIN 时出现的逻辑错误 Too large size (A) passed to allocator。已关闭 #92043#92667 (Yarik Briukhovetskyi) 。
  • 修复了一个问题:当 ngrambf_v1 索引的 ngram 长度 (第 1 个参数) > 8 时,会抛出异常。#92672 (Robert Schulze) 。
  • 修复在使用 ZooKeeper 存储时,后台重新加载 named collections 期间出现的未捕获异常。关闭 https://github.com/ClickHouse/clickhouse-private/issues/44180。 #92717 (Kseniia Sumarokova) 。
  • 修正了通配符授权的访问授权检查中的错误逻辑。此前的尝试 https://github.com/ClickHouse/ClickHouse/pull/90928 虽然修复了一个严重漏洞,但限制过于严格,导致某些通配符 GRANT 语句会因无关的 REVOKE 操作而失败。#92725 (pufit).
  • 修复了在 WHERE 中使用 not match(...) 时数据跳过逻辑中的一个缺陷,该缺陷会导致结果错误。关闭了 #92492#92726 (Nihal Z. Miaji) 。
  • 如果在只读磁盘上创建了 MergeTree 表,则启动时不要尝试删除临时目录。#92748 (Alexey Milovidov).
  • 修复 ALTER TABLE REWRITE PARTS (v2) 中“无法向空的 ExpressionActionsChain 添加操作”的问题。 #92754 (Azat Khuzhin).
  • 避免因从已断开的 Connection 中读取而崩溃。#92807 (Raufs Dunamalijevs).
  • 修复了 S3Queue 存储在 Ordered 模式下的逻辑错误 Failed to set file processing within 100 retries。该错误现已改为警告。在 25.10 之前的版本中,如果 Keeper 会话过期,可能会出现此错误;不过在 25.10+ 版本中,它也只会显示为警告,因为理论上在 Ordered 模式下处理并发较高时,仍有可能触发此错误。#92814 (Kseniia Sumarokova).
  • 此前,一些在 PK 分片中使用恒假条件的查询会失败。现在已不会。https://github.com/ClickHouse/ClickHouse/pull/89313 需要此修复。#92815 (Yarik Briukhovetskyi) 。
  • 修复了 system.parts 表中文本索引未压缩大小的计算问题。#92832 (Anton Popov) 。
  • 修复了轻量级更新中主索引的使用问题:当 WHERE 子句中的谓词包含带子查询的 IN 子句时,会出现该问题。#92838 (Anton Popov) 。
  • 修复了在 JSON 中为路径 ‘skip’ 创建类型提示时的问题。关闭了 #92731#92842 (Pavel Kruglov) 。
  • 在 S3 表引擎中,如果存在非确定性函数,则不应缓存分区键。#92844 (Miсhael Stetsyuk) 。
  • 修复了在对设置 ratio_of_defaults_for_sparse_serialization=0.0 的稀疏列执行变更后,可能出现 FILE_DOESNT_EXIST 错误的问题。关闭 #92633#92860 (Pavel Kruglov) 。
  • 修复旧版 Parquet 读取器 (默认不使用) 在 JSON 列位于 Tuple 列之后时的 Parquet schema 推断问题。修复旧版 Parquet 读取器 (默认不使用) 在处理空 Tuple 时失败的问题。#92867 (Michael Kolupaev) 。
  • 修复在常量条件下进行多个 join 且启用 join_use_nulls 时的逻辑错误,关闭 #92640#92892 (Vladimir Cherkasov) 。
  • 修复在向分区表达式包含子列的表中插入数据时,可能出现的错误 NOT_FOUND_COLUMN_IN_BLOCK。关闭 #93210。关闭 #83406#92905 (Pavel Kruglov) 。
  • 修复了 Merge 引擎在带别名的表上报错 NO_SUCH_COLUMN_IN_TABLE 的问题。关闭 #88665#92910 (Pavel Kruglov) 。
  • 修复在 LowCardinality(Nullable(T)) 列上执行 full_sorting_join 时 NULL != NULL 的问题。#92924 (Vladimir Cherkasov) 。
  • 修复了 MergeTree 表中文本索引合并期间发生的多次崩溃。#92925 (Anton Popov).
  • 如有需要,在生存时间 (TTL) 聚合期间恢复 SET 表达式结果上的 LowCardinality 封装,以避免在表优化过程中出现异常。#92971 (Seva Potapov) 。
  • 修复了在 has 函数中使用空数组时,索引分析过程中的逻辑错误。关闭 #92906#92995 (Nihal Z. Miaji) 。
  • 修复终止后台调度池时可能卡住的问题 (可能导致服务器关闭时卡住) 。#93008 (Azat Khuzhin).
  • 修复了这样一种可能出现的错误:通过 alter 将设置 ratio_of_defaults_for_sparse_serialization 更改为 1.0 后,在执行稀疏列变更时可能会出现 FILE_DOESNT_EXIST。#93016 (Pavel Kruglov).
  • 修复了在 WHERE 中使用 not materialize(...)not CAST(...) 时,数据 skipping 逻辑中的缺陷;该问题会导致结果错误。关闭 #88536#93017 (Nihal Z. Miaji).
  • 修复因共享 parts 中的 TOCTOU 竞争而可能使用过期分区片段的问题。#93022 (Azat Khuzhin).
  • 修复反序列化带有越界偏移量的格式错误 groupConcat 聚合状态时发生的崩溃。#93028 (Raufs Dunamalijevs) 。
  • 修复了预先取消分布式查询后连接处于异常状态的问题。#93029 (Azat Khuzhin) 。
  • 修复了右侧连接键为稀疏列时连接结果出错的问题。此修复解决了 #92920。我只能在 set compatibility='23.3' 的情况下复现这个问题。不确定是否应该回移。#93038 (Amos Bird).
  • 修复 estimateCompressionRatio() 中可能出现的 Cannot finalize buffer after cancellation 错误。修复内容见:#87380#93068 (Azat Khuzhin).
  • 修复了基于复杂表达式 (如 concat(col1, col2)) 构建的文本索引在合并时出现的问题。#93073 (Anton Popov).
  • 修复了过滤器包含子列时无法应用投影的问题。关闭了 #92882#93141 (Pavel Kruglov)。
  • 修复了某些情况下在将 join 运行时过滤器添加到查询计划时触发的逻辑错误。该问题是由于错误地从 join 的一侧返回了重复的 const 列所致。#93144 (Alexander Gololobov) 。
  • 用于 join 运行时过滤器的特殊函数 __applyFilter 在某些本应有效的情况下会返回 ILLEGAL_TYPE_OF_ARGUMENT。#93187 (Alexander Gololobov) 。
  • 当插值列实际上是同一列的别名时,防止不同的插值列在一个块中合并为同一列。#93197 (Yakov Olkhovskiy) 。
  • 在与已补齐的右表进行连接时,不要添加运行时过滤器。#93211 (Alexander Gololobov) 。
  • 修复 Keeper 在会话失效后未清理持久 watches 的问题。该修复关闭了 #92480#93213 (Konstantin Vedernikov) 。
  • 修复 Iceberg 中 ORDER BY Tuple 的问题。此更改关闭了 #92977#93225 (Konstantin Vedernikov).
  • 修复了 S3Queue 设置 s3queue_migrate_old_metadata_to_buckets 中的错误。关闭了 #93392#93196#81739#93232 (Kseniia Sumarokova) 。
  • 在合并过程中重建投影时,会移除未使用的列。这可降低内存使用量,并减少临时 parts 的创建。#93233 (Nikolai Kochetov).
  • 修复了在存在标量关联子查询时,子查询中未使用列被移除的问题。修复前,如果某一列仅在关联子查询中使用,就可能被误删,从而导致查询报 NOT_FOUND_COLUMN_IN_BLOCK 错误而失败。#93273 (Dmitry Novik).
  • 修复在对源表执行 ALTER 时,MV 中可能缺失子列的问题。关闭 #93231#93276 (Pavel Kruglov) 。
  • 修复了 analyzer 在为 Merge 表引擎规划查询时的问题:合并本地表与远程/Distributed 表时,可能会对 hostName() 抛出 ILLEGAL_COLUMN。关闭 #92059#93286 (Jinlin) 。
  • 修复了使用非常量数组参数时,NOT IN 返回错误值的问题 + 支持非常量 Array 函数。关闭 #14980#93314 (Yarik Briukhovetskyi).
  • 修复 use_top_k_dynamic_filtering 优化导致的 Not found column 问题。修复了 #93186#93316 (Nikolai Kochetov) 。
  • 修复了基于子列创建的文本索引在重建时出现的问题。#93326 (Anton Popov) 。
  • 修复了 hasAllTokenshasAnyTokens 函数将空数组作为第二个参数时的处理问题。#93328 (Anton Popov).
  • 修复了在针对右侧表计算 totals 的查询中使用运行时过滤器时出现的逻辑错误。#93330 (Alexander Gololobov).
  • 如果使用非常量的分词器参数 (第 2、3、4 个参数) 调用函数 tokens,server 将不再崩溃,例如 SELECT tokens(NULL, 1, materialize(1))#93383 (Robert Schulze).
  • 修复了 groupConcat 状态反序列化中的整数溢出漏洞;该漏洞可能因精心构造的聚合状态而引发内存安全问题。#93426 (Raufs Dunamalijevs) 。
  • 修复了在索引不包含任何标记 (所有数组都为空,或所有标记均被分词器跳过) 时,对数组列进行文本索引分析的问题。#93457 (Anton Popov).
  • 当连接字符串中已包含用户名/密码时,避免在 ClickHouse Client 中使用 oauth 登录。#93459 (Krishna Mannem) 。
  • 修复 DataLakeCatalog 对 Azure ADLS Gen2 下发凭据的支持:从 Iceberg REST 目录中解析 adls.sas-token.* 参数,并修复 ABFSS URL 解析。#93477 (Karun Anantharaman).
  • 修复了 analyzer 对 GLOBAL IN 的支持问题 (此前会在远程节点上再次创建 set) 。 #93507 (Azat Khuzhin).
  • 修复了在反序列化时直接提取到稀疏列中的子列的问题。#93512 (Pavel Kruglov) 。
  • 修复了在搜索查询重复时无法从文本索引直接读取的问题。 #93516 (Anton Popov).
  • 修复了在启用运行时过滤器且 join 的表中同一列被重复返回多次时 (例如 SELECT a, a, a FROM t) 出现的 NOT_FOUND_COLUMN_IN_BLOCK 错误。#93526 (Alexander Gololobov).
  • 修复了一个问题:通过 ssh 连接时,clickhouse-client 会要求输入两次密码。 #93547 (Isak Ellmer).
  • 确保 ZooKeeper 在关闭时能够正常完成清理 (修复了极少数情况下关闭时可能卡住的问题) 。#93602 (Azat Khuzhin) 。
  • 修复恢复 ReplicatedMergeTree 时因去重竞争条件导致的 LOGICAL_ERROR。#93612 (Pablo Marcos) 。
  • 修复了在某些输入格式中直接反序列化到 Sparse 列时,使用 Sparse 列更新生存时间 (TTL) 的问题。此修复还解决了可能出现的逻辑错误 Unexpected type of result TTL column#93619 (Pavel Kruglov) 。
  • 修复了 h3 index 函数在传入无效输入时有时会崩溃或卡死的问题。#93657 (Michael Kolupaev) 。
  • 在非 UTF-8 数据上使用 ngram_bf 索引会导致读取未初始化的内存,其中的值可能会出现在生成的索引结构中。修复了 #92576#93663 (Alexey Milovidov) 。
  • 验证解压后缓冲区的大小是否符合预期。#93690 (Raúl Marín) 。
  • 防止用户通过 merge 表引擎在未检查 SHOW COLUMNS 权限的情况下获取表的列列表。#93695 (János Benjamin Antal).
  • 修复了基于子列创建的跳过索引的物化问题。#93708 (Anton Popov).
  • 我们将 storages 的共享指针保存在 QueryPipeline::resources::storage_holders 中,以确保在 PipelineExecutor 存活期间,IStorage 对象不会被销毁。#93746 (Miсhael Stetsyuk) 。
  • 修复了重启后 interserver host 发生变化时无法 Attach Replicated 数据库的问题。#93779 (Tuan Pham Anh) 。
  • 修复了在启用缓存时,ReadBufferFromS3 中触发的断言 !read_until_position#93809 (Kseniia Sumarokova) 。
  • 修复了在极少数情况下,将空元组用于 Map 列时出现的逻辑错误。关闭 #93784#93814 (Nihal Z. Miaji) 。
  • 修复了在合并过程中重建 projections 时 _part_offset 损坏的问题,并通过避免对 _part_offset 列进行不必要的读取,以及在 projection 计算中跳过不需要的列,优化了 projection 处理。这延续了 #93233 中引入的优化。#93827 (Amos Bird) 。
  • 移除了对 ‘Bad version’ 的处理逻辑。 #93843 (Anton Ivashkin).
  • 修复了当键为有符号整数类型时,optimize_inverse_dictionary_lookup 在 Distributed 查询中不生效的问题。关闭 #93259#93848 (Nihal Z. Miaji) 。
  • 修复了分布式 remote() 查询中 lag/lead 不生效的问题。解决 #90014#93858 (Nihal Z. Miaji) 。
  • 修复 system instrument dispatch 中的缺陷。#93937 (Pablo Marcos) 。
  • https://github.com/ClickHouse/ClickHouse/pull/89173 中,我们给 TraceSender 通过内部管道发送的结构新增了一个字段。然而,buffer 的大小没有同步更新 (这里) ,因此写入 buffer 的数据量超过了 buffer_size,从而导致多次刷写。并且由于 TraceSender::send 会由不同线程调用,不同线程的刷写可能会交错在一起,破坏了接收端 (TraceCollector) 所依赖的不变量。#93966 (Miсhael Stetsyuk) 。
  • 修复带有 USING 子句的 Join 存储在执行 join 操作时转换为超类型的类型转换问题。修复了 #91672。修复了 #78572#94000 (Dmitry Novik) 。
  • 修复了在 Merge 表上应用 join 运行时过滤器时,未正确添加 FilterStep 的问题。#94021 (Alexander Gololobov) 。
  • 如果某个 SELECT 查询包含针对多个列的谓词,使用了 bloom filter 跳过索引,并且同时存在 ORNOT 条件,则可能返回不一致的结果。该问题现已修复。#94026 (Shankar Iyer) 。
  • 修复对带有依赖索引的列执行 CLEAR 时出现的问题。#94057 (Raúl Marín).
  • 修复 ReadWriteBufferFromHTTP 中使用未初始化值的问题。#94058 (Alexey Milovidov) 。
  • 修复了对 JSON 中类型化路径的不正确检查。该检查是在 https://github.com/ClickHouse/ClickHouse/pull/92842 中引入的,可能会在现有表启动时导致 error。#94070 (Pavel Kruglov) 。
  • 修复在存在 OUTER JOIN 的情况下进行过滤器分析时发生的崩溃。修复了 #90979#94080 (Dmitry Novik) 。
  • 修复在并行使用 UInt8 聚合键时 uniqTheta 的精度问题 (max_threads > 1,默认值) 。#94095 (Azat Khuzhin) 。
  • 修复了在 SCOPE_EXIT 内调用 socket.setBlocking(true) 时抛出异常而导致的崩溃。#94100 (Miсhael Stetsyuk).
  • 修复了在 ReplicatedMergeTree 中,DROP PARTITION 删除由后续日志条目创建的 parts 时导致的数据丢失问题。#94123 (Tuan Pham Anh).
  • 已修复 Parquet reader v3 错误处理跨越页面边界的数组的问题。例如,这种情况会出现在由 Arrow 写入且未启用 page statistics 或 page index 的文件中。仅影响 Array 数据类型的列。可能的症状是,大约每 1 MB 数据就会有一个数组被截断。在此修复发布前,可使用以下设置作为临时解决方法:input_format_parquet_use_native_reader_v3 = 0#94125 (Michael Kolupaev) 。
  • 修复了 ReplicatedMergeTree 在等待日志条目时 watch 数量过多的问题。#94133 (Azat Khuzhin) 。
  • 函数 arrayShufflearrayPartialShufflearrayRandomSample 现支持将常量列物化,从而使不同行得到不同的结果。#94134 (Joanna Hulboj) 。
  • 修复了在 materialized view 中对表函数求值时的数据竞争问题。#94171 (Alexey Milovidov) 。
  • 修复 PostgreSQL 数据库引擎中的 nullptr 解引用问题 (当查询有误时会触发) 。关闭 #92887#94180 (Alexey Milovidov) 。
  • 修复了可刷新materialized views在使用包含多个子查询的 SELECT 查询时出现的内存泄漏问题。#94200 (Antonio Andelic) 。
  • 修复了 DataPartStorageOnDiskBase::removesystem.parts 之间的数据竞争。关闭 #49076#94262 (Alexey Milovidov) 。
  • 移除了 HashTable 复制赋值中错误的 noexcept 指定符,该问题在发生内存异常时可能导致程序崩溃 (std::terminate) 。#94275 (Nikita Taranov) 。
  • 此前,如果创建的投影在 GROUP BY 中包含重复列 (例如 GROUP BY c0, c0) ,插入数据时在启用 optimize_row_order 的情况下会触发 std::length_error。修复了 #94065#94277 (Alexey Milovidov) 。
  • 修复了 ZooKeeper 客户端在连接时的一个隐蔽问题,该问题会导致卡死和崩溃。#94320 (Azat Khuzhin) 。
  • 修复“函数到子列”优化未对子列生效的问题。#94323 (Pavel Kruglov) 。
  • 修复在启用 enable_lazy_columns_replication 时,嵌套 RIGHT JOIN 可能导致结果不正确的问题。该缺陷会导致启用复制的列中的所有行错误地返回相同的值,而不是各不相同的值。关闭 #93891#94339 (Vladimir Cherkasov) 。
  • 修复了在 SEMI JOIN 中使用等价集合进行过滤器下推的问题。如果参数类型发生变化,则不要下推过滤器。修复了 #93264#94340 (Dmitry Novik) 。
  • 修复在 database DataLake 数据库引擎中使用 DeltaLake CDF 的问题 (delta lake catalogs integration) 。关闭 #94122#94342 (Kseniia Sumarokova) 。
  • 修复了在使用 SLRU 缓存策略时,当前指标 FilesystemCacheSizeLimit 值不正确的问题。#94363 (Kseniia Sumarokova) 。
  • 现在,在创建 Backup 数据库引擎时如果提供的参数少于两个,会返回更明确的错误消息 (Wrong number of arguments,而不是 std::out_of_range: InlinedVector::at(size_type) const failed bounds check.) 。#94374 (Robert Schulze).
  • 忽略在数据库级别对带有 grant option 的全局授权执行这类不可能的撤销操作。#94386 (pufit).
  • 修复从 compact parts 中读取稀疏偏移量的问题。关闭 #94385#94399 (Pavel Kruglov) 。
  • 即使启用了 alter_column_secondary_index_modethrow 模式,也不再阻止对使用隐式索引的列执行 ALTER。#94425 (Raúl Marín) 。
  • 修复了在多个 receivePacketsExpectQuery 调用读取 Protocol::Client::IgnoredPartUUIDs 时,TCPHandler 发生崩溃的问题。 #94434 (Miсhael Stetsyuk).
  • 修复了 system.functions 中敏感数据脱敏的问题。#94436 (Vitaly Baranov) 。
  • 修复在禁用 send_profile_events 时发生的 nullptr 解引用问题。该特性最近才在 ClickHouse Python 驱动中引入。已关闭 #92488#94466 (Alexey Milovidov) 。
  • 修复合并过程中,文本索引 .mrk 的不兼容问题。#94494 (Peng Jian) 。
  • 启用 read_in_order_use_virtual_row 时,代码会按完整主键的大小访问索引列,但未检查索引是否已被截断,从而导致释放后使用或使用未初始化内存。关闭 #85596#94500 (Alexey Milovidov) 。
  • 修复了在为带有 GLOBAL IN 的子查询发送外部表时,若类型为 Nullable,因类型不匹配导致的错误。关闭 #94097#94511 (Alexey Milovidov) 。
  • 在早期版本中,对同一表达式包含多个索引条件的查询可能会误报 Not found column 异常。关闭 #60660#94515 (Alexey Milovidov) 。
  • 修复运行时过滤器中对 Nullable join 列处理不当的问题。#94555 (Alexander Gololobov) 。
  • 在当前正在使用的另一个工作负载中创建工作负载时,不再会导致崩溃。#94599 (Sergei Trifonov) 。
  • 修复了在缺失列上计算 isNotNull 时,ANY LEFT JOIN 优化期间发生的崩溃。#94600 (Molly).
  • 修复了在引用其他具有计算默认值的列时,默认表达式求值不正确的问题。#94615 (Alexey Milovidov) 。
  • 修复 BACKUP/RESTORE 操作中的权限问题。#94617 (Pablo Marcos) 。
  • 修复了在数据类型为 Nullable(DateTime64) 时,因类型转换错误导致的崩溃问题。 #94627 (Miсhael Stetsyuk).
  • 修复了一个错误:某些带有 ORDER BY 的分布式查询可能会返回 ALIAS 列值对调的结果 (即列 a 显示列 b 的数据,反之亦然) 。#94644 (filimonov).
  • 修复将 keeper-bench 结果存储到文件时的问题。#94654 (Antonio Andelic) 。
  • 修复了在列包含负浮点值时,MinMax 类型统计信息估算错误的问题。#94665 (zoomxi).
  • 修复了当 Map 的键为 struct 时读取 Parquet 文件的问题。#94670 (Konstantin Vedernikov) 。
  • 修复在使用复杂 ON 条件时可能产生错误的 RIGHT JOIN 结果。关闭 #92913#94680 (Vladimir Cherkasov).
  • 在 Vertical merge 之后保留固定的索引粒度 (use_const_adaptive_granularity) 。#94725 (Azat Khuzhin) 。
  • 修复了变更在处理标量子查询和表依赖项时的缺陷。如果某个表在某一列上存在依赖项 (索引或投影) ,标量子查询可能会在没有数据的情况下被求值并缓存,进而导致错误的变更。#94731 (Raúl Marín).
  • 修复 AsynchronousMetrics 中 cpu_pressure 在出错时的回退问题。#94827 (Raúl Marín).
  • getURLHostRFC 函数在解引用指针前缺少越界检查。当向 domainRFC 传入空字符串时,它会读取未初始化的内存,从而触发 MSan 错误。#94851 (Alexey Milovidov) 。
  • 修复加密磁盘只读状态相关的问题。#94852 (Azat Khuzhin) 。
  • 修复了在旧 analyzer 中对分布式表使用小数 LIMIT/OFFSET 时的逻辑错误。关闭 #94712#94999 (Ahmed Gouda).
  • 修复了在默认启用 JOIN 运行时过滤器时,在某些条件下发生崩溃的问题。#95000 (Alexander Gololobov) 。
  • 改进表引擎 URL() 和表函数 url() 中所用 URL 里的密码掩码处理。#95006 (Vitaly Baranov) 。
  • 函数 toStartOfInterval 现在在启用 enable_extended_results_for_datetime_functions 时,其行为与 toStartOfX 相同,其中 X 可以是 DayWeekMonthQuarterYear#95011 (Kirill Kopnev) 。
  • 修复了常量字符串比较未正确遵循设置 cast_string_to_date_time_modebool_true_representationbool_false_representationinput_format_null_as_default 的问题。关闭 #91681#95040 (Nihal Z. Miaji) 。
  • 修复文件系统缓存中的数据竞争问题。#95064 (Alexey Milovidov) 。
  • 修复了 Parquet 读取器中的一个罕见竞态条件。 #95068 (Alexey Milovidov).
  • 修复了 LIMIT 为零时 top K 优化中的崩溃问题。关闭了 #93893#95072 (Alexey Milovidov) 。
  • 从 DateTime/整数转换为 Time64 时,会通过 toTime 提取时刻部分,而 toTime 并不是单调函数。ToDateTimeMonotonicity 模板此前误将这种转换标记为单调,导致在调试构建中出现 “Invalid binary search result in MergeTreeSetIndex” 异常。#95125 (Alexey Milovidov).
  • 仅在必要时才重新创建 manifest 文件条目列表 (此前每次迭代都会执行) 。#95162 (Daniil Ivanik).

构建/测试/打包改进

最后修改于 2026年6月10日