[Doc] add new fe config for controlling array ndv colleciton to cbo section (backport #61921) (#61982)

Signed-off-by: stephen <stephen5217@163.com>
Signed-off-by: 絵空事スピリット <wanglichen@starrocks.com>
Co-authored-by: stephen <91597003+stephen-shelby@users.noreply.github.com>
Co-authored-by: 絵空事スピリット <wanglichen@starrocks.com>
This commit is contained in:
mergify[bot] 2025-08-15 08:25:53 +00:00 committed by GitHub
parent a670068304
commit 17f92859be
No known key found for this signature in database
GPG Key ID: B5690EEEBB952194
6 changed files with 60 additions and 0 deletions

View File

@ -1957,6 +1957,24 @@ Starting from version 3.3.0, the system defaults to refreshing one partition at
- Description: Threshold of low cardinality dictionary.
- Introduced in: v3.5.0
##### enable_manual_collect_array_ndv
- Default: false
- Type: Boolean
- Unit: -
- Is mutable: Yes
- Description: Whether to enable manual collection for the NDV information of the ARRAY type.
- Introduced in: v4.0
##### enable_auto_collect_array_ndv
- Default: false
- Type: Boolean
- Unit: -
- Is mutable: Yes
- Description: Whether to enable automatic collection for the NDV information of the ARRAY type.
- Introduced in: v4.0
### Loading and unloading
##### load_straggler_wait_second

View File

@ -213,6 +213,8 @@ The following table describes the default settings. If you need to modify them,
| statistic_auto_collect_predicate_columns_threshold | INT | 32 | If the number of columns in the table exceeds this configuration during automatic collection, only the column statistics for the Predicate Column will be collected. |
| statistic_predicate_columns_persist_interval_sec | LONG | 60 | The interval at which FE synchronize and persists statistics of Predicate Column. |
| statistic_predicate_columns_ttl_hours | LONG | 24 | The elimination time of the Predicate Column statistics cached in FE. |
| enable_manual_collect_array_ndv | BOOLEAN | FALSE | Whether to enable manual collection for the NDV information of the ARRAY type. |
| enable_auto_collect_array_ndv | BOOLEAN | FALSE | Whether to enable automatic collection for the NDV information of the ARRAY type. |
You can rely on automatic jobs for a majority of statistics collection, but if you have specific requirements, you can manually create a task by executing the ANALYZE TABLE statement or customize an automatic task by executing the CREATE ANALYZE statement.

View File

@ -1356,6 +1356,24 @@ ADMIN SET FRONTEND CONFIG ("key" = "value");
- 説明: 低基数辞書のしきい値。
- 導入バージョン: v3.5.0
##### enable_manual_collect_array_ndv
- デフォルト: false
- タイプ: Boolean
- 単位: -
- 変更可能: はい
- 説明: ARRAY タイプの NDV 情報の手動収集を有効にするかどうか。
- 導入バージョン: v4.0
##### enable_auto_collect_array_ndv
- デフォルト: false
- タイプ: Boolean
- 単位: -
- 変更可能: はい
- 説明: ARRAY タイプの NDV 情報の自動収集を有効にするかどうか。
- 導入バージョン: v4.0
### ロードとアンロード
##### load_straggler_wait_second

View File

@ -215,6 +215,8 @@ v3.5.0 以降、StarRocks は自動収集中に、テーブルのデータが前
| statistic_auto_collect_predicate_columns_threshold | INT | 32 | 自動収集中にテーブルの列数がこの設定を超えた場合、Predicate Columnの列統計のみが収集されます。 |
| statistic_predicate_columns_persist_interval_sec | LONG | 60 | FE が Predicate Column の統計情報を同期し、永続化する間隔。 |
| statistic_predicate_columns_ttl_hours | LONG | 24 | FE にキャッシュされた Predicate Column 統計の消去時間。 |
| enable_manual_collect_array_ndv | BOOLEAN | FALSE | ARRAY タイプの NDV 情報の手動収集を有効にするかどうか。 |
| enable_auto_collect_array_ndv | BOOLEAN | FALSE | ARRAY タイプの NDV 情報の自動収集を有効にするかどうか。 |
統計収集の大部分は自動ジョブに依存できますが、特定の要件がある場合は、ANALYZE TABLE ステートメントを実行して手動でタスクを作成するか、CREATE ANALYZE ステートメントを実行して自動タスクをカスタマイズできます。

View File

@ -1949,6 +1949,24 @@ ADMIN SET FRONTEND CONFIG ("key" = "value");
- 描述:低基数字典阈值。
- 引入版本v3.5.0
##### enable_manual_collect_array_ndv
- 默认值false
- 类型Boolean
- 单位:-
- 是否动态:是
- 描述:是否允许手动采集 ARRAY 类型列的 NDV 信息。
- 引入版本v4.0
##### enable_auto_collect_array_ndv
- 默认值false
- 类型Boolean
- 单位:-
- 是否动态:是
- 描述:是否允许自动采集 ARRAY 类型列的 NDV 信息。
- 引入版本v4.0
### 导入导出
##### load_straggler_wait_second

View File

@ -210,6 +210,8 @@ StarRocks 提供灵活的信息采集方式,您可以根据业务场景选择
| statistic_auto_collect_predicate_columns_threshold | INT | 32 | 自动采集时若发现表中的列数超过配置项,则仅会采集 Predicate Column 的列统计信息。 |
| statistic_predicate_columns_persist_interval_sec | LONG | 60 | FE 对 Predicate Column 的同步和持久化间隔周期。 |
| statistic_predicate_columns_ttl_hours | LONG | 24 | Predicate Column 信息在 FE 中缓存淘汰时间。 |
| enable_manual_collect_array_ndv | BOOLEAN | FALSE | 是否允许手动采集 ARRAY 类型列的 NDV 信息。 |
| enable_auto_collect_array_ndv | BOOLEAN | FALSE | 是否允许自动采集 ARRAY 类型列的 NDV 信息。 |
### 手动采集 (Manual Collection)