Release 2.1.4
Apache Doris バージョン 2.1.4 が 2024年6月26日に正式にリリースされました。 このアップデートでは、データレイクハウスシナリオにおける様々な機能的体験を最適化し、前バージョンでの異常なメモリ使用量の問題解決に重点を置いています。さらに、安定性を向上させるためのいくつかの改善とバグ修正を実装しました。ダウンロードしてご利用ください。
クイックダウンロード: https://doris.apache.org/download/
GitHub Release: https://github.com/apache/doris/releases
動作変更
-
Hive などの外部テーブルをクエリする際に、存在しないファイルが無視されるようになりました。#35319
ファイルリストはメタキャッシュから取得され、実際のファイルリストと一致しない場合があります。
存在しないファイルを無視することで、クエリエラーの回避に役立ちます。
-
デフォルトで、Bitmap Index の作成が自動的に Inverted Index に変更されなくなりました。#35521
この動作は FE 設定項目
enable_create_bitmap_index_as_inverted_indexによって制御され、デフォルトは false です。 -
--consoleを使用して FE と BE プロセスを開始する場合、すべてのログが標準出力に出力され、ログタイプを示すプレフィックスによって区別されます。#35679詳細については、ドキュメントを参照してください:
-
テーブル作成時にテーブルコメントが提供されない場合、テーブルタイプをデフォルトコメントとして使用する代わりに、デフォルトコメントが空になります。#36025
-
DECIMALV3 のデフォルト精度が (9, 0) から (38, 9) に調整され、この機能が最初にリリースされたバージョンとの互換性を維持します。#36316
新機能
クエリオプティマイザー
-
FE flame graph ツールをサポート
詳細については、ドキュメント を参照してください
-
SELECT DISTINCTを集約と組み合わせて使用することをサポート。 -
GROUP BYなしでの単一テーブルクエリリライトをサポート。複雑なフィルタや式に有用です。#35242 -
新しいオプティマイザーがポイントクエリ機能を完全にサポート #36205
データレイクハウス
-
Apache Paimon 削除ベクトルのネイティブリーダーをサポート #35241
-
table Valued Functions での Resource の使用をサポート #35139
-
Hive Ranger プラグインによるアクセスコントローラーが Data Mask をサポート
非同期マテリアライズドビュー
-
内部テーブルトリガー更新のビルドサポート。マテリアライズドビューが内部テーブルを使用し、内部テーブルのデータが変更された場合、マテリアライズドビューの更新をトリガーでき、マテリアライズドビュー作成時に REFRESH ON COMMIT を指定します。
-
単一テーブルの透過的リライトをサポート。詳細については、Querying Async Materialized View を参照してください。
-
透過的リライトが agg_state、agg_union タイプの集約ロールアップをサポート。マテリアライズドビューを agg_state または agg_union として定義でき、クエリは特定の集約関数を使用するか、agg_merge を使用できます。詳細については、AGG_STATE を参照してください
その他
-
関数
replace_emptyを追加。詳細については、[ドキュメント]../sql-manual/sql-functions/string-functions/replace_empty) を参照してください。
-
show storage policy using文をサポート。詳細については、ドキュメント を参照してください。
-
BE 側で JVM メトリクスをサポート。
be.confでenable_jvm_monitor=trueを設定してこの機能を有効にします。
改善
-
中国語名の列に対する転置インデックスの作成をサポート。#36321
-
セグメントキャッシュで消費されるメモリをより正確に推定し、未使用メモリをより迅速に解放できるようになりました。#35751
-
テーブルをリモートストレージにエクスポートする前に空のパーティションをフィルタリング。#35542
-
Backend 間の負荷を分散するために routine load タスク割り当てアルゴリズムを最適化。#34778
-
set 操作中に関連する変数が見つからない場合のヒントを提供。#35775
-
デフォルト読み込み用に FE の
custom_libディレクトリに Java UDF jar ファイルを配置することをサポート。#35984 -
監査ログ読み込みジョブ用のタイムアウトグローバル変数
audit_plugin_load_timeoutを追加。 -
非同期マテリアライズドビューの透過的リライトプランニングのパフォーマンスを最適化。
-
ソースが空の場合、BE が実行されない
INSERT操作を最適化。#34418 -
Hive/Hudi テーブルのファイルリストをバッチで取得することをサポート。120万ファイルのシナリオで、ファイルリスト取得時間が390秒から46秒に短縮されました。#35107
-
非同期マテリアライズドビュー作成時の動的パーティショニングを禁止。
-
Hive の外部テーブルの外部データのパーティションデータが非同期マテリアライズドビューと同期されているかを検出することをサポート。
-
非同期マテリアライズドビューのインデックス作成を許可。
バグ修正
クエリオプティマイザー
-
パーティション切り詰め後に SQL キャッシュが古い結果を返す問題を修正。#34698
-
JSON から他の型へのキャストが nullable 属性を正しく処理しない問題を修正。#34707
-
時折発生する DATETIMEV2 リテラル簡略化エラーを修正。#35153
-
ウィンドウ関数で
COUNT(*)が使用できない問題を修正。#35220 -
UNION ALL下のすべてのSELECT文にFROM句がない場合に nullable 属性が間違っている可能性がある問題を修正。#35074 -
bitmap in joinとサブクエリ非ネスト化が同時に使用できない問題を修正。#35435 -
特定の状況でフィルタ条件が CTE プロデューサーにプッシュダウンできないパフォーマンス問題を修正。#35463
-
大文字で書かれた集約コンビネータが見つからない問題を修正。#35540
-
列プルーニングによってウィンドウ関数が適切にプルーニングされないパフォーマンス問題を修正。#35504
-
クエリ内に同じ名前だが異なるデータベースの複数のテーブルが同時に現れる場合に、クエリが間違って解析され誤った結果につながる可能性がある問題を修正。#35571
-
スキーマテーブルスキャン中にランタイムフィルタ生成によって引き起こされるクエリエラーを修正。#35655
-
ネストされた相関サブクエリが join 条件が null リテラルに折りたたまれることで実行できない問題を修正。#35811
-
プランニング中に decimal リテラルが間違った精度で設定される時折の問題を修正。#36055
-
プランニング中に複数層の集約が間違ってマージされる時折の問題を修正。#36145
-
集約拡張プランニング後に入出力不一致エラーが発生する時折の問題を修正。#36207
-
<=>が間違って=に変換される時折の問題を修正。#36521
クエリ実行
-
pipeline エンジンで制限行に達した場合にクエリがハングし、メモリが解放されない問題を修正。#35746
-
enable_decimal256が true だが古いプランナーにフォールバックする場合の BE コアダンプを修正。#35731
非同期マテリアライズドビュー
-
非同期マテリアライズドビューのビルドで指定された store_row_column 属性がコアに認識されない問題を修正。
-
非同期マテリアライズドビューのビルドで storage_medium の指定が効かない問題を修正。
-
ベーステーブル削除後の非同期マテリアライズドビュー show partitions でエラーが発生する問題を解決。
-
非同期マテリアライズドビューがバックアップと復元の例外を引き起こす問題を修正。#35703
-
パーティションリライトが間違った結果につながる可能性がある問題を修正。#35236
半構造化
- 空のキーを持つ VARIANT が使用された場合のコアダンプ問題を修正。#35671
- Bitmap と BloomFilter インデックスはライトインデックス変更を実行すべきではありません。#35225
プライマリキー
-
インポート中の部分列更新の場合に例外的な BE 再起動が発生し、重複キーが生じる可能性がある問題を修正。#35678
-
メモリが逼迫した際のクローン操作中に BE がコアダンプする可能性がある問題を修正。#34702
データレイクハウス
-
ctl.db.tblなどの完全修飾名で Hive テーブルを作成できない問題を修正 #34984 -
更新時に Hive metastore 接続がクローズされない問題を修正 #35426
-
2.0.x から 2.1.x へのアップグレード時の潜在的なメタリプレイ問題を修正。#35532
-
table Valued Function が空の snappy 圧縮ファイルを読み取れない問題を修正。#34926
-
無効な min-max 列統計を持つ Parquet ファイルを読み取れない問題を修正 #35041
-
Parquet/ORC リーダーで null-aware 関数を使ったプッシュダウン述語を処理できない問題を修正 #35335
-
Hive テーブル作成時のパーティション列の順序に関する問題を修正 #35347
-
パーティション値にスペースが含まれている場合に S3 上の Hive テーブルへの書き込みが失敗する問題を修正 #35645
-
Aliyun OSS エンドポイントの間違ったスキームに関する問題を修正 #34907
-
Doris によって書かれた Parquet 形式の Hive テーブルが Hive で読み取れない問題を修正 #34981
-
Hive テーブルのスキーマ変更後に ORC ファイルを読み取れない問題を修正 #35583
-
Paimon テーブルのスキーマ変更後に JNI 経由で Paimon テーブルを読み取れない問題を修正 #35309
-
スキーマ変更後に Paimon テーブルを読み取れない問題を修正 #36049
-
スキーマ変更後に Hive Parquet 形式テーブルを読み取れない問題を修正 #36182
-
Hadoop FS キャッシュによる FE OOM 問題を修正 #36403
-
Hive Metastore Listener 有効化後に FE が起動できない問題を修正 #36533
-
大量ファイル時のクエリパフォーマンス低下問題を修正 #36431
-
Iceberg のタイムスタンプ列タイプ読み取り時のタイムゾーン問題を修正 #36435
-
Iceberg table での DATETIME 変換エラーとデータパスエラーを修正。#35708
-
table Valued Functions の追加ユーザー定義プロパティの保持と S3 SDK への渡しをサポート。#35515
データインポート
-
CANCEL LOADが動作しない問題を修正 #35352 -
読み込みトランザクションの Publish フェーズでの null ポインタエラーが読み込み完了を妨げる問題を修正 #35977
-
HTTP 経由で送信される大きなデータファイルの bRPC シリアライゼーションに関する問題を修正 #36169
データ管理
-
マスター FE への DDL または DML 転送後に ConnectionContext のリソースタグが設定されない問題を修正。#35618
-
lower_case_table_namesが有効な場合に復元テーブル名が間違っている問題を修正 #35508 -
admin clean trashが動作しない問題を修正 #35271 -
パーティションからストレージポリシーを削除できない問題を修正 #35874
-
マルチレプリカ自動パーティションテーブルへのインポート時のデータ損失問題を修正 #36586
-
古いオプティマイザーを使用して自動パーティションテーブルをクエリまたは挿入する際にテーブルのパーティション列が変更される問題を修正 #36514
メモリ管理
-
Cgroup meminfo の取得失敗によりログに頻繁なエラーが出る問題を修正。#35425
-
BloomFilter 使用時に Segment キャッシュサイズが制御されず、プロセスメモリが異常に増加する問題を修正。#34871
権限
-
大文字小文字を区別しないテーブル名有効化後に権限設定が無効になる問題を修正。#36557
-
非マスター FE ノード経由での LDAP パスワード設定が効かない問題を修正。#36598
-
SELECT COUNT(*)文の認証がチェックできない問題を修正。#35465
その他
-
MySQL 接続が壊れた場合にクライアント JDBC プログラムが接続をクローズできない問題を修正。#36616
-
SHOW PROCEDURE STATUS文での MySQL プロトコル互換性問題を修正。#35350 -
libeventが特定の状況での接続リーク問題を解決するために Keepalive を強制するようになりました。#36088
クレジット
このリリースに貢献してくださったすべての方に感謝します。
@airborne12, @amorynan, @AshinGau, @BePPPower, @BiteTheDDDDt, @ByteYue, @caiconghui, @CalvinKirs, @cambyzju, @catpineapple, @cjj2010, @csun5285, @DarvenDuan, @dataroaring, @deardeng, @Doris-Extras, @eldenmoon, @englefly, @feiniaofeiafei, @felixwluo, @freemandealer, @Gabriel39, @gavinchou, @GoGoWen, @HappenLee, @hello-stephen, @hubgeter, @hust-hhb, @jacktengg, @jackwener, @jeffreys-cat, @Jibing-Li, @kaijchen, @kaka11chen, @Lchangliang, @liaoxin01, @LiBinfeng-01, @lide-reed, @luennng, @luwei16, @mongo360, @morningman, @morrySnow, @mrhhsg, @Mryange, @mymeiyi, @nextdreamblue, @platoneko, @qidaye, @qzsee, @seawinde, @shuke987, @sollhui, @starocean999, @suxiaogang223, @TangSiyang2001, @Thearas, @Vallishp, @w41ter, @wangbo, @whutpencil, @wsjz, @wuwenchi, @xiaokang, @xiedeyantu, @XieJiann, @xinyiZzz, @XuPengfei-1020, @xy720, @xzj7019, @yiguolei, @yongjinhou, @yujun777, @Yukang-Lian, @Yulei-Yang, @zclllyybb, @zddr, @zfr9527, @zgxme, @zhangbutao, @zhangstar333, @zhannngchen, @zhiqiang-hhhh, @zy-kkk, @zzzxl1993