メインコンテンツまでスキップ

Tableau Back

VeloDBは公式のTableau Dorisコネクタを提供しています。このコネクタはMySQL JDBC Driverに基づいてデータにアクセスします。

このコネクタはTDVTフレームワークによって100%のパス率でテストされています。

このコネクタを使用することで、TableauはApache Dorisデータベースとテーブルをデータソースとして統合できます。これを有効にするには、以下のセットアップガイドに従ってください:

  • TableauとDorisコネクタのインストール
  • TableauでのApache Dorisデータソースの構成
  • Tableauでの可視化の構築
  • 接続と使用のヒント
  • まとめ

TableauとDorisコネクタのインストール

  1. Tableau desktopをダウンロードしてインストールします。
  2. tableau-dorisカスタムコネクタ(doris_jdbc-***.taco)を取得します。
  3. MySQL JDBC(バージョン8.3.0)を取得します。
  4. ConnectorとJDBCドライバを配置する場所 MacOS:
    • このパス:~/Documents/My Tableau Repository/Connectorsを参照し、doris_jdbc-latest.tacoカスタムコネクタファイルを配置します(パスが存在しない場合は、必要に応じて手動で作成してください)。
    • JDBCドライバjarの配置パス:~/Library/Tableau/Drivers Windows: tableau_pathをWindowsでのTableauインストールディレクトリと仮定し、 通常のデフォルト値:tableau_path = C:\Program Files\Tableau
    • このパス:%tableau_path%``\Connectors\を参照し、doris_jdbc-latest.tacoカスタムコネクタファイルを配置します(パスが存在しない場合は、必要に応じて手動で作成してください)。
    • JDBCドライバjarの配置パス:%tableau_path%\Drivers\

次に、TableauでDorisデータソースを構成し、データ可視化の構築を開始できます!

TableauでのDorisデータソースの構成

JDBCとConnectorドライバをインストールして設定したので、Dorisのtpchデータベースに接続するTableauでのデータソースの定義方法を見てみましょう。

  1. 接続詳細を収集する

JDBC経由でApache Dorisに接続するには、以下の情報が必要です:

パラメータ意味
サーバーデータベースホスト127.0.1.28
PortデータベースMySQLポート9030
カタログDoris カタログ、外部テーブルとデータレイクのクエリ時に使用、Advancedで設定internal
Databaseデータベース名tpch
認証データベース認証方法を選択:Username / Username and PasswordUsername and Password
Usernameユーザー名testuser
Passwordパスワード空白のまま
Init SQL Statement初期SQL文select * from database.table
  1. Tableauを起動します。(コネクタを配置する前に既に実行していた場合は、再起動してください。)
  2. 左側のメニューから、To a サーバーセクションの下にあるMoreをクリックします。利用可能なコネクタのリストで、Doris JDBC by VeloDBを検索します:

  1. Doris by VeloDBをクリックすると、以下のダイアログがポップアップします:

  1. ダイアログのプロンプトに従って対応する接続情報を入力します。

  2. オプションの高度な構成:

    • データソースを定義するためにInitial SQLでプリセットSQLを入力できます
    • Advancedでは、カタログを使用してデータレイクデータソースにアクセスできます;デフォルト値はinternalです、
  3. 上記の入力フィールドを完了した後、Sign Inボタンをクリックすると、新しいTableauワークブックが表示されます:

次に、Tableauでいくつかの可視化を構築できます!

Tableauでの可視化の構築

データソースとしてTPC-Hデータを選択し、Doris TPC-Hデータソースの構築方法についてはこのドキュメントを参照してください

TableauでDorisデータソースを構成したので、データを可視化してみましょう

  1. customerテーブルとordersテーブルをワークブックにドラッグします。そして下でテーブル結合フィールドCustkeyを選択します

  1. nationテーブルをワークブックにドラッグし、customerテーブルとのテーブル結合フィールドNationkeyを選択します
  2. customerテーブル、ordersテーブル、nationテーブルをデータソースとして関連付けたので、この関係を使用してデータに関する質問を処理できます。ワークブックの下部にあるSheet 1タブを選択してワークスペースに入ります。
  3. 年別のユーザー数の要約を知りたいとします。ordersからOrderDateをColumnsエリア(水平フィールド)にドラッグし、次にcustomerからcustomer(count)をRowsにドラッグします。Tableauは以下の線グラフを生成します:

簡単な線グラフが完成しましたが、このデータセットはtpchスクリプトとデフォルトルールによって自動生成されており、実際のデータではありません。参考用ではなく、可用性をテストすることを意図しています。

  1. 地域(国)と年別の平均注文額(USD)を知りたいとします:
    • New Worksheetタブをクリックして新しいシートを作成します
    • nationテーブルからNameをRowsにドラッグします
    • ordersテーブルからOrderDateをColumnsにドラッグします

以下が表示されます:

  1. 注意:Abc値は単なるプレースホルダー値です。そのマークに対して集計ロジックを定義していないため、テーブルにメジャーをドラッグする必要があります。ordersテーブルからTotalpriceをテーブルの中央にドラッグします。デフォルトの計算はTotalpricesでSUMを実行することに注意してください:
  2. SUMをクリックし、MeasureAverageに変更します。
  3. 同じドロップダウンメニューから、Formatを選択し、NumbersCurrency (Standard)に変更します:
  4. 期待に適うテーブルを取得します:

これまでに、TableauはApache Dorisに正常に接続され、データ分析と可視化ダッシュボードの作成が実現されました。

接続と使用のヒント

パフォーマンス最適化

  • 実際のニーズに応じて、合理的にdorisデータベースとテーブルを作成し、時間でパーティションとバケットを分割することで、述語フィルタリングと大部分のデータ送信を効果的に削減できます
  • Doris側でマテリアライズドビューを作成することで適切なデータ事前集計を行うことができます。
  • リフレッシュの計算リソース消費とダッシュボードデータの適時性のバランスを取るために、合理的なリフレッシュ計画を設定します

セキュリティ構成

  • パブリックネットワークアクセスによって導入されるセキュリティリスクを避けるため、VPCプライベート接続の使用を推奨します。
  • アクセスを制限するためにセキュリティグループを構成します。
  • SSL/TLS接続などのアクセス方法を有効にします。
  • 過度な権限委譲を避けるため、Dorisユーザーアカウントの役割とアクセス許可を細分化します。

まとめ

このコネクタは、汎用のODBC/JDBCドライバベースのコネクタの接続設定プロセスを簡素化し、Apache Dorisに対してより互換性の高いコネクタを提供します。コネクタの使用時に問題が発生した場合は、GitHubでお気軽にご連絡ください。