メインコンテンツまでスキップ

Tableau

TableauでApache Dorisへのアクセスを有効にするには、Tableauの公式MySQLコネクタが要件を満たします。このコネクタはMySQL JDBCドライバを使用してデータにアクセスします。

MySQLコネクタを通じて、TableauはApache Dorisのデータベースとテーブルをデータソースとして統合できます。この機能を有効にするには、以下のセットアップガイドに従ってください:

  • 使用前の必要なセットアップ
  • TableauでのApache Dorisデータソースの設定
  • Tableauでの可視化の構築
  • 接続と使用のヒント

TableauとJDBCドライバのインストール

  1. Tableau desktopをダウンロードしてインストールします。
  2. MySQL JDBC(バージョン8.3.0)を取得します。
  3. JDBCドライバ配置パス
    • macOS:JDBCドライバJARファイルの配置パス:~/Library/Tableau/Drivers
    • Windows:tableau_pathをWindowsオペレーティングシステム上のTableauインストールディレクトリとすると、一般的にデフォルトは:tableau_path = C:\Program Files\Tableau、JDBCドライバJARファイルの配置パスは:%tableau_path%\Drivers\

次に、TableauでDorisデータソースを設定し、データ可視化の構築を開始できます!

TableauでのDorisデータソースの設定

JDBCとConnectorドライバをインストールして設定したので、Dorisのtpchデータベースに接続するTableauのデータソースを定義する方法を見てみましょう。

  1. 接続詳細の収集

JDBC経由でApache Dorisに接続するには、以下の情報が必要です:

ParameterMeaningExample
サーバーデータベースホスト127.0.1.28
PortデータベースMySQLポート9030
Databaseデータベース名tpch
Usernameユーザー名testuser
Passwordパスワード空白のままにする
Init SQL Statement初期SQL文select * from database.table
  1. Tableauを起動します。(既に実行中の場合は、再起動してください。)
  2. 左側のメニューから、To a サーバーセクション下のMoreをクリックします。利用可能なコネクタのリストでmysqlを検索します。

  1. MySQLをクリックすると、以下のダイアログボックスが表示されます:

  1. ダイアログボックスのプロンプトに従って、対応する接続情報を入力します。
  2. 上記の入力ボックスを完了した後、Sign Inボタンをクリックします。新しいTableauワークブックが表示されるはずです。

次に、Tableauでいくつかの可視化を構築できます!

Tableauでの可視化の構築

データソースとしてTPC-Hデータを選択しました。Doris TPC-Hデータソースの構築手順については、このドキュメントを参照してください。

TableauでDorisデータソースを設定したので、データを可視化してみましょう。

  1. customerordersテーブルをワークブックにドラッグします。次に、下のテーブル関連付けでCustkeyフィールドを選択します。
  2. nationテーブルをワークブックにドラッグし、Nationkeyフィールドを選択してcustomerテーブルと関連付けます。
  3. これでcustomerordersnationテーブルをデータソースとしてリンクしたので、この関係を使用してデータ関連の問題に取り組むことができます。ワークベンチにアクセスするには、ワークブックの下部にあるSheet 1タブを選択します。
  4. 各年のユーザー総数を知りたいとします。ordersからOrderDateをColumns領域(水平フィールド)にドラッグし、次にcustomerからcustomer(count)をRowsにドラッグします。Tableauは以下の折れ線グラフを生成します:

簡単な折れ線グラフが完成しました。ただし、このデータセットは実際のデータではなく、tpchスクリプトとデフォルトルールによって自動生成されたもので、使用性のテスト用です。

  1. 地域(国)と年別の平均注文金額(USD)を知りたいとします:
    • 新しいテーブルを作成するためにNew Worksheetタブをクリック
    • nationテーブルからNameをRowsにドラッグ
    • ordersテーブルからOrderDateをColumnsにドラッグ

以下が表示されるはずです:

  1. 注意:Abcの値は、このアイコンに集計ロジックを定義していないため、単に入力された値です。そのため、メジャーをテーブルにドラッグする必要があります。ordersテーブルからTotalpriceをテーブルの中央にドラッグします。デフォルトの計算はTotalpricesのSUMであることに注意してください:
  2. SUMをクリックし、MeasureAverageに変更します。
  3. 同じドロップダウンメニューからFormatを選択し、NumbersCurrency (Standard)に変更します
  4. 期待に沿ったテーブルが得られます。

この時点で、TableauがApache Dorisに正常に接続され、データ分析とダッシュボード作成が可能になりました。

接続と使用のヒント

パフォーマンス最適化

  • 実際のニーズに基づいてDorisデータベーステーブルを適切に作成し、時間でパーティション化とバケット化を行い、述語フィルタリングと大部分のデータ転送を効果的に削減します。
  • Doris側でマテリアライズドビューを作成することで、適切なデータ事前集計を実現できます。
  • 更新計算リソース消費とダッシュボードデータの適時性のバランスを取るために、合理的な更新スケジュールを設定します。

セキュリティ設定

  • パブリックネットワークアクセスによるセキュリティリスクを回避するため、VPCプライベート接続の使用を推奨します。
  • アクセスを制限するためにセキュリティグループを設定します。
  • SSL/TLS接続およびその他のアクセス方法を有効にします。
  • 過度な権限委譲を避けるため、Dorisユーザーアカウントの役割とアクセス権限を細かく調整します。