メインコンテンツまでスキップ

Tableau

Apache DorisへのTableauアクセスを有効にするために、TableauのオフィシャルMySQLコネクタがニーズを満たします。このコネクタはMySQL JDBCドライバーを使用してデータにアクセスします。

MySQLコネクタを通じて、TableauはApache Dorisデータベースとテーブルをデータソースとして統合できます。この機能を有効にするには、以下のセットアップガイドに従ってください:

  • 使用前の必要なセットアップ
  • TableauでのApache Dorisデータソースの設定
  • Tableauでの可視化の構築
  • 接続と使用のヒント

Tableauと JDBCドライバーのインストール

  1. Tableau desktopをダウンロードしてインストールします。
  2. MySQL JDBC(バージョン8.3.0)を取得します。
  3. JDBCドライバー配置パス
    • macOS: JDBCドライバーJARファイル配置パス: ~/Library/Tableau/Drivers
    • Windows: tableau_pathがWindowsオペレーティングシステムでのTableauインストールディレクトリと仮定すると、一般的にデフォルトは: tableau_path = C:\Program Files\Tableau、JDBCドライバーJARファイル配置パスは: %tableau_path%\Drivers\

次に、TableauでDorisデータソースを設定し、データ可視化の構築を開始できます!

TableauでのDorisデータソースの設定

JDBCとConnectorドライバーをインストールして設定したので、Dorisのtpchデータベースに接続するTableauでデータソースを定義する方法を見てみましょう。

  1. 接続詳細の収集

JDBCを介してApache Dorisに接続するには、以下の情報が必要です:

ParameterMeaningExample
サーバーデータベースホスト127.0.1.28
PortデータベースMySQLポート9030
Databaseデータベース名tpch
Usernameユーザー名testuser
Passwordパスワード空白のままにする
Init SQL Statement初期SQL文select * from database.table
  1. Tableauを開始します。(すでに実行中の場合は、再起動してください。)
  2. 左側のメニューから、To a サーバーセクションの下にあるMoreをクリックします。利用可能なコネクタのリストでmysqlを検索します。

  1. MySQLをクリックすると、以下のダイアログボックスが表示されます:

  1. ダイアログボックスのプロンプトに従って、対応する接続情報を入力します。
  2. 上記の入力ボックスを完了したら、Sign Inボタンをクリックします。新しいTableauワークブックが表示されるはずです。

次に、Tableauでいくつかの可視化を構築できます!

Tableauでの可視化の構築

データソースとしてTPC-Hデータを選択しました。Doris TPC-Hデータソースの構築手順については、このドキュメントを参照してください。

TableauでDorisデータソースを設定したので、データを可視化してみましょう。

  1. customerordersテーブルをワークブックにドラッグします。その後、下のテーブル関連付けでCustkeyフィールドを選択します。
  2. nationテーブルをワークブックにドラッグし、Nationkeyフィールドを選択してcustomerテーブルと関連付けます。
  3. これでcustomerordersnationテーブルをデータソースとしてリンクしたので、この関係を使用してデータ関連の問題に取り組むことができます。ワークベンチにアクセスするには、ワークブックの下部にあるSheet 1タブを選択します。
  4. 毎年の総ユーザー数を知りたいとします。ordersからOrderDateをColumns領域(水平フィールド)にドラッグし、次にcustomerからcustomer(count)をRowsにドラッグします。Tableauは以下の線グラフを生成します:

シンプルな線グラフが完成しました。ただし、このデータセットは実際のデータではなく、tpchスクリプトとデフォルトルールによって自動生成されたもので、使いやすさのテスト用です。

  1. 地域(国)と年別の平均注文金額(USD)を知りたいとします:
    • New Worksheetタブをクリックして新しいテーブルを作成
    • nationテーブルからNameをRowsにドラッグ
    • ordersテーブルからOrderDateをColumnsにドラッグ

以下が表示されるはずです:

  1. 注意:Abc値は、このアイコンに集計ロジックを定義していないため、単に入力された値です。そのため、メジャーをテーブルにドラッグする必要があります。ordersテーブルからTotalpriceをテーブルの中央にドラッグします。デフォルトの計算はTotalpricesのSUMであることに注意してください:
  2. SUMをクリックしてMeasureAverageに変更します。
  3. 同じドロップダウンメニューからFormatを選択し、NumbersCurrency (Standard)に変更します
  4. 期待するテーブルが得られます。

この時点で、TableauがApache Dorisに正常に接続され、データ分析とダッシュボード作成が可能になりました。

接続と使用のヒント

パフォーマンス最適化

  • 実際のニーズに基づいてDorisデータベーステーブルを適切に作成し、時間で分割とバケット化を行い、述語フィルタリングとほとんどのデータ転送を効果的に削減します。
  • Doris側でマテリアライズドビューを作成することで、適切なデータ事前集計を実現できます。
  • 更新計算リソース消費とダッシュボードデータの適時性のバランスを取るため、合理的な更新スケジュールを設定します。

セキュリティ設定

  • パブリックネットワークアクセスによって導入されるセキュリティリスクを回避するため、VPCプライベート接続の使用を推奨します。
  • アクセスを制限するためにセキュリティグループを設定します。
  • SSL/TLS接続およびその他のアクセス方法を有効にします。
  • 権限の過度な委任を避けるため、Dorisユーザーアカウントロールとアクセス権限を細かく調整します。