メインコンテンツまでスキップ

Tableau

TableauでApache Dorisにアクセスできるようにするには、TableauのオフィシャルMySQLコネクターがお客様のニーズを満たします。このコネクターはMySQL JDBCドライバーを使用してデータにアクセスします。

MySQLコネクター経由で、TableauはApache Dorisのデータベースとテーブルをデータソースとして統合できます。この機能を有効にするには、以下の設定ガイドに従ってください:

  • 使用前に必要な設定
  • TableauでのApache Dorisデータソースの設定
  • Tableauでの可視化の構築
  • 接続と使用のヒント

TableauとJDBCドライバーのインストール

  1. Tableau desktopをダウンロードしてインストールします。
  2. MySQL JDBC(バージョン8.3.0)を取得します。
  3. JDBCドライバー配置パス
    • macOS: JDBCドライバーJARファイル配置パス: ~/Library/Tableau/Drivers
    • Windows: tableau_pathがWindowsオペレーティングシステムでのTableauインストールディレクトリーであると仮定すると、通常のデフォルトは: tableau_path = C:\Program Files\Tableau、そしてJDBCドライバーJARファイル配置パスは: %tableau_path%\Drivers\

次に、TableauでDorisデータソースを設定し、データ可視化の構築を開始できます!

TableauでのDorisデータソースの設定

JDBCとConnectorドライバーをインストールして設定したので、Dorisのtpchデータベースに接続するTableauのデータソースを定義する方法を見てみましょう。

  1. 接続詳細の収集

JDBC経由でApache Dorisに接続するには、以下の情報が必要です:

ParameterMeaningExample
サーバーデータベースホスト127.0.1.28
PortデータベースMySQLポート9030
Databaseデータベース名tpch
Usernameユーザー名testuser
Passwordパスワード空白のままにする
Init SQL Statement初期SQL文select * from database.table
  1. Tableauを起動します。(すでに実行中の場合は、再起動してください。)
  2. 左側のメニューから、To a サーバーセクションの下のMoreをクリックします。利用可能なコネクターのリストでmysqlを検索します。

  1. MySQLをクリックすると、以下のダイアログボックスが表示されます:

  1. ダイアログボックスのプロンプトに従って、対応する接続情報を入力します。
  2. 上記の入力ボックスを完了したら、Sign Inボタンをクリックします。新しいTableauワークブックが表示されるはずです。

次に、Tableauでいくつかの可視化を構築できます!

Tableauでの可視化の構築

データソースとしてTPC-Hデータを選択しました。Doris TPC-Hデータソースの構築手順については、このドキュメントを参照してください。

TableauでDorisデータソースを設定したので、データを可視化しましょう。

  1. customerordersテーブルをワークブックにドラッグします。次に、下のテーブル関連付けにCustkeyフィールドを選択します。
  2. nationテーブルをワークブックにドラッグし、Nationkeyフィールドを選択してcustomerテーブルと関連付けます。
  3. これでcustomerordersnationテーブルをデータソースとしてリンクしたので、この関係を使用してデータ関連の問題に取り組むことができます。ワークブックの下部にあるSheet 1タブを選択してワークベンチにアクセスします。
  4. 各年の総ユーザー数を知りたいとします。ordersからOrderDateをColumns領域(水平フィールド)にドラッグし、次にcustomerからcustomer(count)をRowsにドラッグします。Tableauは以下の折れ線グラフを生成します:

シンプルな折れ線グラフが完成しました。ただし、このデータセットは実際のデータではなく、tpchスクリプトとデフォルトルールによって自動生成されており、使いやすさのテスト用です。

  1. 地域(国)と年別の平均注文金額(USD)を知りたいとします:
    • New Worksheetタブをクリックして新しいテーブルを作成
    • nationテーブルからNameをRowsにドラッグ
    • ordersテーブルからOrderDateをColumnsにドラッグ

以下が表示されるはずです:

  1. 注意:このアイコンに集計ロジックを定義していないため、Abc値は単に入力された値です。そのため、メジャーをテーブルにドラッグする必要があります。ordersテーブルからTotalpriceをテーブルの中央にドラッグします。デフォルトの計算はTotalpricesのSUMであることに注意してください:
  2. SUMをクリックし、MeasureAverageに変更します。
  3. 同じドロップダウンメニューから、Formatを選択し、NumbersCurrency (Standard)に変更します
  4. 期待通りのテーブルが得られます。

この時点で、TableauがApache Dorisに正常に接続され、データ分析とダッシュボード作成が可能になりました。

接続と使用のヒント

パフォーマンス最適化

  • 実際のニーズに基づいてDorisデータベーステーブルを適切に作成し、時間でパーティショニングとバケッティングを行い、述語フィルタリングとほとんどのデータ転送を効果的に削減します。
  • Doris側でマテリアライズドビューを作成することで、適切なデータ事前集計を実現できます。
  • 更新計算リソース消費とダッシュボードデータの適時性のバランスを取るため、合理的な更新スケジュールを設定します。

セキュリティ設定

  • パブリックネットワークアクセスによって導入されるセキュリティリスクを回避するため、VPCプライベート接続の使用をお勧めします。
  • アクセスを制限するためセキュリティグループを設定します。
  • SSL/TLS接続およびその他のアクセス方法を有効にします。
  • 過度の権限委任を避けるため、Dorisユーザーアカウントの役割とアクセス権限を細かく調整します。