Apache Superset
介绍
Apache Superset 是一个开源的数据挖掘平台,支持丰富的数据源连接,多种可视化方式,并能够对用户实现细粒度的权限控制。该工具主要特点是可自助分析、自定义仪表盘、分析结果可视化(导出)、用户/角色权限控制,还集成了一个 SQL 编辑器,可以进行 SQL 编辑查询等。
在 Apache Superset 3.1 版本中正式支持了 Apache Doris 的内部数据和外部数据进行查询和可视化处理。
前置条件
确保您已完成如下工具安装:
-
在 Apache Superset 服务器上安装 Apache Doris 的 Python 客户端。
pip install pydoris
-
安装 Apache Superset 3.1 及其以上的版本。具体参见 安装 Superset 从 PyPI 库 或者 通过 Docker 容器的方式安装。
添加数据源
-
通过对应的启动端口对 Apache Superset 进行访问。
-
登陆后选择添加数据库连接。
-
在连接的弹窗页面中选择 Apache Doris。
-
在连接信息中填写 SQLAlchemy URI,并进行相关的连接验证。
当你在 Apache Superset 中创建数据源时,需要注意以下两点:
-
在 SUPPORTED DATABASES 里选择 Apache Doris 作为数据源。
-
在 SQLAlchemy URI 里,按如下 Apache Doris SQLAlchemy URI 格式填写 URI:
doris://<User>:<Password>@<Host>:<Port>/<Catalog>.<Database>
-
URI 参数说明如下:
-
User:用于登录 Apache Doris 集群的用户名,如 Admin。
-
Password:用于登录 Apache Doris 集群的用户密码。
-
Host:Apache Doris 集群的 FE 主机 IP 地址。
-
Port:Apache Doris 集群的 FE 查询端口,如 9030。
-
Catalog:Apache Doris 集群中的目标 Catalog。Internal Catalog 和 External Catalog 均支持。
-
Database:Apache Doris 集群中的目标数据库。内部数据库和外部数据库均支持。
-
-
当你使用最新的 Docker 镜像部署 Superset 时,如果发现找不到 Apache Doris 数据源,这个可能是因为 Apache Superset Docker Image 默认只包含基本的数据源构建,需要手动将 pydoris 包安装进来,您可以参考 Superset Docker 教程 中的 How to extend this image 步骤进行 Apache Superset 的部署。
-
推荐使用 Apache Doris 2.0.4 及以上版本。