跳到主要内容

概览

创建表

使用 CREATE TABLE 语句在 Doris 中创建一个表,也可以使用 CREATE TABKE LIKECREATE TABLE AS 子句从另一个表派生表定义。

表名

Doris 中表名默认是大小写敏感的,可以在第一次初始化集群时配置lower_case_table_names为大小写不敏感的。默认的表名最大长度为 64 字节,可以通过配置table_name_length_limit更改,不建议配置过大。创建表的语法请参考CREATE TABLE

表属性

Doris 的建表语句中可以指定建表属性,包括:

  • 分桶数 (buckets):决定数据在表中的分布;

  • 存储介质 (storage_medium):控制数据的存储方式,如使用 HDD、SSD 或远程共享存储;

  • 副本数 (replication_num):控制数据副本的数量,以保证数据的冗余和可靠性;

  • 冷热分离存储策略 (storage_policy) :控制数据的冷热分离存储的迁移策略;

这些属性作用于分区,即分区创建之后,分区就会有自己的属性,修改表属性只对未来创建的分区生效,对已经创建好的分区不生效,关于属性更多的信息请参考修改表属性

注意事项

  1. 选择合适的数据模型:数据模型不可更改,建表时需要选择一个合适的数据模型

  2. 选择合适的分桶数:已经创建的分区不能修改分桶数,可以通过替换分区来修改分桶数,可以修改动态分区未创建的分区分桶数;

  3. 添加列操作:加减 VALUE 列是轻量级实现,秒级别可以完成,加减 KEY 列或者修改数据类型是重量级操作,完成时间取决于数据量,大规模数据下尽量避免加减 KEY 列或者修改数据类型;

  4. 优化存储策略:可以使用层级存储将冷数据保存到 HDD 或者 S3 / HDFS。