天翼云云数据库ClickHouse中集群(Cluster)、分片(Shard)、副本(Replica)等名词解析
文档简介:
本页解释云数据库ClickHouse中的专业术语。
云数据库ClickHouse中涉及多个专业术语,在本页面进行详细解释
集群(Cluster):在物理构成上,ClickHouse集群是由多个ClickHouse server服务器节点组成的
分布式数据库。
分片(Shard):ClickHouse集群就数据分散存储到多台服务器上,每台服务器存储和处理数据的
一部分,每个分片可包含单个或多个服务器。
云数据库ClickHouse中涉及多个专业术语,在本页面进行详细解释
术语名称 | 术语解释 |
---|---|
集群(Cluster) |
在物理构成上,ClickHouse集群是由多个ClickHouse server服务器节点组成的 分布式数据库。 |
分片(Shard) |
ClickHouse集群就数据分散存储到多台服务器上,每台服务器存储和处理数据的 一部分,每个分片可包含单个或多个服务器。 |
副本(Replica) |
数据副本,ClickHouse提供副本机制,将数据冗余存储至2台或多台服务器上, 提高数据可靠性。 |
数据库(DataBase) |
ClickHouse集群逻辑上包含多个数据库,每个数据库内部包含表、列、视图、 函数等。 |
表(Table) |
表是数据的组织形式。ClickHouse的表从数据分布方式区为本地表、分布式表。 从存储引擎区分为单机表、复制表。 |
本地表(Local Table) | 本地表的数据,只会存储在当前写入的节点上,不会被分散到多台机器。 |
分布式表(Distributed Table) |
分布式表是本地表的集合,将本地表抽象为一张统一的表,对外提供写入、查询 功能。当写入分布式表时,数据会被自动分发到集合中的各个本地表中;当查询 分布式表时,集合中的各个本地表都会被分别查询,并且把最终结果汇总后返回。 本地表与分布式表的区别在于:本地表的写入和查询,受限于单台服务器的存储、 计算资源,不具备横向拓展能力;而分布式表的写入和查询,则可以利用多台服 务器的存储、计算资源,具有较好的横向拓展能力。 |
表引擎 |
表引擎即表类型,决定数据的存储方式和位置、支持的查询以及访问、索引、主 备复制等特性。ClickHouse提供了多种表引擎,主要为以下4个系列。 MergeTree系列:核心存储引擎,最通用和功能最强大的表引擎,支持数据 Replicated和Distributed。 Log系列:功能相对简单,主要用于快速写入小表(1百万行左右的表), 然后全部读出的场景。 Integration系列:主要用于将外部数据如Kafka、HDFS、Mysql导入到 ClickHouse中,或者在ClickHouse中直接操作外部数据源。 Special系列:为特定场景而定制,如数据内存存储、为目标表配置buffer、数 据存本地文件等。 |
单机表 | 单机表的数据,只会存储在当前机器上,不会被复制到其他机器。 |
复制表 | 复制表的数据,会被自动复制到多台机器上,形成多个副本。 |