官方地址
什么是ClickHouse? | ClickHouse Docs
介绍
ClickHouse是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)。
这里直接用官方的图来展示ck在分析统计时的性能对比行式存储:
行式
列式
是不是有种咻~ ~ ~ 咻~ ~ ~ 咻 ~ ~ ~ 的感觉。。。
主要特性
引用官方文档:
ClickHouse的特性 | ClickHouse Docs
- 真正的列式存储
- 数据压缩
- 数据的磁盘存储
- 多核心并发处理
- 多服务器分布式处理
- 只是SQL
- 向量引擎
- 适合在线查询
- 支持近似计算
- 自适应连接算法
- 支持数据复制和数据完整性
适用场景
因为ClickHouse在诞生之初是为了服务Yandex自家的Web流量分析产品Yandex.Metrica,所以在存储数据超过20万亿行的情况下,ClickHouse做到了90%的查询都能够在1秒内返回的惊人之举。随后,ClickHouse进一步被应用到Yandex内部大大小小数十个其他的分析场景中。可以说ClickHouse具备了人们对一款高性能OLAP数据库的美好向往,所以它基本能够胜任各种数据分析类的场景,并且随着数据体量的增大,它的优势也会变得越为明显。
ClickHouse非常适用于商业智能领域(也就是我们所说的BI领域),除此之外,它也能够被广泛应用于广告流量、Web、App流量、电信、金融、电子商务、信息安全、网络游戏、物联网等众多其他领域。
限制
- 没有完整的事务支持。
- 缺少高频率,低延迟的修改或删除已存在数据的能力。仅能用于批量删除或修改数据,但这符合 GDPR。
- 稀疏索引使得ClickHouse不适合通过其键检索单行的点查询。