大家好,我是奇想派,可以叫我奇奇。
将数据进行聚合是分析数据库的一项关键功能。我们无法从数十亿次的访问量列表数据列表中得出太多结论。但是,我们可以很容易地理解,本月的平均访问量从上个月日活100到这个有日活1000。在ClickHouse中,我们将此类汇总称为聚合,这是从大型数据集中掌握意义的基本方法。
在本博客系列中,我们将探讨聚合在 ClickHouse 中的工作原理、如何衡量其性能以及如何使其更快、更高效。为了便于阅读,我们将使用简单的示例,但它们显示的原则适用于更复杂的查询。
实验前提:
- ClickHouse 版本: 22.1.3.7
- 操作系统:centos7.8