clickhouse清理简单总结
本文最后更新于:几秒前
clickhouse清理简单总结
背景:clickhouse磁盘占用过大,需要清理以腾出可用空间,对clickhouse不太熟悉,记录一下处理过程,以供参考
- 先查看哪些表占用空间最多:
1 | |

查询结果如上,query_thread_log,query_log是 ClickHouse 的系统操作日志表,占用空间很大,基本可以判断是日志保留时间过长或配置异常导致的。
delete删除很慢,大表的情况下几乎不能使用,(保险些)不清除全表的情况下可以按分区清理。先确认下这个表是否有分区。
1 | |
建表结果如下:
1 | |
看出,确实按照event_time进行分区。
- 我们可以先来清理历史分区
1 | |
- 使用sql查询已有分区也会卡住,可以查看目录文件确认有哪些分区
1 | |
可以看到如下目录(看起来一直没有清理过):
6. 同样地,query_log也可以清理
进一步,可以创建定时任务,来定时清理过期的日志文件,保持磁盘空间。
若确认近期的日志也不需要,则可以直接清空整张表
1 | |
clickhouse清理简单总结
https://blog.caozeal.cn/2025/05/19/clickhouse清理简单总结/