背景
因项目需求,需要清理一批旧数据,腾出空间给新数据,让同事负责这件事。料想会很顺利,但很快找到我,并告知在postgresql中把一张大的数据表删除掉了,查询表的size并没有改变。
我震惊了,问他怎么删除数据表的数据的,他告诉我使用"DELETE FROM table",然后使用下面的语句进行查询
--数据库中单个表的大小(不包含索引) select pg_size_pretty(pg_relation_size('表名')); --查出所有表(包含索引)并排序 SELECT table_schema || '.' || table_name AS table_full_name, pg_size_pretty(pg_total_relation_size('"' || table_schema || '"."' || table_name || '"')) AS size FROM information_schema.tables ORDER BY pg_total_relation_size('"' || table_schema || '"."' || table_name || '"') DESC limit 20
我让他用truncate试试,他兴冲冲的跑去执行了,然后告诉我这个方法是可行的。
解决方式
这件事情结束后,总觉得不踏实。不搞清楚,睡觉不踏实,那就继续深挖挖。
delete应该没有被真正删除或者事务没有完成,空间没有释放,重新测试了一遍,发现等了半个小时,空间也没有释放,应该不是事务的问题,就是没有真正删除,而仅仅标识为已删除状态。
想要释放空间,怎么办呢?
postgresql提供了一个VACUUM命令,详见https://www.postgresql.org/docs/devel/sql-vacuum.html
总结
- truncate的删除效率远远高于delete from table
- Delete 是 DML, Truncate是DDL
- Delete 不释放空间, Truncate释放空间
- Delete 可以删除表的部分记录, Truncate删除整个表的记录
- Delete产生小量的redo日志和大量的undo日志. Truncate产生的redo和undo微乎其微。
参考资料
【1】https://stackoverflow.com/questions/139630/whats-the-difference-between-truncate-and-delete-in-sql