所以,我在一开始所提到的前提,mysql需要开启独立表空间。这个假设,百分九十的情况下是成立的。如果真的遇到了,你们公司的mysql采用的是共享表空间的情况,请你和你们家的运维谈谈心,问问为啥用共享表空间。
假设,我们有datadir = /data/mysql/
,另外,我们有有一个database
,名为mytest
。在数据库mytest
中,有一个表,名为erp
,执行下列命令
mysql> system ls -l /data/mysql/mytest/
得到下面的输出(我过滤了一下)
-rw-r----- 1 mysql mysql 9023 8 18 05:21 erp.frm -rw-r----- 1 mysql mysql 2356792000512 8 18 05:21 erp.ibd
frm
和ibd
的作用,上面介绍过了。现在就是erp.ibd
文件太大,所以删除卡住了。
如何解决这个问题呢?
这里需要利用了linux中硬链接的知识,来进行快速删除。下面容我上《鸟哥的私房菜》中的一些内容,
软链接其实大家可以类比理解为windows中的快捷方式,就不多介绍了,主要介绍一下硬链接。
至于这个硬链接,我简单说一下,不想贴一大堆话过来,看起来太累。
就是对于真正存储的文件来说,有一个
然后呢有一个文件名
指向上面的node Index
那么,所谓的硬链接,就是不止一个文件名
指向node Index
,有好几个文件名
指向node Index
。
假设,这会又有一个文件名
指向上面的node Index
,即
这个时候,你做了删除文件名(1)
的操作,linux系统检测到,还有一个文件名(2)
指向node Index
,因此并不会真正的把文件删了,而是把步骤(2)
的引用给删了,这步操作非常快,毕竟只是删除引用。于是图就变成了这样
接下来,你再做删除文件名(2)
的操作,linux系统检测到,没有其他文件名
指向该node Index
,就会删除真正的存储文件,这步操作,是删真正的文件,所以比较慢。
OK,我们用的就是上面的原理。
先给erp.ibd
建立一个硬链接,利用ln
命令
mysql> system ln /data/mysql/mytest/erp.ibd /data/mysql/mytest/erp.ibd.hdlk
此时,文件目录如下所示
-rw-r----- 1 mysql mysql 9023 8 18 05:21 erp.frm -rw-r----- 2 mysql mysql 2356792000512 8 18 05:21 erp.ibd -rw-r----- 2 mysql mysql 2356792000512 8 18 05:21 erp.ibd.hdlk
你会发现,多了一个erp.ibd.hdlk
文件,且erp.ibd
和erp.ibd.hdlk
的inode均为2。
此时,你执行drop table
操作
mysql> drop table erp; Query OK, 0 rows affected (0.99 sec)
你会发现,不到1秒就删除了。因为,此时有两个文件名称(erp.ibd
和erp.ibd.hdlk
),同时指向一个inode.这个时候,执行删除操作,只是把引用给删了,所以非常快。
那么,这时的删除,已经把table从mysql中删除。但是磁盘空间,还没释放,因为还剩一个文件erp.ibd.hdlk
。
如何正确的删除erp.ibd.hdlk
呢?
如果你没啥经验,一定会回答我,用rm
命令来删。这里需要说明的是,在生产环境,直接用rm
命令来删大文件,会造成磁盘IO开销飙升,CPU负载过高,是会影响其他程序运行的。
那么,这种时候,就是应该用truncate
命令来删,truncate
命令在coreutils
工具集中。
详情,大家可以去百度一下,有人对rm
和truncate
命令,专程测试过,truncate
命令对磁盘IO,CPU
负载几乎无影响。
删除脚本如下
TRUNCATE=/usr/local/bin/truncate for i in `seq 2194 -10 10 `; do sleep 2 $TRUNCATE -s ${i}G /data/mysql/mytest/erp.ibd.hdlk done rm -rf /data/mysql/mytest/erp.ibd.hdlk ;
从2194G开始,每次缩减10G,停2秒,继续,直到文件只剩10G,最后使用rm
命令删除剩余的部分。