linux 快速删除大量/大文件 Dear 丶 2021-06-24 14:35 789阅读 0赞 1、快速删除大量文件: 假如你要在linux下删除大量文件,比如100万、1000万,像/var/spool/clientmqueue/的mail邮件,/usr/local/nginx/proxy\_temp的nginx缓存等,那么rm -rf \*可能就不好使了。 rsync 可以用来清空目录或文件,如下: 1)先建立一个空目录 mkdir/data/blank 2)用rsync删除目标目录 rsync--delete-before -d /data/blank/ /var/spool/clientmqueue/ 这样目标目录很快就被清空了 注:其中--delete-before 接收者在传输之前进行删除操作 2、快速删除大文件: 假如你有一些特别大的文件要删除,比如nohup.out这样的实时更新的文件,动辄都是几十个G上百G的,也可以用rsync来清空大文件,而且效率比较高。 1)创建空文件 touch/data/blank.txt 2)用rsync清空文件 rsync-a --delete-before --progress --stats /root/blank.txt /root/nohup.out 3、为什么rsync能够快速删除大文件? 1)rm命令大量调用了lstat64和unlink,可以推测删除每个文件前都从文件系统中做过一次lstat操作。过程:正式删除工作的第一阶段,需要通过getdirentries64调用,分批读取目录(每次大约为4K),在内存中建立rm的文件列表;第二阶段,lstat64确定所有文件的状态;第三阶段,通过unlink执行实际删除。这三个阶段都有比较多的系统调用和文件系统操作。 2)rsync所做的系统调用很少:没有针对单个文件做lstat和unlink操作。命令执行前期,rsync开启了一片共享内存,通过mmap方式加载目录信息。只做目录同步,不需要针对单个文件做unlink。 另外,在其他人的评测里,rm的上下文切换比较多,会造成System CPU占用较多——对于文件系统的操作,简单增加并发数并不总能提升操作速度。 总结:频繁做减法不如直接从头来过 把文件系统的目录与书籍的目录做类比,rm删除内容时,将目录的每一个条目逐个删除(unlink),需要循环重复操作很多次;rsync删除内容时,建立好新的空目录,替换掉老目录,基本没开销。
还没有评论,来说两句吧...