A veces nos encontramos con que el espacio disponible de nuestro disco disminuye sin una razón aparente. Puede haber varias razones pero una de las más extendidas es la de tener archivos duplicados.
Cuando organizamos nuestros archivos, principalmente de media como música o fotografías, puede ocurrir que sin querer acabemos teniendo un mismo archivo repetido en varias carpetas. La identificación de estos archivos duplicados resulta tediosa y por ello existen algunas herramientas para Linux que ayudan en la tarea.
Una de ellas es Fdupes. Se trata de un programa escrito en C bajo licencia del MIT. Esta herramienta analiza el sistema de archivos en busca de archivos y carpetas duplicadas. La forma de identificar esos elementos es mediante la comparación de su firma MD5. Si la comparación es positiva, se procede a una comparación bit a bit.
De Fdupes existen varios modificadores que hacen que el programa se comporte de una forma u otra. Suponiendo que tenemos una carpeta que contiene 8 archivos idénticos, podemos comprobar el funcionamiento del programa así:
Si queremos saber cuánto espacio están ocupando esos archivos, no tenemos más que añadir el modificador -S:
Si lo que queremos es explorar todas las subcarpetas de forma recursiva, deberemos añadir el modificador -r junto al directorio. Por último, si lo que queremos es que se eliminen los archivos duplicados encontrados, deberemos usar el modificador -d.
Si además de encontrar archivos duplicados queremos realizar otras tareas de mantenimiento que nos ayuden a ahorrar todavía más espacio, podemos usar una herramienta llamada Rmlint.
Rmlint permite, no solo encontrar archivos y carpetas duplicados, sino que también puede encontrar binarios con información sobre depurado en su interior, algo que aumenta su tamaño y generalmente resulta poco útil al usuario final.
Además encuentra enlaces simbólicos rotos, archivos y carpetas vacíos y archivos con identificadores de usuario o grupo defectuosos. Esto puede no ahorrar mucho espacio, pero es útil para mantener el sistema de archivos limpio.
Fdupes es un programa que se encuentra empaquetado en la mayoría de distribuciones, por lo que su instalación es bastante sencilla. El código fuente se encuentra disponible en su página de GitHub. Sobre Rmlint, al ser un programa más reciente tendrás que bajar el código fuente y compilarlo tú mismo. El código de Rmlint y la documentación también se puede conseguir en su página de GitHub.