martes, 30 de junio de 2009

Dividir y Unir archivos de copias de seguridad

Con el aumento de sitios para almacenamiento en línea, exige que podamos ajustar nuestros archivos al tamaño permitido por dichos sitios. Otro caso es cuando necesitamos dividir archivo de un tamaño máximo de 700M, para trasportarlos en CD's a otra computadora. Existen muchos programas para Windows, pero tambien hay una alternativa para Linux.

En Linux tenemos tres herramientas que utilizaremos para nuestro fin, las cuales nos permiten dividir, volver a unir y verificar cualquier archivo. Dividir (split), unir (cat) y verificar (md5sum) archivos.

Como partir archivos grandes en mas pequeños en linux

md5sum: Verificar los archivos

Antes de partir el archivo, siempre es aconsejable calcular el resumen md5 para el archivo original. Entre mas grande sea el archivo, mas tardara este proceso.

$ md5sum -b backupDB.zip > backupDB.zip.md5

El comando anterior crea un archivo de texto de 128 bits que contiene una secuencia numérica única a partir del contenido de nuestro archivo.

split: Dividir el backup

Digamos que deseamos partir un archivo *.zip o *.rar que contenga archivos adquiridos durante un semestre. Puede ser cualquier tipo de datos; quizas, un conjunto de videos, musica documnetos y otros archivo. No importa el tipo de archivo, lo que si haremos es comprimirlo.

El tamaño en bytes se indica con letras: 'k' para kB, 'm' para MB.

Para nuestro ejemplo tenemos un archivo llamado backupDB.zip. Crear los archivos necesarios de 695Mb, para quemarlos en un cd y ordenados por número y no por letras, tecleamos la instruccion:

$ split -b 695m -d backupDB.zip backupDB.zip-

Al terminar, tendremos varios archivos llamados backupDB.zip-00, backupDB.zip-01 y así sucesivamente.

cat: Unir los archivos

Ahora queremos recuperar el backup. Ya tenemos nuestros N cd’s conteniendo un archivo cada uno, entonces procedemos a copiar el contenido de cada cd o dvd hacia un disco duro con el doble de espacio. Al terminar la copia tecleamos en nuestra línea de comandos:

$ cat backupDB.zip-* >> backupDB.zip

Con esta última instrucción, hemos recuperado nuestro archivo original, ya sea llevado en CD o de igual manera cuando se lleva cabo almacenamiento en línea.

En este punto, es conveniente verificar que la unión del archivo ha sido correcta. Para ello se suele emplear la suma MD5 (md5sum).

$ md5sum -b backupDB.zip > backupDB.zip.md52

Con md5sum se genera un código del archivo original, que suele ser publicado en Internet junto al archivo a descargar, o en los CD que se usan para transportar los datos. Al archivo ya unido, debemos hacerle generar su suma md5 y comprobar que coincide con la del archivo original original. De esa forma estamos seguros de que el archivo ya unido es una copia exacta del original.


Fuente: Guatewireless.org