¿Que es la deduplicación?

Mucho se esta hablando de los procesos de deduplicación de los datos para el reguardo de los mismos. ¿Pero que es realmente deduplicar?

La deduplicación es una forma de resguardar nuestra información eliminando los datos redundantes. Mediante avanzados métodos de compresión podemos generar backups ahorrando almacenamiento y reduciendo tiempos. La deduplicacion permite copiar datos entre distintos centros de cómputos a una gran velocidad.

En el proceso de deduplicación, se identifican y almacenan fragmentos únicos de datos o patrones de bytes y a medida que el análisis continúa se comparan “trozos” con la copia almacenada y cuando se produce una coincidencia, el trozo redundante se sustituye por una pequeña referencia que apunta al fragmento ya almacenado anteriormente. Dado que el mismo patrón de bytes puede ocurrir decenas, cientos, o incluso miles de veces, la cantidad de datos que deben ser almacenados o transferidos puede reducirse considerablemente.

Existen 2 formas de deduplicar datos:

  • El método tradicional es por Bytes. Para poner un ejemplo. Con el método de backup tradicional, si en nuestro sistema de correo electrónico hay casillas de correo con un mismo archivo adjunto, el resguardo de ese archivo ocupa la cantidad de copias por el tamaño. Si tenemos 10 copias de 1MB, tenemos 10MB usados. Con la deduplicación de datos, sólo se almacena una instancia del archivo adjunto; las instancias posteriores referencian a la copia ya guardada de manera que tenemos 1 archivo de 1MB y 9 punteros a ese archivo, reduciendo el almacenamiento de gran manera.
  • Y existe el método por Blocks. En la deduplicación a nivel de bloques solo se almacena el bloque de disco que tuvo cambios y aquellos que quedaron sin alteraciones se almacenen como punteros a los ya almacenados.

Ambos métodos son eficaces, generan una gran reducción del consumo de storage y fundamentalmente permiten reducir tiempos de resguardo, tiempos de copia via LAN, y fundamentalmente tiempos de recuperación menores. En el contexto IT actual, donde los volúmenes de datos se incrementan de forma exponencial y ante la necesidad de no tener riesgos de perdida de información, contar con un sistema de backup ágil y eficaz es mandatorio.

Si aun quedan dudas, los invitamos a contactarnos.

La inspiración existe, pero tiene que encontrarte trabajando.

— Pablo Picasso

Summary
¿Que es la deduplicación?
Article Name
¿Que es la deduplicación?
Description
La deduplicación es una forma de resguardar nuestra información eliminando los datos redundantes. Mediante avanzados métodos de compresión podemos generar backups ahorrando almacenamiento y reduciendo tiempos. La deduplicacion permite copiar datos entre distintos centros de cómputos a una gran velocidad.
Author
Publisher Name
Soluciones Globales IT S.A.
Publisher Logo

Deja un comentario