Cómo está evolucionando la codificación de borrado de datos


Blancco Data Eraser software

La codificación de borrado de datos es una alternativa al RAID, y está cambiando para abordar los desafíos emergentes de resiliencia de datos.

La capacidad de recuperación de datos se encuentra en una encrucijada. Las soluciones de almacenamiento SAN tradicionales que se ejecutan en la matriz redundante de discos independientes (RAID) están sucumbiendo bajo la presión de las nuevas demandas de datos. Mientras el particionamiento de datos, la creación de espejos y la paridad en las implementaciones de RAID brindan diversos grados de protección, el gasto de la resilicencia, los tiempos de recuperación y los problemas de vulnerabilidad del proceso de recuperación de RAID allanan el camino para las alternativas.

Una opción es la codificación del borrado de datos, que es claramente diferente de otros sistemas basados en hardware. EC (Erasure Coding) es una implementación basada en algoritmos que no está vinculada a ningún hardware específico. Rompe los datos en fragmentos, los expande y los codifica con piezas de información redundantes, y luego distribuye fragmentos codificados entre discos, nodos de almacenamiento o distintas ubicaciones. Con la codificación de borrado, los datos que se vuelven ilegibles en un nodo aún se pueden reconstruir utilizando información sobre los datos almacenados en otro lugar.

A diferencia de RAID, la codificación de borrado de datos no requiere un controlador de hardware especializado y proporciona una mejor capacidad de recuperación. Además, proporciona protección durante los procesos de recuperación. Dependiendo del grado de resiliencia, la recuperación completa es incluso posible cuando solo la mitad de los elementos de datos están disponibles; esa es una gran ventaja sobre el RAID. En comparación con el raid en espejo, la codificación de borrado de datos también consume menos almacenamiento. El único inconveniente es que el EC (la codificación de borrado de datos) consume mucha CPU y puede causar problemas de latencia.

Eficiencia de almacenamiento vs. Tolerancia a fallos

La codificación de borrado de datos se representa con mayor frecuencia utilizando los códigos Reed-Solomon (RS). Para aquellos familiarizados con los códigos RS, dos medidas de rendimiento importantes son: eficiencia de almacenamiento y tolerancia a fallos. La codificación de borrado de datos implica una compensación entre los dos. La eficiencia de almacenamiento es un indicador de almacenamiento adicional requerido para asegurar la resiliencia, mientras que la tolerancia a fallos es un indicador de la posible recuperación en el caso de fallo de los elementos.

Estas métricas son inversamente proporcionales entre sí; más tolerancia a fallos reduce la eficiencia de almacenamiento. Es decir, cuanto más distribuidos y, por lo tanto, geográficamente más generalizados se almacenan los datos, mayor será la latencia, ya que el tiempo requerido para recuperar desde diferentes ubicaciones o sistemas es mayor.

Los centros de datos de hiperescala plantean nuevos desafíos para la resiliencia de los datos en términos de fallos de nodo y lecturas degradadas. Los algoritmos de códigos de borrado de datos modernos han evolucionado para incluir códigos de regeneración locales, códigos con disponibilidad, códigos con recuperación secuencial, códigos MSR, códigos de recuperaciones seleccionables y otros que son altamente personalizados.

Borreado de datos Blancco en España

Como partner oficial de Blancco en España, MercadoIT ofrece la opción más segura para borrar datos. Descubre todas las soluciones de borrado de datos de Blancco pinchando aquí.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *