¿Qué es un punto único de falla (SPOF)? Por definición, un punto único de falla es un riesgo potencial causado por una falla en el diseño, implementación o configuración de un circuito o sistema. En otras palabras, SPOF se refiere a una falla que puede provocar que todo el sistema deje de funcionar.
¿Qué es un punto único de falla en un sistema de almacenamiento de datos?
Un único punto de falla en un sistema de almacenamiento de datos puede entenderse como la falla de un elemento, componente o parte del sistema, cuyo fallo puede provocar el colapso de todo el sistema. Suelen darse varias situaciones:
Supongamos que un dispositivo de almacenamiento tiene una sola fuente de alimentación, que es un único punto de falla. Si falla la energía, todo el dispositivo se apaga y los datos se vuelven inaccesibles.
Del mismo modo, si solo hay una unidad principal de almacenamiento/controlador de almacenamiento, su falla destruirá todo el sistema de almacenamiento de datos.
También puede ocurrir un único punto de falla si el sistema de almacenamiento de datos no tiene RAID o codificación de borrado.
Si una unidad falla, no se puede acceder a los datos de esa unidad en particular, lo que nuevamente provoca una interrupción.
¿Por qué existe un único punto de falla en los sistemas de almacenamiento en la nube?
Parece que el único punto de falla de un sistema de almacenamiento de datos generalmente ocurre en su dispositivo de hardware. Sin embargo, para el almacenamiento en la nube/almacenamiento distribuido, ¿todavía existe un único punto de falla? ¿Qué tan grave es el impacto?
Los proveedores de servicios de almacenamiento centralizado en la nube a menudo están expuestos a peligros ocultos de fallas en una sola sala de computadoras. Esto se debe a que los servicios de almacenamiento en la nube, como los servicios de alojamiento en la nube, se concentran en salas de ordenadores individuales o parciales, y hay que optar por utilizar uno de los centros de datos cuando se utilizan los servicios de almacenamiento en la nube. Si hay un fallo de energía o de red en el centro de datos donde se encuentran los datos, los servicios normales se verán afectados.
Entonces, ¿cómo resolver el problema de las frecuentes fallas de un solo punto de los proveedores de servicios en la nube centralizados? La solución a los puntos únicos de falla es la "redundancia". Los servidores clave deben ser redundantes en clústeres, las conexiones de red deben ser redundantes en múltiples canales, el almacenamiento debe ser duplicado o RAID redundante y todo el centro de datos debe ser redundante mediante recuperación ante desastres y activo-activo.
Sin embargo, es innegable que los principales proveedores de servicios en la nube centralizados ocupan el mercado de almacenamiento en la nube, por lo que también existen "muros" técnicos y barreras comerciales entre ellos, lo que dificulta que los datos de los usuarios se copien a través de las "nubes". Los centros de datos fragmentados tampoco permiten tomar instantáneas o replicar datos entre diferentes nubes. Por lo tanto, bajo el modelo de negocio de almacenamiento centralizado en la nube, si la "nube" utilizada por el usuario falla, otra "nube" no puede tomar el control y procesarla a tiempo. Debido a que los riesgos causados por puntos únicos de falla todavía solo se manejan y controlan de manera centralizada, los usuarios solo pueden confiar en la nube de su elección para evitar problemas de falla, y no existe otra solución más confiable.
Cómo el almacenamiento descentralizado en la nube resuelve los puntos únicos de falla
El almacenamiento descentralizado en la nube evita en gran medida el problema de los puntos únicos de falla centralizados debido a su arquitectura distribuida natural. En los sistemas de almacenamiento distribuido actuales, tomando como ejemplo Filecoin, Arweave, Storj, etc., los usuarios con recursos de almacenamiento inactivos pueden convertirse en miembros de la red de almacenamiento y obtener ciertos incentivos alquilando espacio de almacenamiento. Cada proyecto tiene sus propias características, pero ante el problema del punto único de fallo, aparte de las ventajas naturales de la distribución, no muestra tecnologías más innovadoras. Por ejemplo, al utilizar servicios de pedidos de almacenamiento punto a punto, evitar puntos únicos de falla requiere que la red llegue a acuerdos de manera proactiva con múltiples proveedores de almacenamiento para lograr múltiples copias.
Como red de almacenamiento en la nube descentralizada, segura, eficiente, de código abierto y escalable, la estructura distribuida de CESS evita naturalmente el problema de puntos únicos de falla, y CESS se distribuye tanto en la red como en el almacenamiento. En comparación con otros proyectos de almacenamiento descentralizado, CESS se diferencia en que introduce un nuevo mecanismo de prueba de almacenamiento: el mecanismo de prueba de almacenamiento recuperable de múltiples copias (PoDR²). Analizamos las ventajas de este certificado de almacenamiento al abordar puntos únicos de falla y capacidades de recuperación ante desastres desde dos aspectos:
- Múltiples copias
PoDR² es un algoritmo de recuperación y respaldo de prueba de datos de confianza cero. Los datos almacenados se cifran, se dividen y luego se envían aleatoriamente a varios nodos mineros. Según el mecanismo PoDR², se generan tres copias de forma predeterminada. Por supuesto, el sistema también permite a los usuarios personalizar la cantidad de copias de producción. El mecanismo de firma homomórfica se utiliza para garantizar que el minero de almacenamiento almacene verdaderamente la cantidad de copias de datos proporcionadas por el sistema CESS o especificadas por el usuario. Por supuesto, el almacenamiento en la nube centralizado tradicional también admite múltiples copias de seguridad, pero la cantidad de copias de seguridad sigue siendo almacenamiento y control centralizados, y la seguridad no se puede mejorar mucho mediante múltiples copias.
- Recuperable
Mencionamos en el artículo anterior que la "redundancia" es un método para resolver puntos únicos de falla, pero detrás de esto en realidad está la replicación y la recuperación. A través del mecanismo PoDR² de CESS, después de procesar múltiples copias de los datos, se utiliza codificación redundante para darse cuenta de que cuando dos bloques cualesquiera de cada dato se dañan, se pueden restaurar mediante codificación redundante. Luego, el sistema CESS generará parámetros de verificación para cada segmento de datos para ayudar en la prueba posterior del almacenamiento de datos, que se utilizará para la prueba posterior de replicación, prueba espacio-temporal y prueba de almacenamiento PoDR². En este mecanismo, la cadena CESS distribuirá aleatoriamente los segmentos de datos copiados a diferentes mineros de almacenamiento, de modo que incluso si un minero de almacenamiento sufre eliminación, pérdida o ataque de piratas informáticos, PoDR² puede extraer datos de otros mineros de almacenamiento para proporcionar recuperación y recuperación a maximizar la seguridad del almacenamiento de datos del usuario.
Vale la pena mencionar que bajo el mecanismo PoDR², el sistema CESS verificará periódicamente los datos en el minero de almacenamiento (es decir, verificará y probará si los datos almacenados en el nodo de almacenamiento son válidos, existen o están modificados) para garantizar la autenticidad y disponibilidad. de los datos.
Deshacerse del problema de un único punto de falla refleja la capacidad de cada sistema para predecir riesgos de antemano, implementar mecanismos para evitarlos y proporcionar soluciones de recuperación de datos ante desastres. Desde la perspectiva de la disponibilidad de datos, el mecanismo de prueba de almacenamiento recuperable de múltiples copias de CESS garantiza la disponibilidad de datos en la mayor medida. Desde una perspectiva de seguridad, CESS divide y redunda los datos y luego los dispersa entre los mineros de almacenamiento, logrando redundancia y capacidad de recuperación de datos globales. CESS realmente resuelve el punto único de falla que enfrentan los sistemas descentralizados de almacenamiento en la nube, proporciona a la industria un mecanismo de prueba de almacenamiento recuperable de múltiples copias (PoDR²) basado en la posesión de datos y logra una codificación y decodificación que supera con creces la eficiencia de proyectos similares. Los usuarios pueden almacenar datos de forma segura y acceder a ellos de manera flexible y eficiente.