Che cos'è un singolo punto di guasto (SPOF)? Per definizione, un singolo punto di guasto è un rischio potenziale causato da un difetto nella progettazione, implementazione o configurazione di un circuito o sistema. In altre parole, SPOF si riferisce a un guasto che può causare l’arresto del funzionamento dell’intero sistema.

Cos'è un singolo punto di guasto in un sistema di archiviazione dati?

Un singolo punto di guasto in un sistema di archiviazione dati può essere inteso come il guasto di un elemento, componente o parte del sistema, il cui guasto può causare il collasso dell'intero sistema. Solitamente si presentano diverse situazioni:

  • Supponiamo che un dispositivo di archiviazione abbia un solo alimentatore, che rappresenta un singolo punto di guasto. In caso di interruzione dell'alimentazione, l'intero dispositivo si spegne e i dati diventano inaccessibili.

  • Allo stesso modo, se è presente una sola unità principale di archiviazione/controller di archiviazione, il suo guasto distruggerà l'intero sistema di archiviazione dei dati.

  • Un singolo punto di guasto può verificarsi anche se il sistema di archiviazione dei dati non dispone di RAID o di codifica di cancellazione.

  • Se un'unità si guasta, non è possibile accedere ai dati in quella particolare unità, causando nuovamente un'interruzione.

Perché esiste un singolo punto di guasto nei sistemi di archiviazione cloud?

Sembra che l'unico punto di guasto per un sistema di archiviazione dati si verifichi solitamente nel suo dispositivo hardware. Tuttavia, per l'archiviazione cloud/distribuita, esiste ancora un singolo punto di errore? Quanto è grave l'impatto?

I fornitori di servizi di cloud storage centralizzati sono spesso esposti ai pericoli nascosti derivanti dai guasti delle singole sale computer. Questo perché i servizi di cloud storage, come i servizi di cloud hosting, sono concentrati in sale computer individuali o parziali e devi scegliere di utilizzare uno dei data center quando utilizzi i servizi di cloud storage. Se si verifica un'interruzione di corrente o di rete nel data center in cui si trovano i dati, i normali servizi verranno influenzati.

Quindi, come risolvere il problema dei frequenti guasti singoli dei fornitori di servizi cloud centralizzati? La soluzione ai singoli punti di guasto è la "ridondanza". I server chiave devono essere ridondanti in cluster, le connessioni di rete devono essere ridondanti in multicanale, l'archiviazione deve essere con mirroring o ridondante RAID e l'intero data center deve essere ridondante tramite disaster recovery e active-active.

Tuttavia, è innegabile che i principali fornitori di servizi cloud centralizzati occupano il mercato del cloud storage, quindi ci sono anche "muri" tecnici e barriere commerciali tra loro, che rendono difficile la copia dei dati degli utenti attraverso i "cloud". Inoltre, i data center frammentati non consentono lo snapshot o la replica dei dati tra cloud diversi. Pertanto, nel modello di business del cloud storage centralizzato, se il "cloud" utilizzato dall'utente fallisce, un altro "cloud" non può subentrare ed elaborarlo in tempo. Poiché i rischi causati dai singoli punti di guasto vengono ancora gestiti e controllati solo a livello centrale, gli utenti possono fare affidamento solo sul cloud di loro scelta per evitare problemi di guasto e non esiste altra soluzione più affidabile.

In che modo il cloud storage decentralizzato risolve i singoli punti di errore

Lo storage cloud decentralizzato evita in gran parte il problema dei singoli punti di guasto centralizzati grazie alla sua naturale architettura distribuita. Negli attuali sistemi di stoccaggio distribuiti, prendendo come esempio Filecoin, Arweave, Storj, ecc., gli utenti con risorse di stoccaggio inattive possono diventare membri della rete di stoccaggio e ottenere determinati incentivi affittando lo spazio di stoccaggio. Ogni progetto ha le sue caratteristiche, ma di fronte al problema dei singoli punti di guasto, a parte i naturali vantaggi della distribuzione, non dimostra tecnologie più innovative. Ad esempio, utilizzando i servizi di ordine di archiviazione punto a punto, per prevenire singoli punti di errore è necessario che la rete raggiunga in modo proattivo accordi con più fornitori di archiviazione per ottenere più copie.

CESS è una rete di archiviazione cloud decentralizzata sicura, efficiente, open source e scalabile. La sua struttura distribuita evita naturalmente problemi di singoli punti di guasto e CESS è distribuito sia nella rete che nello spazio di archiviazione. Rispetto ad altri progetti di archiviazione decentralizzata, CESS è diverso in quanto introduce un nuovo meccanismo di prova di archiviazione: Multi-Copy Recoverable Storage Proof Mechanism (PoDR²). Analizziamo i vantaggi di questo certificato di storage nella gestione dei singoli punti di guasto e delle funzionalità di disaster recovery sotto due aspetti:

- Copie multiple

PoDR² è un algoritmo di backup e ripristino proof-of-data Zero Trust. I dati archiviati vengono crittografati, suddivisi e quindi inviati in modo casuale a diversi nodi minatori. Con il meccanismo PoDR², vengono generate tre copie per impostazione predefinita. Naturalmente, il sistema supporta anche gli utenti nella personalizzazione del numero di copie di produzione. Il meccanismo di firma omomorfica viene utilizzato per garantire che lo storage miner memorizzi in modo veritiero il numero di copie di dati fornite dal sistema CESS o specificate dall'utente. Naturalmente, il tradizionale cloud storage centralizzato supporta anche backup multipli, ma il numero di backup è ancora di archiviazione e controllo centralizzati e la sicurezza non può essere notevolmente migliorata attraverso più copie.

- Recuperabile

Abbiamo accennato nell'articolo precedente che la "ridondanza" è un metodo per risolvere singoli punti di errore, ma dietro di esso si celano in realtà la replica e il ripristino. Attraverso il meccanismo PoDR² di CESS, dopo che sono state elaborate più copie dei dati, viene utilizzata la codifica ridondante per realizzare che quando due blocchi qualsiasi di ciascun dato vengono danneggiati, possono essere ripristinati tramite codifica ridondante. Quindi il sistema CESS genererà parametri di verifica per ciascun segmento di dati per assistere nella successiva prova di archiviazione dei dati, che verrà utilizzata per la successiva prova di replica, prova spazio-temporale e prova di archiviazione PoDR². In questo meccanismo, la catena CESS distribuirà in modo casuale i segmenti di dati copiati a diversi storage miner, in modo che anche se uno storage miner incontra la cancellazione, la perdita o l'attacco di un hacker, PoDR² può estrarre i dati da altri storage miner per fornire recupero e ripristino a massimizzare la sicurezza dell'archiviazione dei dati dell'utente.

Vale la pena ricordare che secondo il meccanismo PoDR², il sistema CESS controllerà periodicamente i dati sullo storage miner (ovvero controllerà e dimostrerà se i dati archiviati nel nodo di storage sono validi, esistono o modificati) per garantirne l'autenticità e la disponibilità dei dati.

L'eliminazione del problema di un singolo punto di errore riflette la capacità di ciascun sistema di prevedere i rischi in anticipo, implementare meccanismi di elusione e fornire soluzioni di disaster recovery dei dati. Dal punto di vista della disponibilità dei dati, il meccanismo di prova dell'archiviazione recuperabile multi-copia di CESS garantisce la massima disponibilità della disponibilità dei dati. Dal punto di vista della sicurezza, CESS suddivide e ridonda i dati, quindi li distribuisce agli storage miner, ottenendo ridondanza e recuperabilità globali dei dati. CESS risolve davvero il singolo punto di errore affrontato dai sistemi di archiviazione cloud decentralizzati, fornisce al settore un meccanismo di prova di archiviazione recuperabile multi-copia (PoDR²) basato sul possesso dei dati e raggiunge una codifica e decodifica che supera di gran lunga l'efficienza di progetti simili. Gli utenti possono archiviare i dati in modo sicuro e accedervi in ​​modo flessibile ed efficiente.