Rețeaua Zilliqa a suferit o întrerupere pe 18 decembrie 2023, care a dus la câteva ore de întrerupere.

Această situație a dus la întreruperea temporară a producției de blocuri înainte ca funcționalitatea completă a rețelei să fie restabilită de către echipa tehnică mai târziu în aceeași zi.

În urma acestei întreruperi, echipa tehnică Zilliqa a efectuat o analiză a cauzei principale a acestui eveniment și a constatat că este rezultatul unei probleme critice de inconsecvență cauzate de o divergență în hash-urile rădăcină.

Ne cerem scuze pentru neplăcerile cauzate de acest incident și apreciem sprijinul oferit de comunitatea Zilliqa în timp ce am lucrat pentru a rezolva timpul de nefuncționare a rețelei.

Mai jos este analiza echipei tehnice cu privire la această întrerupere și pașii pe care îi luăm pentru a îmbunătăți fiabilitatea rețelei Zilliqa.

Analiza cauzei principale - Întreruperea rețelei Zilliqa pe 18 decembrie

Analiza cauzei principale efectuată de echipa tehnică Zilliqa a constatat că a fost întâlnită o problemă critică de inconsecvență în timpul procesării blocului 3428513, un subset de noduri nereușind să primească setul complet de microblocuri asociate cu acest bloc. 

Ca rezultat, acest subset de noduri a derivat un hash rădăcină divergent pentru restul rețelei, ceea ce a condus la un conflict în stabilirea consensului.

Aceste noduri au părăsit ulterior consensul, lăsând un număr insuficient de voturi pentru a comite acest bloc, iar încercările de a reîncerca acest angajament au condus la aceeași problemă de nepotrivire între hashurile rădăcină.

Baza de cod existentă a rețelei Zilliqa se bazează în mare măsură pe presupunerea unei bârfe de obiecte fiabile în rețea și, deși există mecanisme menite să se recupereze din astfel de discrepanțe, în acest caz, codul de recuperare relevant nu a reușit să se activeze.

Pentru a remedia această problemă și a restabili consensul, a fost necesar ca rețeaua Zilliqa să fie repornită. Această procedură simplă a fost pusă în aplicare imediat, dar a dus la câteva ore de nefuncționare.

Îmbunătățirea fiabilității și eficienței Zilliqa

Incidentul din 18 decembrie 2023 demonstrează necesitatea îmbunătățirii continue a fiabilității și eficienței Zilliqa.

Echipa tehnică lucrează din greu pentru a implementa actualizări ale arhitecturii de rețea care vor spori fiabilitatea rețelei Zilliqa și vor reduce riscul de nefuncționare din cauza incidentelor precum cel descris mai sus.

Actualizările viitoare ale Zilliqa vor oferi un impuls major rezistenței generale a rețelei și vor atenua atât riscul, cât și impactul unui incident similar care va avea loc în viitor.

Sunt implementate o serie de îmbunătățiri ale rețelei care nu numai că vor oferi îmbunătățiri majore de performanță și funcții noi interesante, dar vor îmbunătăți în mod direct capacitățile rețelei de a gestiona orice incidente perturbatoare.

Aceste modificări includ următoarele:

Actualizarea rețelei Zilliqa v9.3.0

Upgrade-ul Zilliqa v9.3.0, implementat pe 3 ianuarie 2024, diminuează foarte mult riscul unor inconsecvențe similare și întreruperi ale consensului prin dezintegrarea rețelei.

Această schimbare va îmbunătăți eficiența și fiabilitatea rețelei, oferind o bază solidă pentru lansarea unei noi arhitecturi de sharding îmbunătățite cu Zilliqa 2.0.

Zilliqa v9.3.0 include, de asemenea, un nou mecanism activ de control al recompensei, compatibilitate îmbunătățită EVM, îmbunătățiri ale eficienței minierelor și multe altele.

Migrare la Google Cloud Platform (GCP)

Ca parte a alianței strategice a Zilliqa cu Google Cloud, nodurile operate de echipa de infrastructură Zilliqa sunt în proces de migrare la Google Cloud Platform (GCP).

Acest lucru va avea un impact semnificativ asupra timpilor de pornire a rețelei, permițând refacerii rețelei mult mai rapid și minimizând eventualele perioade de nefuncționare în scenariile în care acest lucru este necesar.

O rețea mai fiabilă cu Zilliqa 2.0

Zilliqa 2.0, care se așteaptă în prezent să fie lansat în a doua jumătate a anului 2024, abordează probleme fundamentale legate de acest incident perturbator.

Această versiune revizuită și mult îmbunătățită a Zilliqa va elimina ipoteza de fiabilitate în bârfa obiectelor de rețea, care este cauza principală a timpului de nefuncționare experimentat pe 18 decembrie. De asemenea, va folosi un nou mecanism de consens care permite menținerea consensului în scenarii similare prin intermediul un model de auto-vindecare.

Zilliqa 2.0 va introduce, de asemenea, o persistență mai eficientă a datelor, reducând timpii lungi de conectare observați în prezent pe Zilliqa. 

În plus, în loc de câteva ore necesare în prezent pentru restabilirea rețelei Zilliqa, Zilliqa 2.0 va fi proiectat să pornească complet în aproximativ 10 minute.

Toate modificările descrise mai sus sunt concepute pentru a îmbunătăți considerabil fiabilitatea rețelei Zilliqa, oferind o rețea eficientă, flexibilă și stabilă, care minimizează întreruperile. 

Incidentul din 18 decembrie subliniază necesitatea unei arhitecturi de rețea mai fiabile și mai dinamice, care este nucleul filozofiei de proiectare pentru Zilliqa 2.0 și actualizările în curs de implementare în rețea.

Ne cerem scuze din nou pentru neplăcerile cauzate de această perioadă de nefuncționare și apreciem sprijinul continuu al comunității Zilliqa în timp ce lucrăm pentru a îmbunătăți rezistența și fiabilitatea rețelei.