Rachel, Jinse Caijing
Pe 27 noiembrie, Zhao Changpeng a postat pe X că sarcinile precum etichetarea datelor AI sunt foarte potrivite pentru a fi completate prin intermediul blockchain-ului, având la dispoziție forța de muncă globală la costuri reduse și plăți imediate prin criptomonede, depășind astfel limitările geografice.
Etichetarea datelor se referă la procesul de etichetare manuală sau automatizată a datelor originale (cum ar fi textul, imaginile, audio etc.) pentru a le conferi informații structurate specifice. Datele etichetate sunt utilizate pentru a antrena modele de învățare automată sau inteligență artificială; de exemplu, etichetarea sentimentului textului (pozitiv, negativ, neutru) este un tip de etichetare a datelor. Utilizarea blockchain-ului pentru etichetarea datelor de inteligență artificială este deosebit de potrivită pentru scenariile de etichetare a datelor care necesită o transparență ridicată, credibilitate și colaborare distribuită. Aceasta nu numai că poate îmbunătăți eficiența și calitatea etichetării datelor, dar creează și noi posibilități pentru colaborarea globală și comerțul cu date.
În prezent, ce proiecte de calitate există în această categorie? Care este perspectiva de dezvoltare a acestei categorii?
Rolul blockchain-ului în etichetarea datelor AI
Blockchain-ul este o tehnologie de registru distribuit descentralizat, având caracteristici precum transparență, imutabilitate și trasabilitate. Aceste caracteristici pot rezolva următoarele probleme întâmpinate în metodele tradiționale de etichetare a datelor:
Veridicitatea datelor și prevenirea modificărilor: Fiecare înregistrare de etichetare este scrisă pe blockchain, neputând fi modificată în mod arbitrar, asigurând astfel credibilitatea etichetării.
Transparența alocării sarcinilor: Blockchain-ul poate înregistra distribuția, executarea și procesul de audit al sarcinilor, prevenind alocarea nedreaptă a sarcinilor sau modificarea rezultatelor.
Mecanism de stimulare: Utilizing tehnologia contractelor inteligente a blockchain-ului, etichetatorii de date pot obține automat criptomonede sau alte recompense prin finalizarea sarcinilor.
Trasabilitatea datelor: Fiecare marcaj poate fi urmărit, inclusiv sursa, etichetatorul și informațiile evaluatorului.
Scenarii de aplicare
Etichetare distribuită: Utilizând blockchain-ul, sarcinile de etichetare a datelor sunt distribuite către etichetatori din întreaga lume, sporind eficiența procesării datelor.
Auditul calității: Rezultatele etichetării multiple sunt comparate și verificate prin tehnologia blockchain pentru a asigura acuratețea etichetării.
Comerț cu date etichetate: Datele etichetate pot fi tranzacționate pe blockchain, iar părțile implicate nu trebuie să se îngrijoreze cu privire la integritatea sau veridicitatea datelor.
Protecția confidențialității: Utilizarea blockchain-ului pentru stocarea criptată a datelor etichetate, asigurând securitatea datelor confidențiale.
Proiecte conexe
OORT DataHub: Oferă servicii de etichetare a datelor descentralizate bazate pe blockchain, utilizând algoritmul Proof of Honesty pentru controlul calității. Platforma sa distribuie sarcini prin contracte inteligente, verifică calitatea datelor și plătește recompense, atrăgând etichetatori din întreaga lume și asigurând transparența și protecția confidențialității datelor etichetate.
Modelul economic al token-ului proiectului este următorul:
Recompense comunitare: Prin participarea la etichetarea și analiza datelor, utilizatorii pot obține recompense în token-uri $OORT. În plus, este posibil să obțină NFT-uri unice corelate cu contribuțiile lor, aceste NFT-uri oferind drepturi suplimentare, cum ar fi recompense pentru creșterea randamentului anual (APY), reduceri la echipamente și drept de vot în DAO.
Garanția sarcinii: Participanții trebuie să garanteze cel puțin 210 token-uri $OORT pentru a-și demonstra angajamentul față de sarcină; după finalizarea sarcinii, token-urile vor fi restituite și vor fi oferite recompense.
Împărțirea veniturilor din vânzări: Anumiți deținători de NFT-uri pot obține dividende din veniturile viitoare din vânzarea de date, sporind astfel veniturile pe termen lung.
PublicAI: Proiect ecologic AI pe lanțul Solana, destinat conectării cererii de date cu etichetatorii globali, recompensând participanții printr-un mecanism de stimulare bazat pe criptomonede, în timp ce utilizează tehnologia blockchain pentru a înregistra detaliile procesului de etichetare, asigurând astfel securitatea și confidențialitatea datelor.
Modelul economic al token-ului proiectului este următorul:
Recompense comunitare: 10% din token-urile Public vor fi utilizate pentru recompensele airdrop pentru interacțiunile inițiale ale utilizatorilor; mai precis, există trei metode de a obține airdrop: a deveni AI Builder: colectarea de conținut de înaltă calitate de pe internet; a deveni AI Validator: validarea conținutului colectat; a deveni AI Developer: utilizarea seturilor de date validate pentru a antrena agenți AI.
Distribuția token-urilor: Proiectul a finalizat în ianuarie 2024 o rundă de finanțare de tip seed de 2 milioane de dolari, investitorii includ IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital și mai mulți academicieni renumiți din domeniul inteligenței artificiale; în prezent, detaliile specifice ale distribuției token-ului PublicAI nu au fost clarificate.
Provocările cu care ne confruntăm
În prezent, există câțiva factori care limitează dezvoltarea acestei categorii: în primul rând, etichetarea datelor AI necesită resurse de calcul și stocare ridicate; în al doilea rând, performanța proiectului este restricționată de scalabilitatea blockchain-ului; în al treilea rând, standardizarea tehnică și reglementarea sunt încă imperfecte.
Printre acestea, al doilea punct ar putea fi cea mai mare provocare cu care ne confruntăm în prezent. Deoarece etichetarea datelor AI și antrenarea modelului necesită de obicei o cantitate mare de resurse de calcul, iar capacitatea de calcul a nodurilor din rețeaua blockchain este limitată. Cum să integrăm și să utilizăm eficient resursele de calcul distribuite pentru a satisface cerințele de calcul ale proiectelor de etichetare a datelor AI, păstrând în același timp caracteristicile de descentralizare ale blockchain-ului, este o problemă care necesită soluții urgente. Se știe că Greenfield, parte a Binance, oferă suport de stocare pentru această categorie, așteptându-se ca mai multe resurse de stocare și calcul să fie utilizate în acest domeniu.