Rachel, Jurnalul de Finanțe Aurii
Pe 27 noiembrie, Zhao Changpeng a declarat pe X că sarcinile precum etichetarea datelor AI sunt foarte potrivite pentru a fi finalizate prin blockchain, putând beneficia de forța de muncă globală la costuri reduse și plăți imediate prin criptomonede, depășind astfel limitele geografice.
Etichetarea datelor se referă la procesul de etichetare manuală sau automatizată a datelor brute (cum ar fi texte, imagini, audio etc.) pentru a le oferi informații structurate specifice. Datele etichetate sunt utilizate pentru a antrena modele de învățare automată sau inteligență artificială, de exemplu, etichetarea textelor cu categorii de sentiment (pozitiv, negativ, neutru) este un tip de etichetare a datelor. Utilizarea blockchain-ului în etichetarea datelor AI este deosebit de potrivită pentru scenariile de etichetare a datelor care necesită transparență mare, credibilitate și colaborare distribuită. Acest lucru nu doar că poate spori eficiența și calitatea etichetării datelor, dar creează și noi posibilități pentru colaborarea globală și comerțul cu date.
În prezent, ce proiecte de calitate există în acest domeniu? Care este perspectiva de dezvoltare a domeniului?
Rolul blockchain-ului în etichetarea datelor AI
Blockchain-ul este o tehnologie de registru distribuit și descentralizat, având caracteristici de transparență, imuabilitate și trasabilitate. Aceste caracteristici pot rezolva următoarele probleme ale metodelor tradiționale în etichetarea datelor:
Acuratețea datelor și prevenirea modificărilor: fiecare înregistrare de etichetare este scrisă pe blockchain, fiind imposibil de modificat fără autorizare, garantând astfel credibilitatea etichetării.
Transparența alocării sarcinilor: blockchain-ul poate înregistra procesul de distribuire, execuție și revizuire a sarcinilor, prevenind distribuirea inechitabilă a sarcinilor sau modificarea rezultatelor.
Mecanism de stimulare: utilizând tehnologia contractelor inteligente pe blockchain, etichetații de date pot obține automat criptomonede sau alte recompense prin finalizarea sarcinilor.
Trasabilitatea datelor: sursa fiecărei etichete, informațiile despre etichetați și revizori pot fi urmărite.
Scenarii de aplicare
Etichetare distribuită: utilizând blockchain-ul, sarcinile de etichetare a datelor sunt distribuite etichetatorilor din întreaga lume, sporind eficiența procesării datelor.
Revizuirea calității: rezultatele etichetării efectuate de mai mulți oameni sunt comparate și revizuite prin tehnologia blockchain, asigurând acuratețea etichetării.
Comerțul cu date etichetate: datele etichetate pot fi tranzacționate pe blockchain, fără ca părțile implicate să se îngrijoreze de integritatea sau autenticitatea acestora.
Protecția intimității: utilizarea blockchain-ului pentru stocarea criptată a datelor etichetate, asigurând securitatea datelor personale.
Proiecte conexe
OORT DataHub: oferă servicii de etichetare a datelor descentralizate bazate pe blockchain, utilizând algoritmul Proof of Honesty pentru controlul calității. Platforma sa distribuie sarcini prin contracte inteligente, revizuiește calitatea datelor și plătește recompense, atrăgând etichetați din întreaga lume și asigurând transparența și protecția intimității datelor etichetate.
Modelul economic al token-ului proiectului este următorul:
Recompense comunitare: prin participarea la etichetarea și analiza datelor, utilizatorii pot obține recompense sub formă de token-uri $OORT. În plus, aceștia pot primi NFT-uri unice legate de contribuțiile lor, care oferă drepturi suplimentare, cum ar fi recompense pentru creșterea randamentului anual (APY), reduceri la echipamente și drepturi de vot în DAO.
Gaj pentru sarcini: participanții trebuie să gajeze cel puțin 210 token-uri $OORT pentru a-și arăta angajamentul față de sarcină, iar după finalizarea sarcinii, token-urile vor fi returnate și recompensele vor fi acordate.
Împărțirea veniturilor din vânzări: anumite persoane care dețin NFT-uri pot primi dividende din veniturile viitoare din vânzarea datelor, sporind astfel veniturile pe termen lung.
PublicAI: un proiect ecologic AI pe lanțul Solana, destinat conectării cererii de date și etichetaților din întreaga lume, recompensând participanții printr-un mecanism de stimulare bazat pe token-uri criptografice, în timp ce folosește tehnologia blockchain pentru a înregistra detaliile procesului de etichetare, garantând securitatea și intimitatea datelor.
Modelul economic al token-ului proiectului este următorul:
Recompense comunitare: 10% din token-urile Public vor fi utilizate pentru a recompensa utilizatorii prin airdrop-uri în etapa inițială de interacțiune, iar metodele pentru a obține airdrop-uri sunt trei: devenind AI Builder: colectând conținut de înaltă calitate de pe internet; devenind AI Validator: validând conținutul colectat; devenind AI Developer: utilizând seturi de date validate pentru a antrena agenți AI.
Distribuția token-ului: proiectul a finalizat o rundă de finanțare de seed în valoare de 2 milioane de dolari în ianuarie 2024, investitorii incluzând IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital și mai mulți profesori de renume din domeniul inteligenței artificiale. Detaliile specifice ale distribuției token-urilor PublicAI nu au fost încă definite.
Provocările cu care ne confruntăm
În prezent, mai mulți factori limitează dezvoltarea acestui domeniu: în primul rând, etichetarea datelor AI necesită resurse de calcul și stocare ridicate; în al doilea rând, performanța proiectelor este limitată de scalabilitatea blockchain-ului; în al treilea rând, standardizarea tehnologică și reglementările nu sunt încă bine definite.
A doua problemă este, poate, cea mai mare provocare cu care ne confruntăm în prezent. Deoarece etichetarea datelor AI și antrenarea modelului necesită de obicei resurse de calcul considerabile, iar capacitatea de calcul a nodurilor din rețeaua blockchain este limitată. Cum să integrăm și să utilizăm eficient resursele de calcul distribuite pentru a satisface cerințele de calcul ale proiectelor de etichetare a datelor AI, în timp ce ne menținem caracteristica descentralizată a blockchain-ului, este o problemă urgentă de rezolvat. Se știe că Greenfield, sub egida Binance, oferă suport de stocare pentru acest domeniu, așteptându-se ca mai multe resurse de stocare și calcul să fie implementate în acest domeniu.