Rachel, Golden Finance

Am 27. November schrieb Zhao Changpeng auf X, dass Aufgaben wie KI-Datenbeschriftung sehr gut durch Blockchain abgeschlossen werden können, da sie auf kostengünstige globale Arbeitskräfte zurückgreifen und sofortige Zahlungen in Kryptowährung ermöglichen, wodurch geografische Einschränkungen aufgehoben werden.

Datenbeschriftung bezieht sich auf die manuelle oder automatisierte Beschriftung von Rohdaten (wie Text, Bilder, Audio usw.), um ihnen spezifische strukturierte Informationen zu verleihen. Die beschrifteten Daten werden verwendet, um maschinelles Lernen oder KI-Modelle zu trainieren, zum Beispiel die Zuordnung von Emotionen (positiv, negativ, neutral) zu Texten ist eine Art der Datenbeschriftung. Die Verwendung von Blockchain für die KI-Datenbeschriftung eignet sich besonders für Szenarien, die hohe Transparenz, Vertrauenswürdigkeit und verteilte Zusammenarbeit erfordern. Dies kann nicht nur die Effizienz und Qualität der Datenbeschriftung verbessern, sondern auch neue Möglichkeiten für globale Zusammenarbeit und Datenaustausch schaffen.

Aktuell, welche hochwertigen Projekte gibt es in diesem Bereich? Wie sind die Entwicklungsaussichten?

Die Rolle der Blockchain in der KI-Datenbeschriftung

Blockchain ist eine dezentrale, verteilte Buchhaltungstechnologie mit Eigenschaften wie Transparenz, Unveränderlichkeit und Nachverfolgbarkeit. Diese Eigenschaften können in der Datenbeschriftung die folgenden Probleme traditioneller Methoden lösen:

  • Datenauthentizität und Unveränderlichkeit: Jeder Beschriftungsdatensatz wird in der Blockchain gespeichert und kann nicht willkürlich geändert werden, was die Glaubwürdigkeit der Beschriftung gewährleistet.

  • Transparenz bei der Aufgabenverteilung: Die Blockchain kann den Verteilungs-, Ausführungs- und Prüfprozess von Aufgaben aufzeichnen, um unfaire Aufgabenverteilungen oder Ergebnisveränderungen zu verhindern.

  • Anreizmechanismus: Durch die Verwendung der Smart-Contract-Technologie der Blockchain können Datenbeschrifter automatisch Kryptowährungen oder andere Belohnungen erhalten, indem sie Aufgaben abschließen.

  • Datenherkunft: Die Herkunft jedes Beschriftungsdatensatzes sowie die Informationen über Beschrifter und Prüfer können nachverfolgt werden.

Anwendungsszenarien

  • Verteilte Beschriftung: Durch die Nutzung der Blockchain können Datenbeschriftungsaufgaben an Beschrifter weltweit verteilt werden, was die Datenverarbeitungseffizienz erhöht.

  • Qualitätsprüfung: Die Ergebnisse mehrerer Beschriftungen werden durch Blockchain-Technologie verglichen und geprüft, um die Genauigkeit der Beschriftung sicherzustellen.

  • Markthandelsdaten: Die beschrifteten Daten können auf der Blockchain gehandelt werden, ohne dass Käufer und Verkäufer sich um die Integrität oder Authentizität der Daten sorgen müssen.

  • Datenschutz: Die Verwendung der Blockchain zur verschlüsselten Speicherung von Beschriftungsdaten gewährleistet die Sicherheit privater Daten.

Verwandte Projekte

  • OORT DataHub: Bietet dezentrale Datenbeschriftungsdienste auf Blockchain-Basis an und verwendet den Proof of Honesty-Algorithmus zur Qualitätskontrolle. Die Plattform verteilt Aufgaben über Smart Contracts, überprüft die Datenqualität und zahlt Belohnungen, um globale Beschrifter anzuziehen und die Transparenz und den Datenschutz der beschrifteten Daten sicherzustellen.

Das wirtschaftliche Modell des Projekttokens ist wie folgt:

Gemeinschaftsbelohnung: Durch die Teilnahme an der Datenbeschriftung und -analyse können Benutzer $OORT-Token-Belohnungen erhalten. Darüber hinaus können sie möglicherweise einzigartige NFTs erhalten, die an ihren Beitrag gebunden sind, und diese NFTs bieten zusätzliche Vorteile wie Belohnungen zur Erhöhung der jährlichen Rendite (APY), Gerätereduzierungen und DAO-Stimmrechte.

Aufgaben-Staking: Teilnehmer müssen mindestens 210 $OORT-Token staken, um ihr Engagement für die Aufgabe zu zeigen. Nach Abschluss der Aufgabe werden die Token zurückgegeben und Belohnungen ausgezahlt.

Verteilung der Verkaufserträge: Einige NFT-Inhaber können auch von zukünftigen Einnahmen aus dem Datenverkauf profitieren, was die langfristigen Erträge weiter steigert.

  • PublicAI: Ein KI-Ökosystemprojekt auf der Solana-Blockchain, das darauf abzielt, Datenanforderer und globale Beschrifter zu verbinden. Es belohnt Teilnehmer durch Anreizmechanismen mit Kryptowährungen und nutzt gleichzeitig Blockchain-Technologie, um die Einzelheiten des Beschriftungsprozesses aufzuzeichnen und die Datensicherheit und den Datenschutz zu gewährleisten.

Das wirtschaftliche Modell des Projekttokens ist wie folgt:

Gemeinschaftsbelohnung: 10 % der Public-Token werden für die Airdrop-Belohnung für die frühen Interaktionen der Benutzer verwendet. Konkret gibt es drei Methoden, um Airdrops zu erhalten: AI Builder werden: Hochwertige Internetinhalte sammeln; AI Validator werden: Die gesammelten Inhalte verifizieren; AI Developer werden: Validierte Datensätze verwenden, um KI-Agenten zu trainieren.

Tokenverteilung: Das Projekt hat im Januar 2024 eine Seed-Runde in Höhe von 2 Millionen US-Dollar abgeschlossen, an der Investoren wie IOBC Capital, Foresight Ventures, Solana Foundation, Everstate Capital und mehrere bekannte Professoren aus der KI-Wissenschaft beteiligt waren. Die spezifischen Details zur PublicAI-Tokenverteilung sind jedoch noch nicht bekannt.

Herausforderungen

Derzeit gibt es mehrere Faktoren, die die Entwicklung dieses Bereichs einschränken: Erstens benötigen KI-Datenbeschriftungen hohe Rechen- und Speicherressourcen; zweitens wird die Leistung des Projekts durch die Skalierbarkeit der Blockchain eingeschränkt; drittens sind die technischen Standards und die Regulierung noch unzureichend.

Der zweite Punkt könnte die größte Herausforderung sein, mit der wir derzeit konfrontiert sind. Da die KI-Datenbeschriftung und das Modelltraining in der Regel eine große Menge an Rechenressourcen benötigen und die Rechenleistung der Knoten im Blockchain-Netzwerk begrenzt ist. Wie man die dezentralen Eigenschaften der Blockchain aufrechterhält und gleichzeitig die verteilten Rechenressourcen effektiv integriert und nutzt, um den Rechenbedarf von KI-Datenbeschriftungsprojekten zu decken, ist ein drängendes Problem. Berichten zufolge bietet Binance's Greenfield Unterstützung für diesen Bereich, und es wird erwartet, dass mehr Speicher- und Rechenressourcen in diesem Bereich praktisch eingesetzt werden.