Technologe und CEO von Synesis One, Isaac Bang, warnt vor dem „extrem gefährlichen“ Szenario, dass einige Tech-Giganten Daten horten und das Rennen um künstliche Intelligenz (KI) anführen. Er plädiert für die „Demokratisierung“ der KI-Macht, um sicherzustellen, dass der letztendliche „Gewinner“ des laufenden KI-Rennens nicht zu einem Branchenkoloss wird.
Laut Bang liegt ein Teil der Lösung darin, die dezentrale Datenbeschaffung gegenüber der Abhängigkeit von großen datenzentrierten Unternehmen zu priorisieren. Wie Bang in seinen schriftlichen Antworten an Bitcoin.com News erklärt, ermöglicht die dezentrale Datenbeschaffung Unternehmen, auf interne Datenwissenschaftler zu verzichten. Stattdessen können sie „Arbeiten anbieten“ an einen allgemeinen Pool von digitalen Arbeitern oder Spezialisten für Datenanalysen.
Dieses Modell, glaubt Bang, ist ideal für Unternehmen, die skalieren möchten, aber keine internen Ressourcen haben. Über den kommerziellen Vorteil hinaus hilft die dezentrale Datenbeschaffung auch, die Herausforderung der Datenverzerrung zu bekämpfen, mit der zentrale Technologie-Riesen konfrontiert sind.
Während Regierungen Bedenken hinsichtlich der öffentlichen Sicherheit in Bezug auf dezentrale Datenverwaltung äußern, warnt Bang dennoch vor umfassenden Vorschriften, die letztendlich Innovationen behindern könnten. Stattdessen fordert er die Regulierungsbehörden und Gesetzgeber auf, zu untersuchen, wie „dezentrale Datenbeschaffung genutzt werden kann und wird“, bevor sie Richtlinien erlassen.
Bangs zusätzliche Antworten beziehen sich auf den Wettbewerb in der KI-Branche und die damit verbundenen inhärenten Risiken. Im Folgenden sind die Antworten des CEO von Synesis One auf die gesendeten Fragen aufgeführt.
Isaac Bang (IB): KI ist die Schlüsseltechnologie, die die vierte industrielle Revolution einleitet, und ihre Auswirkungen sind weitreichender, als wir uns derzeit vorstellen können. Ein paar dominante Akteure, die die Daten horten und das KI-Rennen anführen, sind in vielerlei Hinsicht extrem gefährlich. Nicht nur wird die KI-Technologie es Unternehmen ermöglichen, produktiver zu werden und ihren Gewinn zu maximieren, sondern sie wird auch Regierungen dabei helfen, ihre militärischen Fähigkeiten sowohl physisch als auch digital zu verbessern. Der „Gewinner“ des KI-Rennens wird eine dominante Kraft sein, und es ist entscheidend, dass wir jetzt handeln, um die Macht der KI zum Wohle aller zu demokratisieren.
IB: Traditionell sammeln Unternehmen Daten von ihren Nutzern/Kunden, während sie das Produkt oder die Dienstleistung nutzen. Um die gesammelten Daten für KI zu nutzen, beschäftigen Unternehmen Datenwissenschaftler und andere Spezialisten, um die Daten zu bereinigen und zu annotieren. Die traditionellen Methoden zur Datensammlung und -vorbereitung sind für große Unternehmen mit vielen Nutzern und viel Geld effizient. Für kleinere und mittelständische Unternehmen wird es jedoch schwierig sein, ihren Datenbedarf zu skalieren.
Dezentrale Datenbeschaffung ist die Beschaffung von Rohdaten oder Datenvorverarbeitung durch ein großes Netzwerk von digitalen Arbeitern, die bereit und in der Lage sind, die benötigten Daten oder Vorverarbeitungsarbeiten bereitzustellen. Unternehmen oder Entwickler können, ohne Nutzer oder interne Datenwissenschaftler zu haben, ein Belohnungssystem für Datenaufgaben aus einem allgemeinen Pool von digitalen Arbeitern oder Spezialisten einrichten, um Datenarbeiten durchzuführen. Dies ermöglicht es Unternehmen, zu skalieren, ohne eine immense Menge an Geld und Zeit für die Einstellung interner Mitarbeiter ausgeben zu müssen.
IB: Menschen haben die Fähigkeit, logisches Denken zu betreiben. KI, die heute maschinelles Lernen verwendet, nutzt statistische Berechnungen, um Muster zu erkennen, ohne logisches Denken. Mit der Verbesserung der KI-Modelle wird die Notwendigkeit nach qualitativ hochwertigen Daten und domänenspezifischen Daten immer wertvoller. Zum Beispiel ist ein allgemeines LLM nicht für den Einsatz im medizinischen Bereich geeignet. Das LLM könnte für ein spezifisches medizinisches Fachgebiet feinabgestimmt werden, aber dies würde Menschen mit Expertenwissen in diesem Bereich erfordern. Dieses Konzept gilt nicht nur für allgemeine LLMs, sondern für alle anderen KI-Anwendungen mit spezifischeren Anwendungsfällen.
IB: Es ist einfach – je vielfältiger der Pool von Datenanbietern und Datenannotatoren ist, desto vielfältiger und repräsentativer werden die Daten sein. In einem dezentralen Crowdsourcing-Netzwerk kommen die Anbieter der Rohdaten und/oder Datenannotatoren nicht von einer Plattform, einem Unternehmen, einem Netzwerk oder einer Gruppe. Dies reduziert die Datenverzerrung, die ein zentrales Unternehmen erleben könnte.
IB: Einer der praktischsten Anwendungsfälle liegt im Bereich der natürlichen Sprache. Unternehmen sind heute global, und das erfordert, dass sie in der Lage sind, denselben Qualitätsstandard an Dienstleistungen und Produkten in allen Sprachen der Märkte, die sie bedienen, zu bieten. Allerdings sind viele der leistungsstärksten LLMs heute hauptsächlich auf Englisch basierend. Wir haben gesehen, dass Unternehmen auf Crowdsourcing für verschiedene Sprachen und Dialekte zurückgreifen, nicht nur für KI-Bedürfnisse, wie die Lokalisierung ihrer Produkte.
IB: Solange alle Datentransaktionen onchain aufgezeichnet werden, sollte die Transparenz ausreichen, um Bedenken hinsichtlich der Aufsicht und Kontrolle auszuräumen. Wenn die Aufsichtsbehörden wirklich besorgt über die öffentliche Sicherheit sind, sollte es mehr Vorschriften für das Management und die Nutzung von Daten durch zentralisierte Entitäten geben. Anstatt voreilige Schlüsse aus Angst zu ziehen, sollten die Gesetzgeber zunächst lernen, wie dezentrale Datenbeschaffung genutzt werden kann und wird. Wenn böswillige Absichten oder Nutzungen vorliegen, sollten sie eingreifen, anstatt umfassende Vorschriften zu erlassen, die Innovationen schädigen.
CEO von Synesis One, Isaac Bang
IB: Im Moment haben wir keine missbräuchliche Nutzung der Plattform beobachtet. Es ist schwierig, potenzielle Risiken zu erkennen, die eine missbräuchliche Nutzung auf nationaler Sicherheitsebene haben könnte. Auf der Ebene der Datenspeicherung kann Synesis sowohl mit verteilten Speicherlösungen (z.B. IPFS, Arweave) als auch mit zentralisierten Lösungen (z.B. AWS) arbeiten, sodass es dem Kunden überlassen bleibt. Auf der Ebene der Datenannotation durchlaufen alle eine Peer-Review, und sogar die Peer-Reviews können vom Kunden spezifisch optimiert werden, um böswilliges Verhalten zu verhindern.
IB: Bei Synesis streben wir an, das weltweit größte digitale Netzwerk von Spezialisten und branchenspezifischen Experten zu sein, die bei sämtlichen KI-Datenbedarfen von Unternehmen helfen. Wir sehen bereits einen Anstieg der Nachfrage nach Expertenwissen für KI-Training (z.B. Feinabstimmung, RLHF, Rohdaten), da KI für immer mehr Anwendungsfälle genutzt wird. Wir möchten Unternehmen jeder Größe in jedem Bereich ermöglichen, ihren KI-Datenbedarf zu skalieren, indem sie auf unsere Plattform und unser Netzwerk von digitalen Experten weltweit zugreifen. Dies wird nicht nur Unternehmen beim Wachsen helfen, sondern auch neuen Menschen auf der ganzen Welt die Möglichkeit geben, Geld zu verdienen, indem sie ihr Wissen und ihre Fähigkeiten online zur Verfügung stellen.
IB: Überraschenderweise gibt es viele Schmerzpunkte, die die etablierten Unternehmen für ihre Arbeiter nicht gelöst haben. Einer betrifft die Zahlungen, da grenzüberschreitende Zahlungen oft teuer und langsam sind. Der andere Hauptschmerzpunkt ist der Mangel an Transparenz. Dies ist ein großer Vorteil für uns, da unser Auszahlungssystem kein Mindestguthaben erfordert, keine Gebühren hat und sofort ist. Wir haben viele frustrierte digitale Arbeiter integriert, die die großen Akteure im Bereich Web2-Datenannotation genutzt haben. Während wir mehr und mehr digitale Arbeiter aus allen Bereichen gewinnen und das Netzwerk ausbauen, werden unsere Lösungen für potenzielle Kunden immer attraktiver.
IB: Eines der größten Risiken, mit denen unsere Nutzer konfrontiert sind, ist die Diskrepanz zwischen Wissen und/oder Fähigkeiten, die für bestimmte Kampagnen benötigt werden. Einige der Datenkampagnen sind technisch, und wenn ein Nutzer nicht gut abschneidet, wird er nicht gut belohnt. Alles, einschließlich des Rufs eines Nutzers, basiert auf der Genauigkeit der Arbeit, die von den Nutzern bereitgestellt wird. Einige Aufgaben erfordern technische Fähigkeiten/Wissen oder haben steile Lernkurven. Daher sollte jeder neue Nutzer auf der Plattform damit rechnen, etwas Zeit damit zu verbringen, zu lernen, wie man einige der Kampagnen/Datenaufgaben durchführt. Wir aktualisieren und erstellen kontinuierlich neue Bildungs- und Schulungsmaterialien für neue und bestehende Nutzer, damit wir sie unterstützen können, besser abzuschneiden. Dies kommt allen zugute, solange die Nutzer Zeit damit verbringen, das Material zu lesen und zu lernen.