Ein Anstieg neuer Nutzer auf der Social-Media-Plattform BlueSky hat auch zu einem Anstieg von „schädlichen Inhalten“ geführt, was zu einer Massenmoderationskampagne führte, um Bilder aus dem Netzwerk zu entfernen, sagte die Plattform am Montag.
„Wir erleben einen enormen Anstieg von Nutzern, und damit einhergehend einen vorhersehbaren Anstieg von schädlichen Inhalten, die im Netzwerk gepostet werden“, sagte das Sicherheitskonto von BlueSky. „Infolgedessen haben wir kürzlich einige kurzfristige Moderationsentscheidungen getroffen, um Rückruf über Präzision zu priorisieren, für einige sehr hochgradige Politikbereiche wie Kindersicherheit.“
Nach dem Sieg des Präsidentenwahlkandidaten Donald Trump Anfang dieses Monats verließen Millionen von Nutzern X, der früheren Twitter-Plattform, auf der Suche nach Alternativen.
Viele sind zu alternativen sozialen Medienplattformen migriert, wobei 35 Millionen zu Metas Threads und 20 Millionen zu BlueSky – der dezentralen Social-Media-Plattform, die von dem ehemaligen Twitter-CEO Jack Dorsey ins Leben gerufen wurde – in den letzten drei Wochen allein kamen.
Die Flut neuer Nutzer kam zu den mehr als einer Million Brasilianern hinzu, die nach dem Verbot von X durch einen Richter in der südamerikanischen Nation im September zu BlueSky strömten.
BlueSky erlebte im Oktober einen weiteren Anstieg, nachdem X-Eigentümer Elon Musk sagte, Tweets könnten verwendet werden, um die Grok-KI zu trainieren.
Allerdings berichtete BlueSky, zusammen mit seinen neuen Nutzern, Anfang dieses Monats von einem Anstieg von Spam, Betrug und "Trolling-Aktivitäten", neben einem besorgniserregenden Anstieg von kinderpornografischem Material.
Laut einem Bericht der Tech-Website Platformer hatte BlueSky im Jahr 2023 zwei bestätigte Fälle von kinderorientierten sexuellen Inhalten, die im Netzwerk gepostet wurden. Am Montag gab es acht bestätigte Fälle.
„In den letzten 24 Stunden haben wir mehr als 42.000 Meldungen erhalten (ein Allzeithoch für einen Tag). Wir erhalten etwa 3.000 Meldungen/Stunde. Um das in den Kontext zu setzen: Im gesamten Jahr 2023 haben wir 360.000 Meldungen erhalten“, sagte BlueSky.
BlueSky sagte, dass seine Massenmoderation möglicherweise zu „Überdurchsetzung“ und Kontosperrungen geführt hat. Einige der fälschlicherweise gesperrten Konten wurden wiederhergestellt, während andere weiterhin Einsprüche einlegen konnten.
„Wir erweitern unser Moderationsteam, während wir wachsen, um sowohl die Schnelligkeit als auch die Genauigkeit unserer Moderationsmaßnahmen zu verbessern“, sagte das Unternehmen.
Um KI-generierte Deepfakes auf seiner Plattform einzudämmen, ging BlueSky im Januar eine Partnerschaft mit der in Los Angeles ansässigen Internet-Watchdog-Gruppe Thorn ein.
BlueSky hat Thorn's KI-gestützte Technologie zur sicheren Moderation eingeführt, die kinderorientierte sexuelle Inhalte erkennt und textbasierte Gespräche identifiziert, die auf Kindesmissbrauch hindeuten.
Während X erwachsene Inhalte erlaubt, gab die Social-Media-Plattform im Mai bekannt, dass sie auch Thorns Technologie zur sicheren Moderation implementiert hat, um kinderpornografisches Material auf der Seite zu bekämpfen.
„Wir haben viel aus unserem Beta-Test gelernt“, sagte Rebeccca Portnoff, Vizepräsidentin für Datenwissenschaft bei Thorn, zu Decrypt zu diesem Zeitpunkt.
„Während wir wussten, dass Kindesmissbrauch in allen Arten von Inhalten, einschließlich Text, auftritt, sahen wir konkret in diesem Beta-Test, wie maschinelles Lernen/KI für Text einen realen Einfluss im großen Maßstab haben kann“, sagte sie.
Bearbeitet von Sebastian Sinclair und Josh Quittner