Alibabas neuestes KI-Modell QwQ-32B-Preview übertrifft OpenAIs O1 in einigen Benchmarks

Während der Wettbewerb im KI-Bereich intensiver wird, hat der chinesische Einzelhandelsriese Alibaba seine QwQ-32B-Preview vorgestellt, die Berichten zufolge die o1-Serie von OpenAI übertrifft.
Das neueste Modell übertrifft Berichten zufolge die Modelle o1-preview und o1-mini von OpenAI in einigen spezifischen Benchmarks, wie den AIME- und MATH-Tests, die die Leistung von KI-Modellen in Logikrätseln und Mathematikproblemen bewerten.
Alibaba hat QwQ-32B-Preview zum Download bereitgestellt.
Laut dem Einzelhandelsriesen ist Alibabas neues Modell in der Lage, komplexe und komplizierte Probleme zu lösen, im Vergleich zu normalen großen Sprachmodellen (LLMs) wie ChatGPT-4 und Claude 3.5.
Ein Artikel von Benzinga weist darauf hin, dass die QwQ-32B-Preview eines der wenigen verfügbaren Modelle unter einer großzügigen Lizenz ist, die es Benutzern ermöglicht, es herunterzuladen und zu nutzen. Das Modell ist jetzt auf der KI-Entwicklungsplattform Hugging Face verfügbar.
Allerdings hat Alibaba bestimmte Komponenten des Modells veröffentlicht, um eine vollständige Replikation des Modells oder Einblicke in seine Funktionsweise zu begrenzen.
Alibabas neuestes Modell verfügt über 32,5 Milliarden Parameter, die es ihm ermöglichen, Eingaben von bis zu 32.000 Wörtern zu verarbeiten. Mit den erheblichen Fähigkeiten des Modells und der semi-offenen Zugänglichkeit positioniert sich Alibabas neuer Teilnehmer für einen transformierenden Sprung in den KI-Denktechnologien.
Alibabas transparente Ankündigung, die die Raffinesse seines Modells unterstreicht, während OpenAI seine Parameterzahlen geheim hält.
Das Kommen dieses Modells erfolgt zu einer Zeit, in der OpenAI bedeutende Fortschritte im KI-Sektor macht. Im Oktober sprang die Bewertung von OpenAI auf 157 Milliarden Dollar nach einer erfolgreichen Finanzierungsrunde.
Früher in dieser Woche hat die SoftBank Group SFTBF Berichten zufolge ihren Anteil am ChatGPT-Hersteller durch einen Mitarbeiter-Aktienrückkauf in Höhe von 1,5 Milliarden Dollar erhöht.
Es wird auch gesagt, dass OpenAI die Entwicklung eines eigenen Webbrowsers erkundet, um den Google Chrome-Browser von Alphabets Tochtergesellschaft herauszufordern, nachdem Druck von der US-Justizbehörde ausgeübt wurde, ihn abzustoßen.
Alibaba gibt zu, dass das Modell auch Fehler hat.
Obwohl es einige einzigartige Stärken besitzt, hat das neue Modell auch Einschränkungen. Laut der Gruppe hat QwQ-32B-Preview Probleme wie unerwartete Sprachwechsel, die Benutzer verwirren könnten. Das Modell schneidet auch bei Aufgaben, die gesundes Menschenverstand erfordern, schlecht ab, was bei vielen KI-Systemen üblich ist.
Laut AutoGPT könnte das Modell in logischen Schleifen gefangen werden, was die Antworten verzögert.
Trotz seiner Mängel ermöglichen seine Denkfähigkeiten, dass es sich selbst faktprüfen kann, wodurch Fehler reduziert, aber die Lösungszeit erhöht wird.
Durch das Nachdenken über Aufgaben und das Planen von Schritten vermeidet Alibabas Modell einige Fallstricke, die traditionelle KI-Systeme betreffen. Aber dieser Ansatz erfordert zusätzliche Zeit, die die Echtzeitanwendung einschränken könnte.
Laut Benzinga stimmen die Antworten der QwQ-32B-Preview mit den chinesischen regulatorischen Standards überein und vermeiden politisch sensible Themen.
Zum Beispiel werden politisch sensible Themen wie Taiwan Antworten geben, die mit der Haltung der chinesischen Regierung übereinstimmen.
Darüber hinaus führen Eingaben zu Ereignissen wie dem Tiananmen-Platz zu keinen Antworten, was das vorsichtige Design des Modells zeigt.
Während dies ideal für den chinesischen Markt sein könnte, kann es auch seine Anziehungskraft auf dem globalen Markt einschränken. Das Modell ist jedoch ein bedeutender Schritt in die Welt der reasoning KI. Während seine Einschränkungen seine globale Anziehungskraft einschränken mögen, machen seine anderen Komponenten wie Logik und semi-offene Natur es zu einem großen Konkurrenten für OpenAI.
Laut AutoGPT hebt die QwQ-32B-Preview das Potenzial und die Herausforderungen dieser aufregenden Grenze hervor, an der KI-Labore auf der ganzen Welt daran arbeiten, die Denktechnologie zu verfeinern.
Von Null zu Web3 Pro: Ihr 90-Tage Karriere-Startplan
Alibabas neuestes KI-Modell QwQ-32B-Preview übertrifft OpenAIs O1 in einigen Benchmarks

Weitere Inhalte des Erstellers entdecken

Aktuelle Nachrichten