Şirketin 8 Ağustos'ta yayınladığı bilgilere göre, OpenAI'nin GPT-4o yapay zeka modeli, üretilen metinler aracılığıyla insan siyasi görüşlerini ikna etme potansiyeli söz konusu olduğunda "orta düzeyde risk" gösteriyor.

OpenAI, "Sistem Kartı" adlı bir belgede, şirketin amiral gemisi ChatGPT hizmetini destekleyen en üst düzey GPT-4o modelinin güvenlik testlerine yönelik çabalarını açıkladı.

OpenAI'ye göre GPT-4o, siber güvenlik, biyolojik tehditler ve model özerkliğiyle ilgili zarar potansiyeli söz konusu olduğunda nispeten güvenlidir. Bunların her biri "düşük riskli" olarak etiketlenmiştir, bu da şirketin ChatGPT'nin duyarlı hale gelmesinin ve insanlara doğrudan zarar vermesinin olası olmadığını düşündüğünü gösterir.

Siyasi İkna

Ancak, "ikna" kategorisinde model karışık notlar aldı. "Ses" kategorisinde, hala düşük riskli olarak kabul ediliyor. Ancak metinsel ikna alanında, OpenAI bunun "orta riskli" olduğunu belirtti.

Bu değerlendirme özellikle modelin "müdahale" yöntemi olarak siyasi görüşleri ikna etme potansiyeliyle ilgilendi. Bu deney yapay zekanın önyargısını değil, ikna edici siyasi konuşma üretme konusundaki yerleşik yeteneğini ölçtü.

OpenAI'ye göre model sadece kısa bir süreliğine "orta eşiği geçti", ancak modelin çıktısının profesyonel insan yazarların çıktılarından yaklaşık dörtte bir oranında daha ikna edici olduğu anlaşılıyor:

“Metin kipi için, katılımcıların seçili siyasi konulardaki görüşleri üzerinde GPT-4o tarafından oluşturulan makalelerin ve sohbet robotlarının ikna ediciliğini değerlendirdik. Bu AI müdahaleleri, profesyonel insan tarafından yazılmış makalelerle karşılaştırıldı. AI müdahaleleri, toplamda insan tarafından yazılmış içerikten daha ikna edici değildi, ancak on iki örnekten üçünde insan müdahalelerini aştı.”

Özerklik

Model, özerklik alanında tahmin edilebileceği gibi düşük puan aldı. OpenAI'nin testlerine göre, GPT-4o kendi kodunu güncelleyebilme, kendi ajanlarını oluşturabilme veya hatta makul miktarda güvenilirlikle bir dizi zincirleme eylemi yürütebilme yeteneğine yakın bile değil.

Şirket, "GPT-4o'nun otonom eylemleri sağlam bir şekilde gerçekleştiremediğini" yazdı.

İlgili: Altman'ın çilek bahçesini paylaşmasının ardından yeni GPT modeli için spekülasyonlar arttı