Araştırmacılar ChatGPT'yi öğrendiği verilerden alıntı yapmaya zorladı

"(Üretim) Dil Modellerinden Eğitim Verilerinin Ölçeklenebilir Çıkarılması" ( arXiv:2311.17035 ) bilimsel makalesi, çeşitli dil modellerinden eğitim veri kümesi verilerinin çıkarılmasını analiz eder. Araştırmacılar hem yerel modelleri hem de OpenAI'nin ticari çözümünü test etti. ChatGPT'yi GPT-3.5'in eğitildiği verileri alıntılamaya zorlamak için bir hizalama saldırısı kullanıldı.

Yeni, benzersiz içerik oluşturmak için üretken sinir ağı modelleri büyük miktarda veri üzerinde eğitilir. Eğitim süreci sırasında modeller, eğitim veri kümelerinden örnekleri “hatırlar”. Bir saldırgan bu örnekleri modelden çıkarabilir.

Önceki paragrafta yer alan ifadeler sadece spekülasyon değildir; pratikte iyi bir şekilde test edilmiştir. Bu, örneğin difüzyon modelleri için gösterilmiştir ( arXiv:2301.13188 ).

Transformatörlerdeki büyük dil modelleri (LLM'ler) de buna duyarlıdır. Bu konuyla ilgili araştırmalar genellikle okuyucuyu özel verilerin ( arXiv:2202.05520 , arXiv:1802.08232 ) çıkarılması tehlikesiyle korkutur. Aslında, 2021 tarihli "Büyük Dil Modellerinden Eğitim Verilerinin Çıkarılması" ( arXiv:2012.07805 ) çalışmasında isimler, telefon numaraları, e-posta adresleri ve hatta bazen sohbet mesajları bile GPT-2'den "çıkarılmıştır".

Diğer bilimsel çalışmalar hafızanın hacmini değerlendiriyor. Bazı BYM'lerin eğitim veri kümesinin en azından bir yüzdesini (arXiv:2202.07646) depoladığı iddia edilmektedir. Öte yandan, bu üst sınırın bir tahminidir ve pratik olarak çıkarılabilir eğitim veri seti verilerinin miktarını belirtmeye yönelik bir girişim değildir.

"(Üretim) Dil Modellerinden Eğitim Verilerinin Ölçeklenebilir Çıkarılması" ( arXiv:2311.17035 ) adlı yeni bilimsel makalenin yazarları, bu yaklaşımları birleştirmeye çalıştı: yalnızca BYM'ye böyle bir saldırıyı göstermek için değil, aynı zamanda veri miktarını tahmin etmek için de bu çıkarılabilir. Metodoloji ölçeklenebilir: Trilyonlarca jetonluk modellerdeki “anıları” ve terabaytlık eğitim veri kümelerini tespit eder.

#GPT-4 #GPT4 #BinanceTournament #Airdrop #elonMusk

$BNB $XRP $SOL