16 Aralık'ta Kazakistan, KazLLM adı verilen ilk büyük dil modelini (LLM) piyasaya sürerek ileriye doğru büyük bir teknolojik adım atmaya hazırlanıyor. Bu lansman ülkenin 33. bağımsızlığının yıldönümüne denk geliyor.

Ayrıca okuyun: Üretken AI, video oyunu NPC'lerine hayat veriyor

Akıllı Sistemler ve Yapay Zeka Enstitüsü (ISSAI), 18 Temmuz'da Nazarbayev Üniversitesi'nde düzenlediği brifingde bunu duyurdu. Projenin veri toplama işlemi Mart ayında başladı ve model, NVIDIA H100 düğümleriyle sağlanan bir bulut bilişim platformu kullanılarak eğitiliyor.

Öğrenciler ve uzmanlar yapay zeka geliştirmede güçlerini birleştiriyor

KazLLM projesinde Nazarbayev Üniversitesi öğrencileri, Astana Bilişim Üniversitesi öğrencileri, Bolashak bursu mezunları ve yerel katılımcılar iş birliği yapıyor. Bu girişimin temel amacı KazLLM'yi oluşturmak ve akıllı yapay zeka araçları ve uygulamaları üretebilecek bir iş gücü yaratmaktır.

ISSAI'nin kurucusu ve başkanı Profesör Atakan Varol, bu proje aracılığıyla diğer ülkelerle olan teknolojik uçurumun kapatılmasını istiyor. Tamamlanmasından sonra Kazakistan'ın teknoloji açısından önde gelen ülkelerden sadece 18 ay geride olacağını söyledi. Ses özelliklerinin entegre edilmesinin bu süreyi 12 aya kısaltması beklenirken, ek dil görüş modeli ilerlemeleri Kazakistan'ı yapay zeka gelişiminde ön sıralara taşıyabilir.

Wikipedia makaleleri, haber kaynakları, hükümet web siteleri ve Common Crawl gibi açık veri kümeleri, projeye ilişkin verilerin elde edildiği kaynaklardan bazılarıdır. ISSAI, beş yıldan fazla bir süredir Kazak dili için özel olarak tasarlanmış çeşitli doğal dil işleme veri kümeleri oluşturuyor. Bu kapsamlı veri kümesi koleksiyonu, KazLLM'nin etkili ve doğru bir şekilde eğitilmesine yardımcı olduğundan çok önemlidir.

Kazakistan yapay zeka inovasyonuyla ulusal güvenlik ve bilgi güvenliğini ele almayı umuyor

KazLLM projesinin ulusal ve bilgi güvenliği açısından etkileri vardır. Kazakistan, yerel olarak yapılmış bir dil modeli oluşturarak, veri ihlallerine ve çarpık bilgilerin sunulmasına neden olabilecek yabancı teknolojiye olan bağımlılığını en aza indirmeyi umuyor.

Dış İlişkilerden Sorumlu Direktör Yardımcısı ve Baş Veri Bilimcisi Madina Abdrakhmanova, modelin geniş kapsamlı eğitim külliyatına dikkat çekti. Yönetmen, "Kazakça, Rusça, İngilizce ve Türkçe dillerinde en az 100 milyar tokenden oluşacak ve her dil 25 milyar token ile temsil edilecek" dedi.

Şu anda projede, İngilizce'yi Kazakça'ya çeviren Tilmash tercümanı aracılığıyla üretilen 26 milyar token dahil olmak üzere 30 milyardan fazla token bulunuyor. Bu çeviri yeteneği, modelin Kazakça dilinde tutarlı ve doğru metin üretebilmesini sağlar.

Ayrıca okuyun: OpenAI lite oluyor, GPT-4o mini adı verilen daha ucuz AI modelini piyasaya sürüyor

ISSAI, KazLLM'yi daha erişilebilir kılmak için OpenAI modellerinde olduğu gibi kullanıcı dostu bir arayüz oluşturmayı amaçlıyor. Tamamlandığında, performansı en üst düzeye çıkarmak için model etkileşimini, insan geri bildirimlerinden takviyeli öğrenmeyi ve farklı durumlara göre ayarlamayı destekleyebilecek. KazLLM genel abonelik paketi olarak ve deneyimli kullanıcılar için API olarak sunulacaktır.