Yapay zeka teknolojilerinde küresel rekabet artarken, Türkiye de bu alanda ilk büyük adımını attı. Türk yazılım şirketi VNGRS tarafından geliştirilen Kumru, yalnızca Türkçe verilerle sıfırdan eğitilmiş yerli bir büyük dil modeli olarak tanıtıldı. Gelişme, Türk teknoloji ekosisteminde önemli bir dönüm noktası olarak değerlendiriliyor. Kullanım alanları, teknik kapasitesi ve lisanslama yapısı da şimdiden merak konusu oldu.

YERLİ YAPAY ZEKA KUMRU NEDİR?

Cba5F42C C899 4583 9677 F784456D3073

Kumru, Türkiye merkezli VNGRS tarafından geliştirilen yerli bir yapay zeka dil modelidir. 7.4 milyar parametreye sahip olan model, yalnızca Türkçe verilerle sıfırdan eğitildi. Bu sayede Türkçeye özgü dil yapısı, ek kullanımı, sözdizimi ve anlam ilişkilerini çok daha başarılı şekilde analiz edebiliyor.

Modelin temelinde açık kaynaklı Mistral-v0.3 mimarisi bulunuyor. Ayrıca, LLaMA-3 teknik dokümantasyonu geliştirme sürecinde referans olarak kullanıldı. Eğitim süreci boyunca yaklaşık 500 GB'lık temizlenmiş Türkçe veri kullanıldı ve eğitim NVIDIA H100 ve H200 GPU’ları üzerinde 45 gün sürdü.

YERLİ YAPAY ZEKA KUMRU NASIL KULLANILIR?

Kumru, doğal dil işleme (NLP) tabanlı görevlerde kullanılmak üzere tasarlandı. Kullanım alanları arasında şunlar öne çıkıyor:

  • Metin özetleme

  • Soru-cevap sistemleri

  • Belge işleme

  • İçerik üretimi

  • Dilbilgisi düzeltme

  • Bilgi çıkarımı

Model, kurum içi konuşlandırmaya uygun olarak geliştirilmiş durumda. Yani Kumru, firmaların veya kamu kurumlarının kendi sistemlerine entegre edilerek kullanılabiliyor. Bu yapı özellikle veri güvenliği açısından avantaj sağlıyor.

Verimlilik odaklı yapısı sayesinde Kumru, RTX 3090 veya RTX A4000 gibi 16 GB VRAM’e sahip ekran kartlarında dahi sorunsuz çalışabiliyor. Bu da yüksek donanım maliyetleri olmadan kullanılabilmesini mümkün kılıyor.

YERLİ YAPAY ZEKA KUMRU ÖZELLİKLERİ NELER?

Kumru, teknik mimarisi ve uygulama başarısıyla öne çıkan birçok özellikle donatıldı:

  • Türkçeye özel sıfırdan eğitim: Çok dilli modellere göre daha isabetli analiz yapabiliyor.

  • 8.192 token bağlam uzunluğu: Yaklaşık 20 A4 sayfası kadar metni aynı anda işleyebiliyor.

  • Optimize edilmiş hafif yapı: Orta düzey donanımlarda dahi çalışabiliyor.

  • RegEx tabanlı tokenizasyon: Noktalama ve sayıları daha verimli şekilde işliyor.

  • Kod ve İngilizce anlama becerisi: Türkçe odaklı olsa da çok yönlü kullanım mümkün.

  • Kuruma özel fine-tuning: Farklı sektörlere göre özelleştirilebiliyor.

Yapılan testlerde Kumru, Türkçeye özgü görevlerde LLaMA-3–70B, Qwen-2–72B gibi daha büyük modelleri geride bırakmayı başardı. Özellikle özetleme ve dilbilgisi düzeltme görevlerinde yüksek başarı sağladı.

YERLİ YAPAY ZEKA KUMRU ÜCRETLİ Mİ, FİYATI NE KADAR?

Kumru şu anda açık kaynak olarak sunulmuyor. Model, VNGRS tarafından lisanslama ve kurum içi konuşlandırma esasına göre ücretli olarak sağlanıyor. Hedef kullanıcı kitlesi bireysel değil; kamu kurumları ve büyük işletmeler olarak tanımlanıyor.

Acun Ilıcalı Açıkladı: Yakışıklı Oyuncu Survivor Kadrosunda!
Acun Ilıcalı Açıkladı: Yakışıklı Oyuncu Survivor Kadrosunda!
İçeriği Görüntüle

Fiyatlandırma, kurumun ihtiyaç duyduğu kullanım senaryosuna ve sistem entegrasyonuna göre belirleniyor. Herhangi bir sabit paket fiyatı açıklanmadı. Ancak, şirketlerin kendi sunucularına entegre edebileceği esnek ve güvenli bir yapıda sunulması, finans, hukuk ve sağlık gibi kritik sektörler için önemli bir tercih nedeni olarak öne çıkıyor.