Çin
merkezli yapay zeka girişimi DeepSeek, yeni nesil büyük dil modeli
DeepSeek R2 ile
dikkatleri üzerine çekiyor.
Henüz resmi olarak piyasaya sürülmemiş olsa da, sızdırılan bilgiler
ve teknik detaylar, R2’nin ChatGPT gibi mevcut modellerle rekabet edebilecek
kapasitede olduğunu gösteriyor.
DeepSeek R2: Performans
ve verimlilikte yeni bir seviye
Sızdırılan bilgilere göre, DeepSeek R2, 512 PetaFLOPS‘luk işlem gücüne ulaşarak,
NVIDIA A100 tabanlı
sistemlerin %91’ine denk bir verimlilik sağlıyor.
Bu yüksek performans, Ascend
910C hızlandırıcılarıyla elde ediliyor ve eğitim
maliyetlerini %97 oranında azaltıyor.
Ayrıca, R2’nin çok dilli akıl yürütme ve programlama yeteneklerinde
önemli iyileştirmeler sunduğu belirtiliyor.
DeepSeek R2 ne
zaman çıkacak?
DeepSeek R2’nin resmi lansmanı için kesin bir tarih verilmemiş olsa
da, şirketin Mayıs 2025’te piyasaya sürmeyi planladığı
biliniyor.
Ancak, sızdırılan bilgiler ve artan spekülasyonlar, lansmanın daha
erken bir tarihte gerçekleşebileceğini gösteriyor.
DeepSeek, önceki modellerinde olduğu gibi R2’yi de açık kaynaklı
olarak sunmayı planlıyor.
DeepSeek’in önceki modeli R1, düşük maliyetli ve yüksek performanslı yapısıyla
dikkat çekmişti.
R2’nin piyasaya sürülmesiyle birlikte, Çin’in yapay zeka alanındaki
etkisinin daha da artması bekleniyor.
Bu gelişme, özellikle OpenAI, Anthropic ve Google DeepMind gibi Batılı teknoloji devleri için
ciddi bir rekabet anlamına geliyor.
Ayrıca, DeepSeek’in açık kaynak stratejisi, dünya genelinde yapay
zeka teknolojilerinin daha hızlı benimsenmesine katkı
sağlayabilir.