Ağda şüpheli bir “kimseye ait olmayan” yapay zeka modülü belirdi, bu modül DeepSeek projesiyle ilişkili olabilir.
Hunter Alpha – gizemli bir model, DeepSeek hakkında şüpheler uyandırıyor
OpenRouter platformunda yazar belirtilmeden ortaya çıkan yeni AI modeli, gazeteciler ve araştırmacıların dikkatini hızla çekti. 11 Mart'ta “Hunter Alpha” olarak yayımlandı ve daha sonra platform tarafından “gizli model” olarak işaretlendi, bu da Çin girişimi DeepSeek'in resmi sürümünden önce gizlice bir sonraki nesil AI'sını test edebileceği söylentilerini güçlendirdi.
Uzmanlar ne diyor
* Reuters, Hunter Alpha sohbet botu ile dizi testler yaptı.
- Bot kendisini “Çince diline ağırlık veren Çince model” olarak tanımladı.
- Eğitim verilerinin Mayıs 2025’e kadar uzandığını belirtti – bu tarih, DeepSeek'in kendi sohbet botunun da bahsettiği tarihle aynı.
- Yaratıcı hakkında sorulduğunda sadece “adımı, parametre sayısını ve bağlam penceresinin uzunluğunu biliyorum” diye cevap verdi. Hem DeepSeek hem de OpenRouter yazarını açıklamadı.
Teknik özellikler
* 1 trilyon parametre – muazzam hesaplama gereksinimlerini gösteriyor.
* 1 milyon token’a kadar bağlam penceresi – tek oturumda devasa metin miktarlarını işleyebiliyor.
AI ajanları mühendisi Nabil Haouam, bu kadar büyük bir pencere ve mantıksal akıl yürütmenin ücretsiz erişimde hemen fark edildiğini belirtti; benzer modeller genellikle yüksek maliyet gerektirir.
DeepSeek V4 ile bağlantı
* Aynı parametre seti (1 trilyon) ve bağlam penceresi (1 milyon token) DeepSeek V4’ün planlanan modelinde bildirilenle aynı.
* Bu eşleşme, Hunter Alpha’nın gelecekteki ürünün erken test sürümü olabileceği yönünde spekülasyon dalgasını başlattı.
Mantık akıl yürütmesinin analizi
* Daniel Dewhurst, akıl zinciri desenlerini analiz etti ve botun mantıksal yapı tarzının taklit edilmesi zor olduğunu sonucuna vardı; genellikle modelin eğitim yöntemini yansıtır.
Ancak herkes bu sonuca katılmıyor.
Bağımsız görüş
* Umur Ozkul bağımsız bir benchmark yaptı ve Hunter Alpha’nın muhtemelen DeepSeek V4 olmadığını belirtti.
- Token davranışları ve mimari desenlerde mevcut DeepSeek sistemlerinden farklılıklar gösterdiğini ortaya koydu.
Modelin popülerliği
* OpenRouter verilerine göre, model Pazar güncünde 160 milyar token’ı işledi.
* Çoğu istek AI ajanları için geliştirme araçlarından ve çerçevelerden geldi.
Anonim model başlatmaları alışılmadık değildir: pek çok geliştirici, resmi sürümden önce topluluktan nesnel geri bildirim almak için bu yaklaşımı kullanır.
Yorumlar (0)
Düşüncenizi paylaşın — lütfen kibar olun ve konu dışına çıkmayın.
Yorum yapmak için giriş yapın