Alibaba, dizüstü bilgisayarlarda çalışan ve OpenAI karşılıklarını aşan kompakt Qwen 3.5 modellerini başlatıyor
Alibaba Qwen 3.5 — yeni kompakt yapay zeka modelleri serisi
Yapay zeka bölümü kapsamında Alibaba, “küçük boyut + yüksek verimlilik” vaat eden Qwen 3.5 model serisini piyasaya sürmeyi duyurdu. Amerikan rakiplerine kıyasla daha az bellek tüketimiyle daha iyi doğruluk sunuyorlar.
| Model | Boyut | Öne Çıkan Özellikler |
|---|---|---|
| Qwen 3.5‑0.8B | 0,8 milyar parametre | “Minyatür” ve “hızlı”, prototipler ve sınırlı batarya ömrüne sahip mobil cihazlar için tasarlanmış |
| Qwen 3.5‑2B | 2 milyar | 0.8B ile aynı, biraz daha güçlü |
| Qwen 3.5‑4B | 4 milyar | Çoklu modlu, 262 144 token’lık bağlam penceresi; hafif ajan çözümleri için uygun |
| Qwen 3.5‑9B | 9 milyar | Akıl yürütme yeteneği var, OpenAI gpt‑oss‑120B (13,5× daha fazla parametre) üzerinde üstün performans gösteriyor ve mantıksal düşüncede doktora seviyesinde |
Tüm modeller Apache 2.0 lisansı altında sunuluyor; ticari projelerde kullanılabilir ve gerektiğinde yeniden eğitilebilir.
Mimarlıkta Yeni Neler Var?
Alibaba, klasik Transformer’ları terk edip hibrit bir yapı benimsedi:
* Gated Delta Networks (GDN) – yüksek bant genişliği ve düşük gecikme sağlar.
* Mixture‑of‑Experts (MoE) – küçük modellerde yaygın olan bellek kısıtlamasını çözer.
Bu sayede Qwen 3.5, çoklu modlu token’ları aynı anda işleyebilir; önceki nesiller gibi görüntü üreticilerini metin modellere “eklemek” zorunda kalmaz. Sonuç olarak 4B ve 9B sürümleri UI öğelerini tanıyabilir ve videolardaki nesneleri sayabilir.
Testler ve Sonuçlar
| Benchmark | Qwen 3.5‑9B |
|---|---|
| MMMU‑Pro (görsel) | %70,1 – Google Gemini 2.5 Flash‑Lite (%59,7) ve Qwen 3‑VL‑30B‑A3B (%63,0)’ı geçti |
| Mantıksal Düşünme | %81,7 – OpenAI gpt‑oss‑120B (%80,1)’den üstü (10× daha fazla parametreye rağmen) |
| HMMT Feb 2025 (matematik) | %83,2 (9B), %74,0 (4B) – karmaşık bilimsel görevler için büyük bulut kaynaklarına ihtiyaç olmadığını gösterdi |
| OmniDocBench v1.58 | %87,7 – tüm modeller arasında lider |
| MMMLU (çoklu dil) | %81,2 – gpt‑oss‑120B (%78,2)’yi geçti |
Neden Önemli?
Qwen 3.5’in çıkışı, bağımsız AI ajanlarına artan talep ile örtüşüyor. Modern kullanıcılar sadece sohbet botları değil, aynı zamanda:
1. Düşünen – görevler üzerinde akıl yürütme yeteneği,
2. Görüyön – görüntü, video ve UI öğelerini işleme,
3. Eylemdeki – formları doldurma, dosyaları sıralama gibi araçları kullanma
gerektiren sistemler istiyor.
Büyük modeller (3‑5 milyar parametre) yüksek işletme maliyetine sahipken, Qwen 3.5 daha ekonomik bir çözüm sunuyor. Modeller bulut veya API bağlantısı olmadan yerel olarak çalıştırılabilir ve pekiştirmeli öğrenme ile “insan benzeri kararlar” alabilir – örneğin masaüstünü düzenlemek veya video kaydı üzerinden kod geliştirmek.
Pratik Uygulamalar
* Mobil Cihazlar – 0,8 milyar parametre, akıllı telefonlarda rahatlıkla barındırılabilir ve bağımsız çalışabilir.
* İş İstasyonları – 9 milyar parametre, bulut olmadan tam ajan AI işlevselliği sağlar.
* Arayüz Ajansı – “piksel düzeyinde bağlama” sayesinde modeller UI üzerinden gezinebilir, formları doldurabilir ve dosyaları sıralayarak doğal dil komutlarını %90 doğrulukla yerine getirebilir.
Bu şekilde Alibaba Qwen 3.5, bulutta veya yerelde çalışabilen daha erişilebilir, esnek ve güçlü AI ajanlarına yol açıyor, modern kullanıcıların artan gereksinimlerini karşılıyor.
Yorumlar (0)
Düşüncenizi paylaşın — lütfen kibar olun ve konu dışına çıkmayın.
Yorum yapmak için giriş yapın