Alibaba, dizüstü bilgisayarlarda çalışan ve OpenAI karşılıklarını aşan kompakt Qwen 3.5 modellerini başlatıyor

Alibaba, dizüstü bilgisayarlarda çalışan ve OpenAI karşılıklarını aşan kompakt Qwen 3.5 modellerini başlatıyor

12 hardware

Alibaba Qwen 3.5 — yeni kompakt yapay zeka modelleri serisi

Yapay zeka bölümü kapsamında Alibaba, “küçük boyut + yüksek verimlilik” vaat eden Qwen 3.5 model serisini piyasaya sürmeyi duyurdu. Amerikan rakiplerine kıyasla daha az bellek tüketimiyle daha iyi doğruluk sunuyorlar.

ModelBoyutÖne Çıkan Özellikler
Qwen 3.5‑0.8B0,8 milyar parametre“Minyatür” ve “hızlı”, prototipler ve sınırlı batarya ömrüne sahip mobil cihazlar için tasarlanmış
Qwen 3.5‑2B2 milyar0.8B ile aynı, biraz daha güçlü
Qwen 3.5‑4B4 milyarÇoklu modlu, 262 144 token’lık bağlam penceresi; hafif ajan çözümleri için uygun
Qwen 3.5‑9B9 milyarAkıl yürütme yeteneği var, OpenAI gpt‑oss‑120B (13,5× daha fazla parametre) üzerinde üstün performans gösteriyor ve mantıksal düşüncede doktora seviyesinde

Tüm modeller Apache 2.0 lisansı altında sunuluyor; ticari projelerde kullanılabilir ve gerektiğinde yeniden eğitilebilir.

Mimarlıkta Yeni Neler Var?

Alibaba, klasik Transformer’ları terk edip hibrit bir yapı benimsedi:

* Gated Delta Networks (GDN) – yüksek bant genişliği ve düşük gecikme sağlar.
* Mixture‑of‑Experts (MoE) – küçük modellerde yaygın olan bellek kısıtlamasını çözer.

Bu sayede Qwen 3.5, çoklu modlu token’ları aynı anda işleyebilir; önceki nesiller gibi görüntü üreticilerini metin modellere “eklemek” zorunda kalmaz. Sonuç olarak 4B ve 9B sürümleri UI öğelerini tanıyabilir ve videolardaki nesneleri sayabilir.

Testler ve Sonuçlar

BenchmarkQwen 3.5‑9B
MMMU‑Pro (görsel)%70,1 – Google Gemini 2.5 Flash‑Lite (%59,7) ve Qwen 3‑VL‑30B‑A3B (%63,0)’ı geçti
Mantıksal Düşünme%81,7 – OpenAI gpt‑oss‑120B (%80,1)’den üstü (10× daha fazla parametreye rağmen)
HMMT Feb 2025 (matematik)%83,2 (9B), %74,0 (4B) – karmaşık bilimsel görevler için büyük bulut kaynaklarına ihtiyaç olmadığını gösterdi
OmniDocBench v1.58%87,7 – tüm modeller arasında lider
MMMLU (çoklu dil)%81,2 – gpt‑oss‑120B (%78,2)’yi geçti

Neden Önemli?

Qwen 3.5’in çıkışı, bağımsız AI ajanlarına artan talep ile örtüşüyor. Modern kullanıcılar sadece sohbet botları değil, aynı zamanda:

1. Düşünen – görevler üzerinde akıl yürütme yeteneği,
2. Görüyön – görüntü, video ve UI öğelerini işleme,
3. Eylemdeki – formları doldurma, dosyaları sıralama gibi araçları kullanma

gerektiren sistemler istiyor.

Büyük modeller (3‑5 milyar parametre) yüksek işletme maliyetine sahipken, Qwen 3.5 daha ekonomik bir çözüm sunuyor. Modeller bulut veya API bağlantısı olmadan yerel olarak çalıştırılabilir ve pekiştirmeli öğrenme ile “insan benzeri kararlar” alabilir – örneğin masaüstünü düzenlemek veya video kaydı üzerinden kod geliştirmek.

Pratik Uygulamalar

* Mobil Cihazlar – 0,8 milyar parametre, akıllı telefonlarda rahatlıkla barındırılabilir ve bağımsız çalışabilir.
* İş İstasyonları – 9 milyar parametre, bulut olmadan tam ajan AI işlevselliği sağlar.
* Arayüz Ajansı – “piksel düzeyinde bağlama” sayesinde modeller UI üzerinden gezinebilir, formları doldurabilir ve dosyaları sıralayarak doğal dil komutlarını %90 doğrulukla yerine getirebilir.

Bu şekilde Alibaba Qwen 3.5, bulutta veya yerelde çalışabilen daha erişilebilir, esnek ve güçlü AI ajanlarına yol açıyor, modern kullanıcıların artan gereksinimlerini karşılıyor.

Yorumlar (0)

Düşüncenizi paylaşın — lütfen kibar olun ve konu dışına çıkmayın.

Henüz yorum yok. Yorum bırakın ve düşüncenizi paylaşın!

Yorum bırakmak için lütfen giriş yapın.

Yorum yapmak için giriş yapın