Microsoft, metin, ses ve grafik oluşturmak için üç yeni dahili yapay zeka modeli yayınladı
Microsoft AI yeni üç çoklu modal model başlatıyor
Yapay zeka (YZ) alanındaki konumlarını güçlendirme çabaları kapsamında Microsoft AI araştırma bölümü, metin, ses ve görüntü üretebilen kendi modellerini piyasaya sürmeyi duyurdu. Bu karar, önde gelen YZ laboratuvarlarıyla rekabeti karşılamak için bir yanıt oldu.
Model | Amaç | Önemli Göstergeler
MAI‑Transcribe‑1 | Konuşmayı metne dönüştürme | 25 dil, hız 2,5 × daha hızlı Azure Fast
MAI‑Voice‑1 | Ses parçası oluşturma | Bir saniyede bir dakikalık ayar, ses özelleştirme
MAI‑Image‑2 | Metinden görüntü üretimi
Proje, gelişmiş YZ sistemleri üzerine temel araştırmalar yapan MAI Superintelligence bölümü tarafından geliştirildi. Ekim 2025’te ekip, Mustafa Suleyman adlı CEO ile genişledi.
Ekonomik verimlilik
Geliştiriciler, Google ve OpenAI karşılaştırmalı maliyetlerini düşürmeye büyük önem verdi:
Hizmet | Fiyat
Metin çözümleme | $0,36/saat
Ses sentezi | 1 milyon karakter için $22
Görüntü işleme | 1 milyon giriş tokeni için $5; 1 milyon çıkış tokeni için $33
Modeller Microsoft Foundry platformunda zaten dağıtıldı. Transkripsiyon ve ses sentezi MAI Playground’da kullanılabilir.
OpenAI ile ortaklık
Kendi çözümlerini aktif olarak geliştirmesine rağmen Mustafa Suleyman, OpenAI ile işbirliğine bağlılığını teyit etti: Microsoft, 13 milyar dolarlık yatırım yaptı. Şirket, uzun vadeli sözleşmeye uygun olarak OpenAI modellerini ürünlerinde kullanmaya devam edecek ve mikroçiplerle yapılan çalışmalara benzer bir çeşitlendirme stratejisi uygulayacak.
Bu sayede Microsoft AI, hızlı ve ekonomik çoklu modal çözümler sunarak YZ pazarındaki konumunu güçlendiriyor ve ana ortaklarla yakın ilişkilerini sürdürüyor.
Yorumlar (0)
Düşüncenizi paylaşın — lütfen kibar olun ve konu dışına çıkmayın.
Yorum yapmak için giriş yapın