Google, bilimsel görevler için gelişmiş bir yapay zeka hizmeti olan Gemini 3 Deep Think'i başlattı; bu servis, isteklere göre cevapları “ayarlamaya” devam ediyor.
Google, Gemini 3 Deep Think'in güncellenmiş bir sürümünü tanıttı
Google şirketi, Gemini 3 Deep Think adlı platformunun yeni büyük bir güncellemesini duyurdu – akıl yürütme ve karmaşık bilim‑mühendislik problemlerini çözme yeteneğine sahip yapay zeka.
Ne değişti
Parametre Yeni Görünüş Amaç Uygulama
Sadece teoriden pratik uygulamaya geçmek Problemleri net sınırlamalar olmadan, eksik verilerle Çözüm
Erişim Gemini uygulamasına entegre Google AI Ultra aboneleri kullanabilir; API ile – mühendisler ve şirketler (başvuru gerekir) Geliştirme ortakları Bilim insanları-araştırmacılar Karmaşık görevlerde işbirliği
Performans göstergeleri
Test Sonuç Açıklama Humanity’s Last Exam 48,4 % Dış araç kullanılmadan ARC‑AGI‑284,6 % AI-asistanları için benchmark Codeforces (Elo) 3455 Yüksek programlama çözümleri IMO 2025 Altın madalya Uluslararası olimpiyat katılımcı düzeyi Kimya/Fizik Aynı sonuç Çeşitli disiplinlerde çok yönlülüğü gösterdi CMT‑Benchmark (teorik fizik) 50,5 % Karmaşık kavramlarda iyi hakimiyet
AI ajanı “Aletheia”
DeepMind Google laboratuvarında Gemini 3 Deep Think tabanlı Aletheia ajansı oluşturuldu. Önemli özellikler:
1. Hipotez kontrolü – ajan önerilen çözümlerdeki zayıflıkları tespit eder ve yinelemeli olarak düzeltir.
2. Belirsizlik tanıma – cevabı bilmediğini bildirebilir.
3. Dış kaynaklarla etkileşim – Google arama servisini ve web gezintisini kullanır, ancak sahte bağlantılar üretmez.
Başarı seviyeleri
Google Aletheia'nın başarısını beş aşamaya ayırdı:
Aşama Açıklama Örnekler 0 – “küçük yenilik” Tam otomatik modda P. Erdős için üç problem çözüldü (birinci seviye) Üç Erdős problemi 1 – “minimum yenilik” Ekstra bir sonuç tek başına 4. problem 2 – “yayınlanabilirlik için uygun” Hem otomatik hem de insan işbirliğiyle sonuçlar, ayrıca yardımcı araçlar 3–4 – “önemli/ölümsel atılım” Henüz ulaşılmadı—
Aletheia'nın Erdős problemlerini çözme durumu
* 700 henüz çözülemeyen problemden ajan 13'ünü çözdü.
* Ancak yalnızca 4 tanesi gerçekten yenidir – geri kalanı bilim topluluğunda bilinenlerdir.
* Sunulan 212 çözüm arasında sadece %6,5'i içeriksel olarak doğru; %68,5’i temel hatalar içeriyor ve %31,5’i problemi yanlış yorumluyor.
Geliştiriciler, AI'nin “soruyu daha basit cevaplamak için yeniden yorumlama eğilimi” olduğunu ve insanlara göre “son derece hata yapmaya yatkın” olduğunu belirtiyor. Sonuç olarak matematikçileri tamamen yapay zeka ile değiştirmek şu anda mümkün değil.
Sonuç: Gemini 3 Deep Think ve ajanı Aletheia, bilim alanlarında etkileyici sonuçlar gösteriyor ancak doğruluk ve güvenilirlik konularında önemli sınırlamalar taşıyor. Google, AI'nin derin akıl yürütme yeteneğini ve kendi çıkarımlarını kontrol etme becerisini geliştirmeye devam ediyor.
Yorumlar (0)
Düşüncenizi paylaşın — lütfen kibar olun ve konu dışına çıkmayın.
Yorum yapmak için giriş yapın