Yapay zeka İngiltere Premier Lig maçlarında tüm parayı kaybederek spor bahislerinde düşük verimlilik gösterdi.
Kısa bir deney sonucu
General Reasoning adlı girişim, KellyBench adında bir test gerçekleştirdi ve bu testte Google Gemini 3.1 Pro, OpenAI ChatGPT‑4, Anthropic Claude Opus 4.6, xAI Grok 4.20 vb. sekiz önde gelen yapay zeka sisteminin İngiltere Premier Lig 2023–2024 sezonunda bahis yapma yeteneği değerlendirildi.
Her bir ajana tüm takımların ve geçmiş maçların tam istatistiksel açıklaması verildi, ancak internet erişimi yasaklandı – modeller yalnızca önceden aldıkları verilere dayanarak hareket edebildi.
Test nasıl gerçekleşti
1. Üç deneme: her sistem sezon boyunca üç bahis serisi yapabilirdi.
2. Bahisler: maç sonuçları (galibiyet/beraberlik/mat) ve gol sayıları üzerineydi.
3. Amaç: riskleri yöneterek karı maksimize etmek.
Kim kazandı, kim kaybetti
| Yapay Zeka Sistemi | Ortalama Sonuç | Not |
|---|---|---|
| Anthropic Claude Opus 4.6 | %11 (bir denemede neredeyse kârsız) | En “adil” katılımcı, yine de para kaybetti |
| Google Gemini 3.1 Pro | +%34 ilk denemede, ardından iflas etti | İlk kar sonra zarar |
| xAI Grok 4.20 | Hemen iflas etti, sonraki iki deneme tamamlanmadı | Tüm zamanların en zayıfı |
Sonuç olarak her model sezon boyunca para kaybetti ve bazıları tamamen “başarısız” oldu. Bu bulgular araştırmacıların çıkarımlarını doğruluyor: en gelişmiş yapay zeka sistemleri bile uzun vadeli tahminlerde gerçek dünyada zorlanıyor.
Bu, gelecekteki Yapay Zekaya ne anlama geliyor
- İnsan yerine geçme endişeleri şu anda abartılı görünüyor.
- Mevcut benchmark’lar genellikle “statik” koşulları kullanır ve gerçek hayatın kaosunu ve karmaşıklığını yansıtmaz.
- Kod yazma gibi görevlerde yapay zeka başarılı olsa da, insan faaliyetinin çoğu alanında hâlâ sınırlı kalıyor.
Dolayısıyla KellyBench deneyimi, yapay zekanın henüz dinamik, öngörülemez görevlerde (örneğin spor tahminleri) insanla rekabet etmeye hazır olmadığını gösteriyor.
Yorumlar (0)
Düşüncenizi paylaşın — lütfen kibar olun ve konu dışına çıkmayın.
Yorum yapmak için giriş yapın