Andrey Karpaty, insanların dinlenirken gece saatlerinde yüzlerce deney yapması için AI ajanlarını eğitti
Andrej Karpathy yeni bir otomatik araştırma yaklaşımı açıyor
Tesla’nın eski AI‑proje yöneticisi ve OpenAI kurucu ortağı Andrej Karpathy, basit ama güçlü bir açık kaynak projesini başlattığını duyurdu. Betik yalnızca 630 satırdan oluşuyor ve GitHub’da yayınlanmış durumda. Hazır bir model ya da büyük bir kurumsal ürün olma iddiasında değil; amaç, AI ajanlarının insan müdahalesi olmadan bilimsel yöntemi tamamen otomatikleştirebileceğini göstermek.
> “Görelimiz, araştırmalarda sonsuz hızla ilerleyen ajanlar yaratmak, hatta gece boyunca.” – diye yazdı Karpathy X’de. Mesaj hemen viral oldu ve iki gün içinde 8,6 milyon görüntülenme topladı.
Sistem nasıl çalışır
1. Başlatma
Ajan eğitim betiğini alır ve sabit bir hesaplama bütçesi (genellikle GPU’da 5 dakika) belirler.
2. Kodun kendini analiz etmesi
Kendi kaynak kodunu okur, iyileştirme hipotezi oluşturur (örneğin öğrenme hızı veya model derinliğini değiştirmek).
3. Değişiklik ve deney başlatma
Değişiklikleri uygular, deneyi çalıştırır ve sonuçları değerlendirir.
4. Etkinlik kontrolü
*val_bpb* metriği (validasyondaki byte kaybı) iyileşirse değişiklik kalıcı olur; aksi takdirde geri alınır ve yeni bir hipotez oluşturulur.
Bir gece içinde ajan 126 deney yaptı, kaybı 0,9979’dan 0,9697’ye düşürdü. İki gün süren ayarlamadan sonra yaklaşık 700 bağımsız değişikliği işledi, ~20 ek iyileştirme buldu ve bunları daha büyük modellere başarıyla taşıdı.
Karpathy şöyle dedi: “Ajanın baştan sona süreci tamamen yönettiğini görmek inanılmaz. Dikkat ölçeklemesi ve düzenleme hatalarını 20 yıl boyunca kaçırdığımı fark ettim.”
Uzmanlar ne diyor
Bilimsel yöntemin otomasyonu, AI gelişiminde temel bir kayma olarak kabul ediliyor. Makine öğrenimini silikon hızıyla “evrimsel süreç” haline getirerek Karpathy, araştırmalar için yeni ufuklar açtı; sadece IT değil, pazarlama, sağlık ve diğer alanlarda da.
Uygulama örnekleri
| Ortak | Deney Açıklaması | Sonuç |
|---|---|---|
| Hyperspace AI (Varun Mathur) | 35 bağımsız ajan eşdeğer ağda çalıştı, dizüstü CPU’ları kullandı. | Bir gece içinde 333 deney yaptı, Kaiming, Xavier başlatma stratejileri ve RMSNorm normalizasyonunu keşfetti. |
| Single Grain (Eric Siu) | Pazarlama döngüsünü otomatikleştirdi: ajan hedef sayfalardaki değişkenleri, reklam yaratıcılarını veya e-postaları değiştirdi. | “Pozitif yanıt oranını” ölçer, başarılı değişiklikleri saklar ve etkisiz olanları siler. |
Sonuç
Karpathy, basit betiklerin AI ajanlarının kendi kendine öğrenmesi için güçlü araçlara dönüşebileceğini gösterdi. Otomatik optimizasyon döngüsü, bir gece içinde yüzlerce deney yaparak önce yıllar süren araştırma gerektiren iyileştirmeleri ortaya çıkarıyor. Bu, farklı alanlarda modellerin daha hızlı ve ölçeklenebilir geliştirilmesine yol açıyor.
Yorumlar (0)
Düşüncenizi paylaşın — lütfen kibar olun ve konu dışına çıkmayın.
Yorum yapmak için giriş yapın