PDP-11'de eski bir AI modeli çalıştırma: bir meraklı, 6 MHz CPU ve 64 KB RAM kullandı
Microsoft veterani eski bilgisayarda bir transformer'ın çalışmasını gösteriyor
*Dave Plummer – tanınmış Windows geliştiricisi,*
*modern AI modellerinin on yıllık donanımda bile eğitilebileceğini gösteriyor.*
Yapılanlar
- Donanım: PDP‑11 / 44, 47 yaşındaki bilgisayar, 6 MHz işlemci ve 64 KB RAM.
- Model: “Attention 11” – PDP‑11 assembler'ı ile Damien Buret tarafından yazılmış transformer ağı.
- Eğitim görevi: sekiz sayıdan oluşan bir dizinin tersini oluşturmak.
Modellerin örnekleri hatırlamaları gerekmez; model, diziyi “ters çevirme” kuralını öğrenmelidir.
Nasıl çalışır
1. Başlatma – model rastgele ağırlıklarla başlar, doğruluk neredeyse sıfırdır.
2. Eğitim – her adımda ileri geçiş (8 bit sabit nokta) ve ağırlık güncellemesi yapılır.
3. Deseni yavaşça öğrenme – birkaç yüz yinelemeden sonra dikkat mekanizması kuralı “keşfeder” ve model tahminden gerçek bilgiye geçer.
> “Eğitim sürecinin basitleştirilmiş anatomisini gözlemliyoruz… makine sonunda görünmez bir sınırı aşar — tahminden bilgiye.” – Plummer
Sonuçlar
- Doğruluk: ters dizi görevinde %100.
- Hız: yaklaşık 350 eğitim adımı, PDP‑11/44'te ~3,5 dakikada tamamlandı.
Modern AI için ne anlama geliyor
Plummer, temel öğrenme prensiplerinin – tekrarlayan aritmetik işlemler ve hata düzeltmesi – bu kadar basit bir sistemde bile tamamen uygulandığını vurgular.
“Bu eski makine mistik düşünmüyor; sadece birkaç bin sayıyı güncelliyor. Modern AI'nin özü, bu sürecin ölçeklendirilmesidir.”
Dolayısıyla yazar, transformer'ların temel mekanizmasının aynı kaldığını kanıtladı, çalıştıkları donanıma bakılmaksızın.
Yorumlar (0)
Düşüncenizi paylaşın — lütfen kibar olun ve konu dışına çıkmayın.
Yorum yapmak için giriş yapın