PDP-11'de eski bir AI modeli çalıştırma: bir meraklı, 6 MHz CPU ve 64 KB RAM kullandı

PDP-11'de eski bir AI modeli çalıştırma: bir meraklı, 6 MHz CPU ve 64 KB RAM kullandı

4 hardware

Microsoft veterani eski bilgisayarda bir transformer'ın çalışmasını gösteriyor

*Dave Plummer – tanınmış Windows geliştiricisi,*

*modern AI modellerinin on yıllık donanımda bile eğitilebileceğini gösteriyor.*

Yapılanlar
- Donanım: PDP‑11 / 44, 47 yaşındaki bilgisayar, 6 MHz işlemci ve 64 KB RAM.

- Model: “Attention 11” – PDP‑11 assembler'ı ile Damien Buret tarafından yazılmış transformer ağı.

- Eğitim görevi: sekiz sayıdan oluşan bir dizinin tersini oluşturmak.

Modellerin örnekleri hatırlamaları gerekmez; model, diziyi “ters çevirme” kuralını öğrenmelidir.

Nasıl çalışır
1. Başlatma – model rastgele ağırlıklarla başlar, doğruluk neredeyse sıfırdır.

2. Eğitim – her adımda ileri geçiş (8 bit sabit nokta) ve ağırlık güncellemesi yapılır.

3. Deseni yavaşça öğrenme – birkaç yüz yinelemeden sonra dikkat mekanizması kuralı “keşfeder” ve model tahminden gerçek bilgiye geçer.

> “Eğitim sürecinin basitleştirilmiş anatomisini gözlemliyoruz… makine sonunda görünmez bir sınırı aşar — tahminden bilgiye.” – Plummer

Sonuçlar
- Doğruluk: ters dizi görevinde %100.

- Hız: yaklaşık 350 eğitim adımı, PDP‑11/44'te ~3,5 dakikada tamamlandı.

Modern AI için ne anlama geliyor
Plummer, temel öğrenme prensiplerinin – tekrarlayan aritmetik işlemler ve hata düzeltmesi – bu kadar basit bir sistemde bile tamamen uygulandığını vurgular.

“Bu eski makine mistik düşünmüyor; sadece birkaç bin sayıyı güncelliyor. Modern AI'nin özü, bu sürecin ölçeklendirilmesidir.”

Dolayısıyla yazar, transformer'ların temel mekanizmasının aynı kaldığını kanıtladı, çalıştıkları donanıma bakılmaksızın.

Yorumlar (0)

Düşüncenizi paylaşın — lütfen kibar olun ve konu dışına çıkmayın.

Henüz yorum yok. Yorum bırakın ve düşüncenizi paylaşın!

Yorum bırakmak için lütfen giriş yapın.

Yorum yapmak için giriş yapın