Claude, 16 yapay zeka ajanından oluşan Anthropic kompleksi, kendi başına C derleyicisi oluşturdu.
Kısa sürüm
Deney kapsamında Anthropic şirketi, sıfırdan C dilinde bir derleyici geliştiren 16 bağımsız yapay zeka ajanından oluşan bir grup topladı. Sonuç – “temiz” bir uygulama, Linux 6.19 çekirdeğini ve PostgreSQL, SQLite, Redis, FFmpeg ile QEMU gibi projeleri derleyebiliyor, ancak kalite ve verimlilik açısından GCC’den önemli ölçüde geride kalıyor.
Nasıl yapıldı
Aşama Ne oldu Hazırlık 16 Claude Opus 4.6 modeli örneği, internet erişimi olmayan ayrı Docker konteynerlerinde çalıştırıldı. Her biri ortak Git deposunu klonlar ve kilit dosyaları aracılığıyla görevleri alır. Kendi kendine planlama Merkezî bir koordineci yok: her ajan, “görünür” iş parçasını kendi belirler. Çakışma durumunda kod otomatik olarak birleşir. Geliştirme Ajana, C derleyicisini sıfırdan yazması emredildi. İş 2 hafta sürdü ve yaklaşık 2000 Claude Code oturumu gerektirdi. Testleme Modelin bağlamını uzun sorgularla “kirletmek” istemediğimiz için testler özet modda (sadece birkaç satır çıktı) çalıştırılır. Hızlandırmak için 1–10 % testi hızlı işleme modu eklendi.
Son ürün
* Boyut – yaklaşık 100 000 satır Rust kodu.
* Fonksiyonellik – Linux 6.19 çekirdeğini x86, ARM ve RISC‑V üzerinde derleyebilir; PostgreSQL, SQLite, Redis, FFmpeg, QEMU derler; GCC’nin %99’luk testlerini geçer.
* Sınırlamalar – 16 bit makine kodu üretmez (Linux çalıştırmak için GCC gerekir), assembler ve linker hatalarla çalışır, kodun performansı GCC’den düşüktür. Üretilen Rust kodunun kalitesi deneyimli bir programcıya kıyasla tatmin edici değildir.
Deneyin maliyeti
Göstergeler Maliyet Token Claude API ~\$20 000 Ekstra giderler (model eğitimi, proje organizasyonu, test setleri) Belirtilen tutara dahil değil
Dersler ve çıkarımlar
1. Bağımsızlık sınırı – kod 100 000 satıra ulaştığında ajanlar projeyi tamamen anlamayı bırakır; bu, bağımsız AI için üst sınır gibi görünüyor.
2. Destek ihtiyacı – fonksiyonelliği genişletme çabaları zaten çalışan kod parçalarını kırıyor.
3. Geliştirme ortamının önemi – internete izole edilmek ve testlerin doğru yapılandırılması, ajanların istikrarlı çalışması için kritik oldu.
Sonuç
Deney, modern AI modellerinin minimum kontrolle karmaşık yazılım sistemleri üretebileceğini gösteriyor. Ancak henüz deneyimli geliştiricileri tamamen yerine koyamıyor: kod kalitesi, performans ve güvenilirlik geleneksel derleyicilerin altında kalıyor ve proje ölçeği yüzbin satırla sınırlı. Bu önemli bir adım, ancak tam anlamıyla bağımsız yazılım geliştirme henüz çok uzakta.
Yorumlar (0)
Düşüncenizi paylaşın — lütfen kibar olun ve konu dışına çıkmayın.
Yorum yapmak için giriş yapın