Agentic Coding


 Bu video, Web Dev Simplified (Kyle) tarafından hazırlanan, tamamen yerel (local) donanım üzerinde çalışan, gizli, ücretsiz ve hızlı bir Agentic Coding (Yapay Zekâ Ajanı ile Kod Geliştirme) iş akışının nasıl kurulacağını anlatan kapsamlı bir rehberdir.

Videoda öne çıkan ana başlıklar ve teknik detaylar şunlardır:

1. Yerel Yapay Zekâ Modellerinin Çalışma Mantığı ve Donanım [01:08]

  • VRAM ve RAM: Modeller doğrudan ekran kartının belleğine (VRAM) yüklenir. Eğer model VRAM kapasitesini aşarsa, bilgisayarın normal RAM'ine taşar (overflow) [03:45]. Modelin tamamen VRAM içinde çalışması, hızı muazzam derecede (yaklaşık 5-6 kat) artırır [14:02], [16:01].

  • Mac (Unified Memory): Mac bilgisayarlarda birleşik bellek olduğu için VRAM/RAM ayrımı yoktur; bu da yüksek bellekli modelleri daha maliyet etkin çalıştırmayı sağlar [02:52].

  • Kuantizasyon (Quantization): Büyük modelleri yerel donanımda çalıştırabilmek için ağırlıklarının yuvarlanarak küçültülmesi işlemidir. Genellikle performans ve boyut dengesi açısından Q4 (4-bit) kuantizasyonlar önerilir [07:33], [10:50].

  • MOE (Mixture of Experts): Büyük modelleri daha performanslı çalıştırmak için sadece ilgili kısımlarının aktif olması mantığıdır. LM Studio üzerinde belirli katmanları CPU'ya zorlayarak (offload) ekran kartını rahatlatma hilesi anlatılmaktadır [16:30], [17:42].

2. LM Studio Kurulumu ve Model Seçimi [05:29]

  • Yerel modelleri yönetmek ve API sunucusu olarak çalıştırmak için kullanıcı dostu arayüzü nedeniyle LM Studiotavsiye ediliyor [05:33].

  • Kodlama ajanları için Tool Use (Araç Kullanımı) ve Reasoning (Düşünme/Akıl Yürütme) yeteneklerine sahip modellerin (Örn: Qwen serisi) seçilmesi gerektiği vurgulanıyor [08:24], [08:52].

3. VS Code Entegrasyonları [24:52]

  • Continue Eklentisi: VS Code içerisinde kod tamamlama (autocomplete) ve ajan modunu kullanmak için yapılandırılıyor [25:13].

    • Autocomplete: Kod tamamlama için anlık yanıt almak kritik olduğundan, çok küçük (örn. 1.5B parametreli Qwen Coder gibi ~1GB) bir modelin ayrılması ve timeout ayarlarının yapılması öneriliyor [28:45], [31:38].

    • Agentic Workflow: Dosya oluşturma/düzenleme gibi araçların (Tools) otomatik çalışacak şekilde automaticayarlanması gerektiği gösteriliyor [26:35].

  • GitHub Copilot (Insider sürümü): Copilot aboneliği olmasa bile yerel LM Studio API'sini OpenAI uyumlu bir sağlayıcı olarak Copilot Chat'e bağlama adımları anlatılıyor [34:15], [35:01].

4. Terminal Tabanlı Ajanlar: Aider / PI [38:02]

  • İnternet bağımlılığı olmadan tamamen çevrimdışı ve terminal üzerinden çalışan PI (pi.dev) gibi ajan araçlarının yerel modellere nasıl bağlanacağı (modellerin .json/.yaml konfigürasyon dosyaları üzerinden) gösteriliyor [38:16], [38:52].

5. Yerel Model Performans Karşılaştırmaları (Qwen vs. Claude Sonnet) [40:54]

  • Sıfırdan Uygulama Yazma (Sudoku): Tek bir istemle (one-shot prompt) yerel Qwen modeli ve bulut tabanlı Claude Sonnet, pencil marking ve hata denetimi içeren çalışan birer Sudoku uygulaması geliştirmiştir. İki model de görevi yaklaşık 9 dakikada tamamlamıştır ve sonuçlar oldukça benzerdir [41:03], [41:44].

  • Mevcut Projede Hata Ayıklama (Bug Fix): Büyük bir video düzenleme projesindeki ses senkronizasyon hatasını düzeltirken iki model de birebir aynı kodu üretmiştir. Ancak Claude Sonnet kodu 45 saniyede analiz edip çözerken, yerel modelin tüm kod tabanını okuması 2.5 dakika sürmüştür [42:27], [43:20].

Özetle; Aylık yüksek bulut yapay zekâ API ücretleri ödemek yerine, donanım limitlerini doğru yöneterek (context boyutu, GPU offload ve kuantizasyon ayarlarıyla) tamamen ücretsiz, gizli ve oldukça yetenekli bir yerel yazılım geliştirme asistanı kurulabileceği uygulamalı olarak kanıtlanıyor.


Yorumlar