3 Temmuz 2026Lama Yazılım

DGX Spark mı BasePOD mu? 12 Kriterlik Satın Alma Matrisi ve 5 Yıllık TCO Şablonu

NVIDIA DGX yatırımında Spark ile BasePOD arasında finansal ve operasyonel karar vermek için 12 kriterlik matris ve 5 yıllık TCO şablonu.

NVIDIA DGX

Kurumsal AI yatırımında en sık karşılaşılan ikilem, kompakt DGX Spark ile referans mimari BasePOD arasında seçim yapmaktır. Her iki seçenek de NVIDIA DGX ekosisteminin parçasıdır; ancak CAPEX profili, operasyonel yük, ölçeklenebilirlik tavanı ve agentic AI iş yüklerine uygunluk açısından dramatik farklar taşır. Bu makale, pillar rehberinde tanımlanan katman haritasının pratik satın alma boyutunu ele alır: 12 kriterlik değerlendirme matrisi ve beş yıllık toplam sahip olma maliyeti (TCO) şablonu sunar.

Neden Spark ve BasePOD Karşılaştırması Kritik?

DGX Spark, Grace Blackwell SoC tabanlı masaüstü sınıfı bir sistemdir; hızlı prototipleme ve yerel geliştirme için tasarlanmıştır. BasePOD ise onlarca DGX rack sunucusunu, InfiniBand fabric'ini, paralel depolamayı ve kurumsal yazılım yığınını tek bir referans pod olarak paketler. İkisi arasındaki fiyat farkı genellikle bir sıra büyüklüğündedir; yanlış erken seçim ya kapasite israfı ya da üretim darboğazı üretir.

Agentic AI iş yükleri bu kararı daha da keskinleştirir. Çoklu ajan orkestrasyonu, sürekli inference döngüleri ve uzun bağlam gereksinimleri, Spark'ın tek kullanıcılı profilini hızla aşabilir. Öte yandan henüz iş yükü portföyü netleşmemiş bir kurumun BasePOD satın alması, düşük GPU utilization ve yüksek amortisman maliyetiyle sonuçlanabilir.

12 Kriterlik Satın Alma Matrisi

Aşağıdaki on iki kriter, her biri 1-5 skala ile değerlendirildiğinde Spark ve BasePOD arasında yapılandırılmış karar üretir. Skor 1 "Spark açık üstünlük", 5 "BasePOD açık üstünlük" anlamına gelir; 3 nötr bölgedir.

Kriter 1: Eşzamanlı Kullanıcı ve Oturum Sayısı

Spark tipik olarak 1-5 aktif geliştirici veya tek haneli eşzamanlı inference oturumu için uygundur. BasePOD, onlarca DGX düğümüyle yüzlerce eşzamanlı agentic oturumu destekleyebilir. Hedef eşzamanlılık 20'nin altındaysa Spark veya ara katman (tek DGX B200 düğümü) değerlendirilmeli; 50 üzeri ise BasePOD yönünde güçlü sinyal vardır.

Kriter 2: İş Yükü Olgunluk Seviyesi

PoC, pilot veya model seçimi aşamasında Spark yeterlidir. Production SLA, HA ve merkezi izleme gereksinimleri BasePOD lehine çalışır. Olgunluk değerlendirmesi için şu sorular kullanılır: Model versiyonlama var mı? CI/CD pipeline GPU testlerini kapsıyor mu? Incident response tanımlı mı?

Kriter 3: Eğitim vs Inference Oranı

Ağırlıklı inference ve hafif LoRA fine-tuning Spark veya küçük cluster ile yönetilebilir. Haftalarca süren distributed pre-training veya büyük multimodal eğitim BasePOD veya SuperPOD gerektirir. Eğitim compute saatinin toplam GPU saatinin %30'unu aşması BasePOD skorunu yükseltir.

Kriter 4: Veri İkameti ve Regülasyon

KVKK-nvidia-dgx) kapsamında kişisel verilerin on-premise işlenmesi her iki seçeneği de mümkün kılar; ancak production ölçeğinde denetim izi, erişim kontrolü ve air-gap gereksinimleri BasePOD'un kurumsal operasyon araçlarıyla daha iyi örtüşür. Spark geliştirme ortamı, BasePOD production ortamı kombinasyonu regüle sektörlerde yaygın bir desendir.

Kriter 5: Ağ ve Entegrasyon Gereksinimleri

Kurumsal LDAP/SSO, private API gateway, service mesh ve çok katmanlı güvenlik duvarı entegrasyonu BasePOD deployment'ının parçası olarak planlanır. Spark tek makine sınırında kalır; ağ segmentasyonu basittir ancak kurumsal servis kataloğuna entegrasyon sınırlıdır.

Kriter 6: Ölçeklenebilirlik Horizontu (3-5 Yıl)

Üç yıl içinde GPU sayısının 4-8 kat artması öngörülüyorsa BasePOD referans mimarisi modüler genişlemeyi kolaylaştırır. Spark'tan sonra tek düğüm, sonra küçük cluster, sonra BasePOD şeklinde kademeli yol haritası da geçerli bir stratejidir; bu durumda Spark skoru yükselir.

Kriter 7: Operasyonel Ekip Yetkinliği

BasePOD, Slurm veya Kubernetes GPU operatörü, InfiniBand yönetimi ve paralel dosya sistemi uzmanlığı gerektirir. Ekip henüz bu yetkinlikte değilse Spark ile başlayıp operasyonel olgunluğu artırmak daha düşük risklidir.

Kriter 8: Enerji ve Fiziksel Altyapı

BasePOD onlarca kilovat güç, yedekli soğutma ve yüksek yoğunluklu rack kapasitesi ister. Mevcut veri merkezi bu kapasiteyi karşılamıyorsa Spark veya colocation tabanlı BasePOD alternatifleri değerlendirilmelidir.

Kriter 9: Tedarik ve Kurulum Süresi

Spark kurulumu günler içinde tamamlanabilir. BasePOD sipariş-kurulum-validasyon döngüsü aylar sürebilir. Acil production deadline varsa geçici Spark veya bulut burst, orta vadede BasePOD planı uygulanabilir.

Kriter 10: Yazılım Yığını ve Lisanslama

Her iki seçenek de NVIDIA AI Enterprise lisanslamasına tabidir; BasePOD'da düğüm sayısı arttıkça lisans maliyeti doğrusal artar. NIM, NeMo ve üçüncü parti vektör veritabanı lisansları TCO'ya ayrıca eklenmelidir.

Kriter 11: [Agentic AI](/blog/agentic-ai-dgx-spark-playbook) Özel Gereksinimler

Çoklu ajan sayısı, tool-calling güvenilirliği, RAG pipeline gecikmesi ve oturum başına GPU bellek tüketimi boyutlandırmayı belirler. Yüksek eşzamanlı agentic serving BasePOD lehine; tek ekip içi ajan geliştirme Spark lehine çalışır.

Kriter 12: FinOps ve Maliyet Şeffaflığı

BasePOD'da birim maliyet (cost per GPU hour, cost per million tokens) takibi kurumsal FinOps disipliniyle yapılabilir. Spark'ta bu metrikler genellikle proje bazlı kalır. Kurumsal chargeback modeli varsa BasePOD skoru artar.

Matris Uygulama Yöntemi

Her kriter için iş birimleri ve IT birlikte skor atar. Ağırlıklı ortalama hesaplanır; kritik kriterlere (ör. regülasyon, eşzamanlılık) 2x ağırlık verilebilir. Toplam skor 2.5 altındaysa Spark veya kademeli yaklaşım; 3.5 üzerindeyse BasePOD önerilir. 2.5-3.5 arası gri bölgede tek DGX B200/H200 düğümü veya küçük 4-8 GPU cluster ara çözüm olarak değerlendirilir.

Skorlama workshop'u çıktıları dokümante edilmeli; altı ay sonra iş yükü değişiminde matris yeniden çalıştırılmalıdır. Donanım kararı tek seferlik değil, yaşayan bir süreçtir.

5 Yıllık TCO Şablonu: Bileşenler

TCO modeli yalnızca donanım listesi fiyatı değildir. Beş yıllık horizon için aşağıdaki maliyet kategorileri ayrı satırlarda modellenmelidir.

CAPEX: Donanım ve Kurulum

**Spark senaryosu:** DGX Spark birim fiyatı, NVMe depolama genişletmesi, monitör/periferik (isteğe bağlı), kurulum ve ilk konfigürasyon işçiliği, nakliye ve gümrük (Türkiye için KDV ve ithalat prosedürleri).

**BasePOD senaryosu:** DGX düğüm sayısı × birim düğüm fiyatı, InfiniBand switch'ler, spine-leaf veya fat-tree kablolama, paralel dosya sistemi appliance veya yazılım lisansı, rack PDU ve kabinet, profesyonel servis kurulumu, referans mimari validasyon testi.

Her iki senaryoda da yedek parça stoğu (spare GPU, spare switch modülü) CAPEX veya ilk yıl OPEX olarak ayrılabilir.

OPEX: Enerji ve Soğutma

GPU sistemlerinde enerji maliyeti TCO'nun önemli dilimidir. Formül: `(GPU güç + CPU + soğutma overhead) kW × 8760 saat × PUE × birim kWh fiyatı × 5 yıl`. Türkiye'de tarife yapısı ve veri merkezi PUE değeri (1.3-1.6 arası tipik) senaryo analizine dahil edilmelidir.

Spark düşük güç profiliyle OPEX avantajı sağlar. BasePOD yüksek toplam güç tüketir ancak birim inference maliyeti ölçekle düşebilir.

OPEX: Lisanslama ve Destek

NVIDIA AI Enterprise yıllık abonelik, işletim sistemi ve güvenlik yamaları, vektör veritabanı ve observability araçları (Datadog, Grafana Enterprise vb.), NVIDIA veya integrator premium destek sözleşmesi. BasePOD'da lisans düğüm sayısıyla çarpılır.

OPEX: Personel ve Operasyon

Spark: yarı zamanlı ML mühendisi desteği yeterli olabilir. BasePOD: tam zamanlı MLOps/SRE, ağ uzmanı, depolama yöneticisi veya dış kaynak yönetilen servis. Personel maliyeti Türkiye piyasasında BasePOD TCO'sunun görünmez ama büyük kalemidir.

Gizli Maliyetler: Migrasyon ve Teknik Borç

Spark'tan BasePOD'a geçişte yeniden benchmark, ağ segmentasyonu yeniden tasarımı ve eğitim kesintisi maliyeti. Erken BasePOD alıp düşük utilization durumunda fırsat maliyeti. TCO şablonuna "geçiş maliyeti" ve "utilization varsayımı" satırları eklenmelidir.

Örnek TCO Senaryo Karşılaştırması

Aşağıdaki varsayımsal senaryo, yapıyı göstermek içindir; gerçek teklifler tedarikçi ve konfigürasyona göre güncellenmelidir.

**Senaryo S — Spark öncelikli:** 3 adet DGX Spark (3 yılda dağıtılmış), 5 kişilik ML ekibi, %60 ortalama GPU utilization (geliştirme profili), yıllık 2M agentic inference oturumu. Beş yıllık TCO'da CAPEX düşük, personel orta, birim oturum maliyeti yüksek ölçekte artar.

**Senaryo B — BasePOD öncelikli:** 16 düğümlü BasePOD (B200), yıllık AI Enterprise lisansı, 8 FTE operasyon ekibi veya yönetilen servis, %75 utilization hedefi, yıllık 50M oturum. Beş yıllık TCO'da CAPEX yüksek, birim oturum maliyeti düşük, break-even noktası oturum hacmine bağlıdır.

Break-even analizi: `BasePOD ek CAPEX / (Spark birim oturum maliyeti - BasePOD birim oturum maliyeti) = gerekli yıllık oturum sayısı`. Bu eşik kurumun büyüme projeksiyonuyla karşılaştırılır.

Agentic AI İçin TCO Ayarlamaları

Klasik ML TCO modelleri batch eğitim saatine odaklanır. Agentic AI'da inference sürekli ve çok turludur. Model başına değil oturum başına ve tur başına maliyet izlenmelidir. LoRA adaptör sayısı arttıkça bellek parçalanması ve yükleme süresi maliyet üretir; TCO modeline "aktif model/adaptör sayısı" parametresi eklenmelidir.

RAG katmanı için embedding yeniden indeksleme, vektör DB cluster OPEX'i ve sorgu başına gecikme SLA'sı maliyet kalemlerine dönüşür. Bu kalemler BasePOD'da ayrı düğüm veya paylaşımlı kaynak olarak planlanır; Spark'ta genellikle aynı makinede çalışır ve ayrıştırılmaz.

Risk Senaryoları ve Hassasiyet Analizi

TCO şablonu en az üç utilization senaryosu içermelidir: iyimser (%85), baz (%65), kötümser (%40). Faiz oranı ve kur varsayımı (TL/USD) Türkiye'de CAPEX planlamasında kritiktir. Tedarik gecikmesi durumunda geçici bulut kiralama maliyeti stres testi olarak eklenebilir.

Regülasyon değişikliği (KVKK rehber güncellemesi) on-premise yatırımı değerli kılabilir; bu nitel faktör matris skoruna yansıtılır, TCO'ya doğrudan satır olmayabilir.

Uygulama Kontrol Listesi

Satın alma onayı öncesi: 12 kriter matrisi tamamlandı mı? Beş yıllık TCO üç utilization senaryosuyla hesaplandı mı? Mimari süreklilik planı (Spark → BasePOD geçiş artefaktları) dokümante edildi mi? Pillar katman haritasıyla tutarlılık doğrulandı mı? FinOps birim metrikleri tanımlandı mı? Enerji ve rack fiziksel kapasitesi onaylandı mı?

Kademeli Yatırım Modeli: Spark'tan BasePOD'a Geçiş Eşikleri

Birçok kurum için optimal finansal model, tek seferde BasePOD almak yerine kademeli yatırımdır. Aşağıdaki eşikler geçiş kararını tetikler.

**Eşik 1 — Teknik doğrulama:** Agentic use case Spark'ta çıkış kriterlerini karşıladı. Bu aşamada ek Spark birimi veya DGX Station değerlendirilebilir; BasePOD henüz gerekmez.

**Eşik 2 — Eşzamanlılık baskısı:** Sürekli 8-15 eşzamanlı oturum ve P95 latency SLA ihlali. Tek DGX B200 düğümü veya 4 düğümlü mini-cluster ara adım olarak planlanır.

**Eşik 3 — Operasyonel olgunluk:** Kubernetes GPU operatörü, model registry ve CI/CD pipeline production-ready. Bu noktada BasePOD slice (8-16 düğüm) siparişi mantıklı hale gelir.

**Eşik 4 — Portföy genişlemesi:** Birden fazla agentic uygulama ve model ailesi aynı altyapıyı paylaşıyor. Tam BasePOD veya modüler genişleme.

Her eşikte TCO yeniden hesaplanır; önceki yatırımın amortismanı yeni karara dahil edilir. Spark cihazları geliştirme veya DR ortamı olarak yaşam döngüsünde kalır; hurdaya çıkarılmaz.

Departmanlar Arası Karar Süreci

Satın alma matrisi yalnızca IT kararı olmamalıdır. Finans (TCO ve amortisman), hukuk (KVKK ve sözleşme), iş birimi (use case ROI), ve tesis yönetimi (güç/soğutma) workshop'a dahil edilmelidir. Her departman en az iki kritere skor atar; çatışan skorlar kayıt altına alınır ve üst yönetim arbitrasyonu istenir.

Dokümantasyon çıktıları: imzalı matris tablosu, üç senaryolu TCO spreadsheet, mimari yol haritası diyagramı, ve risk kaydı. Bu paket yönetim kurulu veya yatırım komitesi onayına sunulur. Donanım RFQ'su bu paket onaylanmadan gönderilmemelidir.

Amortisman ve Vergi Perspektifi (Türkiye)

DGX donanımı kurumsal varlık olarak aktifleştirilir; amortisman süresi muhasebe politikasına göre genellikle 3-5 yıldır. Türkiye'de teknoloji yatırımları için bölgesel veya sektörel teşvikler değişkenlik gösterir; yatırım teşvik belgesi kapsamı TCO'da ayrı senaryo olarak modellenmelidir.

Leasing veya finansal kiralama alternatifi CAPEX'i OPEX'e kaydırır; bilanço etkisi CFO kararını etkiler. 12 kriter matrisinde finansal esneklik ayrı alt kriter olarak skorlanabilir.

Benchmark Şablonu ve Karşılaştırma Metodolojisi

Spark ve BasePOD karşılaştırmasında adil benchmark için aynı model, quantizasyon ve batch size kullanılmalıdır. Agentic workload benchmark'ı sentetik değil gerçek use case trace'lerinden üretilir. En az 1000 oturum örneği ile P50/P95/P99 gecikme raporlanır.

TCO'ya benchmark sonuçları bağlanır: tur başına maliyet = GPU saat maliyeti × tur süresi. Bu metrik iki senaryo arasında break-even hesabını besler.

Sonuç

DGX Spark ve BasePOD arasındaki seçim ideolojik değil, ölçülebilir kriterlere dayanmalıdır. 12 kriterlik matris organizasyonel ve teknik gerçekleri yüzeye çıkarır; 5 yıllık TCO şablonu finansal taahhüdü görünür kılar. Birçok kurum için optimal yol, Spark ile başlayıp utilization ve iş yükü olgunluğu eşiklerine ulaşıldığında BasePOD'a geçmektir.

Somut matris skorlama ve TCO modeli özelleştirmesi için Lama Yazılım, iş yükü profilinize göre referans senaryo çıkarımında AI çözüm ortağı olarak destek verebilir. Donanım teklifi almadan önce bu analizlerin tamamlanması, yatırımın iş sonuçlarına bağlanmasını sağlar.

Başlamaya hazır mısınız?

AI çözümlerimizin kurumunuzu nasıl dönüştürebileceğini keşfedin.

Demo Talep Et