DDR5 Belleklerdeki On-die ECC Nedir, Ne İşe Fayda?

Adanali

Member
Teknoloji meraklıları vakit zaman ECC (Error Correction Code) kavramıyla karşılaşmıştır. Baştan belirtmek gerekirse, bu teknoloji çoklukla sunucu ve iş istasyonlarında, yani kurumsal alanda kullanılmakta. Yanılgı düzeltme kodlu bellekler, RAM yongalarında meydana gelebilecek kusurları otomatik olarak algılayıp düzeltmek üzere geliştiriliyor.


Elektronik/manyetik parazitler yahut kozmik ışınlar bellekteki bilgilerin bozulmasına sebep olabilir. ECC’nin maksadı ise bozulan bilgiyi düzeltmek, düzeltemediği durumda da sisteme raporlamaktır. DDR5 teknolojisiyle birlikte gündeme gelen on-die ECC (ODECC) teknolojisi tüketiciler içinde biroldukca tartışmaya ve baş karışıklığına niye oldu. Öncelikle bu süratle gelişen teknolojinin standart ECC teknolojisinden çok farklı olduğunu belirtelim. Artık ECC’ye özetlemek gerekirse değineceğiz, akabinde ODECC’nin (yonga kalıbı üzerinde ECC) farklarından bahsedeceğiz.

Hata düzeltme kodu (Error correction code), bellekte depolanan bilgilerin yanlışsız olmasını sağlayan matematiksel bir süreçtir. ECC, bir kusur durumunda sistemin hakikat bilgileri gerçek vakitli olarak bir daha oluşturmasına da müsaade verir.

ECC, RAM’deki sekiz bit üzere büyük bilgi kümelerindeki yanılgıları tespit etmek için tek bir bit (eşlik biti/parity bit) kullanma prosedürü olan daha gelişmiş bir eşlik biçimi kullanmakta. Ne yazık ki bir eşlik biti sistemin bir yanılgıyı algılamasına müsaade verirken, bilgi kusurunu düzeltmek için kâfi bilgi sağlamaz.

Çoğu sistem, bilgileri 64 bitlik daha büyük kesimler halinde taşır. ECC, her sekiz bitlik data için bir ekstra eşlik biti üretmek yerine, 64 bit data başına yedi ekstra bit üretir. Sistem, öbür 64 bitin gerçek olduğundan emin olmak için ekstra yedi bitlik data üzerinde karmaşık bir matematiksel algoritma uygular. Tek bir bitin yanlış olması durumunda (tek bitlik bir hata), ECC algoritması bilgileri bir daha oluşturabilir, lakin daha büyük yanlışlar (iki yahut daha fazla bit) olduğunda bunu yalnızca sisteme bildirebilir.

Standart ECC’den farklı olan ODECC, evvela gelişmiş üretim teknolojilerinde verimliliği artırmayı amaçlıyor ve bu biçimdelikle daha ucuz DRAM yongalar üretilebiliyor. On-die ECC, sırf yenilemeler sırasında bir hücrede yahut satırda meydana gelen kusurları algılamakta. Bilgiler hücreden önbelleğe yahut CPU’ya taşındığında, bir bit kayması yahut data bozulması var ise bu durum on-die ECC tarafınca düzeltilmiyor. Standart ECC ise hücre ortasındaki ve diğer bir aygıta taşınırken yaşanacak bilgi bozulmalarını düzeltme yeteneğine sahip.

DDR5, verimliliği artırmak ve bellek denetimcisi için data erişimi gecikmelerini azaltmak için bellek modülünü iki bağımsız 32 bit adreslenebilir alt kanala böler. DDR5 modülünün bilgi genişliği 64 bit, yani birebir. Lakin bu bilgi yolu 32 bitlik iki adreslenebilir kanala bölündüğünde genel performans artıyor. Sunucu sınıfı bellekler (RDIMM’ler), ECC takviyesi için her alt kanala 8 bit eklenerek alt kanal başına toplam 40 bit yahut sıra başına 80 bit bilgi yolu sağlar. Çift sıralı modüller dört adet 32 bit alt kanala sahiptir.


On-die ECC, DRAM çipindeki bit yanılgılarını düzeltmek için tasarlanmış yeni bir özellik. CPU ve GPU’larda olduğu üzere, RAM’lerin üretiminde kullanılan üretim teknolojileri de gelişiyor. Yeni litografi teknikleriyle DRAM yongaların yoğunluğu arttıkça data sızıntılarının potansiyeli de artıyor. DDR5 yongalarına entegre olan ECC ise çip ortasındaki kusurları düzeltiyor, güvenilirliği artırıyor ve kusur oranlarını en aza indirirken riski azaltıyor.

Bu teknoloji, çip haricindeki kusurları yahut modül ile CPU ortasında yer alan bellek denetimcisi içindeki data yolunda meydana gelen kusurları düzeltme kabiliyetine sahip değil. Sunucular ve iş istasyonlarında kullanılan ECC özellikli işlemciler, tek yahut fazlaca bitli yanlışları anında düzeltebilen kodlama özelliğine sahip.

Devam edecek olursak, DDR5’in on-die ECC özelliği DDR kanal kusurlarını düzeltmez. Yani işletmeler DDR5 ODECC takviyesinin yanı sıra standartlaşan yan bant ECC teknolojisini kullanmaya devam edecektir. Uzun lafın kısası, kalıp üzerinde ECC (on-die ECC) teknolojisinin kapsamı epey daha dar.

Intel, yıllar evvel ECC’nin profesyonel segmente özel olduğunu düşünerek sırf Xeon işlemcilerinde kullanmayı tercih etti. AMD bunu değiştirdi ve Ryzen işlemcilerine ECC dayanağı eklemeye başladı. bu biçimdelikle ECC teknolojisinin maliyetleri arttı ve uygun ECC takviyesi RAM bulmak başka problemler ortaya çıktı. Fakat DDR5 standardı ile her şey değişiyor. ECC artık DDR5’in olağan bir modülü haline geldi.

Yeni kuşak işlemciler, bilgi tutarlılığı konusunda önbelleği ve başka bileşenleri denetim etmek için dahili olarak ECC (veya diğer bir tür) kullanıyor. Lakin ECC dayanaklı RAM olmadan işletim sisteminin CPU ile RAM içindeki yahut RAM ortasındaki dahili bilgileri denetim etmesi mümkün değil.

İşletim sistemi bellek tutarlılığını bir dereceye kadar denetim eder. Bu süreç yavaştır ve tam olarak emniyetli değildir. Sonuç olarak, işletim sistemi RAM’de depolanan bilgilerle ilgili tüm meseleleri tespit edemez. Yani süreçlerin hakikat bilgiler üzerinde yapılıp yapılmaması, bilgilerin hakikat belgede saklanıp saklanamaması üzere denetimler %100 olarak denetim edilemez.

Günlük kullanımda bu pek de kıymetli değil. Örneğin Word evrakında geçersiz bir karakterin olması büyük meselelere yol açmaz. Lakin banka süreçlerinde her adım hayli kritik.

Windows, bilgi tutarsızlığını algıladığında ekseriyetle mavi ekran kusuru gösterir. söylemiş olduğimiz üzere, işletim sisteminin denetimleri tam olarak emniyetli değil.