Обьясните, что такое “Поддержка ECC” на оперативной памяти. Что такое ECC-память Что такое поддержка ecc в оперативной памяти

#ECC #Registered #Buffered #Parity #SPD

Error Correct Code (ECC)

ECC или Error Correct Code - выявление и исправление ошибок (возможны другие расшифровки той же аббревиатуры) - алгоритм, пришедший на смену "контролю четности". В отличие от последнего каждый бит входит более чем в одну контрольную сумму, что позволяет в случае возникновения ошибки в одном бите восстановить адрес ошибки и исправить ее. Как правило, ошибки в двух битах также детектируются, хотя и не исправляются. Для реализации этих возможностей на модуль устанавливается дополнительная микросхема и он становится 72- разрядным, в отличие от 64 разрядов данных обычного модуля.

ECC поддерживают все современные материнские платы, предназначенные для серверных решений, а также некоторые чипсеты "общего назначения". Некоторые типы (Registered, Full Buffered) выпускаются только в ECC варианте. Надо отметить, что ECC не является панацеей от дефективной памяти и применяется для исправления случайных ошибок, снижая риск возникновения неполадок в работе компьютера от случайного изменения содержимого ячеек памяти, вызываемого внешними факторами, такими, как фоновая радиация.

Buffered

Buffered - буферизованный модуль. Из-за высокой совокупной электрической емкости , длительное время их "зарядки" приводит к большим затратам времени на операции записи. Чтобы избежать этого, некоторые модули (как правило, 168-контактные DIMM) снабжаются специальной микросхемой (буфером), которая сохраняет поступившие данные относительно быстро, что освобождает контроллер. Буферизованные DIMM, как правило, несовместимы с небуферизованными. Модули с частичной буферизацией называются также "регистровым" (Registered ), а модули с полной буферизацией(Full Buffered) - FB-DIMM . При этом под "небуферизоваными" подразумеваются обычные модули памяти без средств буферизации.

Parity

Parity - четность, модули с контролем четности, также контроль четности. Довольно старый принцип проверки целостности данных. Суть метода в том, что для байта данных на стадии записи вычисляется контрольная сумма, которая сохраняется как специальный бит четности в отдельной микросхеме. При чтении данных контрольная сумма вычисляется снова и сравнивается с битом четности. Если они совпали, данные считаются аутентичными, в противном случае генерируется сообщение об ошибке четности (как правило, приводящее к остановке системы). К явным недостаткам метода относятся дороговизна памяти, требующейся для хранения лишних бит четности, незащищенность от двойных ошибок (а также ложное срабатывание при ошибке в бите четности), остановка системы даже при непринципиальной ошибке (скажем, в видеокадре). В настоящее время не применяются.

Микросхема SPD

SPD - микросхема на модуле памяти DIMM, которая содержит все данные о нем (в частности, информацию о быстродействии),необходимые для обеспечения нормальной работы. Эти данные читаются на этапе самотестирования компьютера, задолго до загрузки операционной системы и позволяют настроить параметры обращения к памяти даже при одновременном наличии в системе разномастных модулей памяти. Некоторые материнские платы отказываются работать с модулями, на которых не установлена микросхема SPD, однако такие модули сейчас очень редки и являются, в основном, модулями PC-66.

Обьясните, что такое “Поддержка ECC” на оперативной памяти

  1. оперативная роверка памяти на ошибки
  2. это функция коррекции ошибок. такая память ставится на сервера, ведь нельзя же чтоб они лагали, отключались или перегружались из-за ошибок. для домашнего компа это не нужная вещь, хотя и полезная. если решили себе такую поставть-убедитесь, что ваша матплата поддерживает такой тип озу с ЕСС.
  3. Так можно ограничится программой memtest? или эта технология постоянно мониторит и исправляет мелкие значения в данных памяти?
  4. ECC (Error Correct Code) – выявление и исправление ошибок (возможны другие расшифровки той же аббревиатуры) – алгоритм, пришедший на смену “контролю четности”. В отличие от последнего каждый бит входит более чем в одну контрольную сумму, что позволяет в случае возникновения ошибки в одном бите восстановить адрес ошибки и исправить ее. Как правило, ошибки в двух битах также детектируются, хотя и не исправляются. Для реализации этих возможностей на модуль устанавливается дополнительная микросхема памяти и он становится 72- разрядным, в отличие от 64 разрядов данных обычного модуля. ECC поддерживают все современные материнские платы, предназначенные для серверных решений, а также некоторые чипсеты “общего назначения”. Некоторые типы памяти (Registered, Full Buffered) выпускаются только в ECC варианте. Надо отметить, что ECC не является панацеей от дефективной памяти и применяется для исправления случайных ошибок, снижая риск возникновения неполадок в работе компьютера от случайного изменения содержимого ячеек памяти, вызваемого внешними факторами, такими, как фоновая радиация.
    Registered модули памяти рекомендуются к применению в системах, требующих (или поддерживающих) 4 Гб и более оперативной памяти. Они всегда имеют разрядность 72 бита, т. е. являются модулями с ЕСС, и содержат дополнительные микросхемы регистров для частичной буферизации.
    PLL- Phase Locked Loop – цепь автоподстройки частоты и фазы сигнала, служит для снижения электрической нагрузки на контроллер памяти и повышения стабильности работы при использовании большого количества микросхем памяти, применяется во всех буферизованных модулях памяти.
    Buffered – буферизованный модуль. Из-за высокой совокупной электрической емкости современных модулей памяти, длительное время их “зарядки” приводит к большим затратам времени на операции записи. Чтобы избежать этого, некоторые модули (как правило, 168-контактные DIMM) снабжаются специальной микросхемой (буфером) , которая сохраняет поступившие данные относительно быстро, что освобождает контроллер. Буферизованные DIMM, как правило, несовместимы с небуферизованными. Модули с частичной буферизацией называются также “регистровым”(“Registered”), а модули с полной буферизацией (Full Buffered) -“FB-DIMM”. При этом под “небуферизоваными” подразумеваются обычные модули памяти без средств буферизации.
    Parity – четность, модули с контролем четности, также контроль четности. Довольно старый принцип проверки целостности данных. Суть метода в том, что для байта данных на стадии записи вычисляется контрольная сумма, которая сохраняется как специальный бит четности в отдельной микросхеме. При чтении данных контрольная сумма вычисляется снова и сравнивается с битом четности. Если они совпали, данные считаются аутентичными, в противном случае генерируется сообщение об ошибке четности (как правило, приводящее к остановке системы) . К явным недостаткам метода относятся дороговизна памяти, требующейся для хранения лишних бит четности, незащищенность от двойных ошибок (а также ложное срабатывание при ошибке в бите четности) , остановка системы даже при непринципиальной ошибке (скажем, в видеокадре) . В настоящее время не применяются.
    SPD – микросхема на модуле памяти DIMM, которая содержит все данные о нем (в частности, информацию о быстродействии), необходимые для обеспечения нормальной работы. Эти данные читаются на этапе самотестирования компьютера, еще задолго до загрузки операционной системы и позволяют настроить параметры обращения к памяти даже при одновременном наличии в системе разномастных модулей памяти. Некоторые материнские платы отказываются работать с модулями, на которых не установлена микросхема SPD, однако такие модули сейчас очень редки и являются, в основном, модулями PC-66.
  5. memtest об проверка может не выявить ошибки а вот проверка в мемтесте –Test 1 Addresstest, ownaddress глубокий тест для выявления ошибок в адресационной прописки памяти — выявляет такие ошибки хорошо, так что если увас появились синие экраны это в основном оперативка или жесткий диск
  6. Говорили тут уже, используй windowsfix.ru

ECC (Error Correct Code - выявление и исправление ошибок) служит для исправления случайных ошибок памяти, вызываемых различными внешними факторами, и представляет собой усовершенствованный вариант системы «контроля четности».

Физически ECC реализуется в виде дополнительной 8-разрядной микросхемы памяти, установленной рядом с основными.

Таким образом, модули с ECC являются 72- разрядным (в отличие от стандартных 64-разрядых модулей).

Некоторые типы памяти (Registered, Full Buffered) выпускаются только в ECC варианте.

Драйвер AMD Radeon Software Adrenalin Edition 19.9.2 Optional

Новая версия драйвера AMD Radeon Software Adrenalin Edition 19.9.2 Optional повышает производительность в игре «Borderlands 3» и добавляет поддержку технологии коррекции изображения Radeon Image Sharpening.

Накопительное обновление Windows 10 1903 KB4515384 (добавлено)

10 сентября 2019 г. Microsoft выпустила накопительное обновление для Windows 10 версии 1903 - KB4515384 с рядом улучшений безопасности и исправлением ошибки, которая нарушила работу Windows Search и вызвала высокую загрузку ЦП.

Драйвер Game Ready GeForce 436.30 WHQL

Компания NVIDIA выпустила пакет драйверов Game Ready GeForce 436.30 WHQL, который предназначен для оптимизации в играх: «Gears 5», «Borderlands 3» и «Call of Duty: Modern Warfare», «FIFA 20», «The Surge 2» и «Code Vein», исправляет ряд ошибок, замеченных в предыдущих релизах, и расширяет перечень дисплеев категории G-Sync Compatible.

Драйвер AMD Radeon Software Adrenalin 19.9.1 Edition

Первый сентябрьский выпуск графических драйверов AMD Radeon Software Adrenalin 19.9.1 Edition оптимизирован для игры Gears 5.

Также схемы ECC-защиты данных могут применяться для встроенной в микропроцессоры памяти: кэш-памяти, регистрового файла. Иногда контроль также добавляют в вычислительные схемы.

Описание проблемы

Существуют опасения, что тенденция к уменьшению физических размеров модулей памяти приведёт к увеличению частоты возникновения ошибок из-за того, что частицы меньших энергий будут способны изменить бит . С другой стороны, компактные размеры памяти уменьшают вероятность попадания частиц в неё. Кроме того, переход на такие технологии, как кремний на изоляторе , может сделать память более устойчивой .

Исследование, проведённое на большом количестве серверов Google , показало, что количество ошибок может быть в пределах от 25 000 до 70 000 ошибок за миллиард рабочих часов (англ. device hours ) на мегабит (то есть 2,5-7,0 × 10 −11 ошибок / бит·час) .

Технология

Одним из решений этой проблемы является контроль чётности - использование дополнительного бита, который записывает четность остальных битов. Такой подход позволяет обнаруживать ошибки, но не позволяет исправлять их. Таким образом при обнаружении ошибки можно только прервать выполнение программы.

Более надёжным является подход, при котором используется коды с коррекцией ошибок . Самым часто используемым кодом с коррекцией ошибок, является код Хэмминга . Большинство памяти с коррекцией ошибок, используемых в современных компьютерах, могут исправлять ошибку одного бита в одном 64-битном машинном слове и определить, но не исправить, ошибку в двух битах в одном 64-битном слове .

Наиболее эффективный подход к исправлению ошибок зависит от вида ожидаемых ошибок. Часто предполагается, что изменение различных битов происходят независимо. В этом случае вероятность двух ошибок в одном слове пренебрежительно мала. Однако это предположение не выполняется для современных компьютеров. Память, основная на технологии коррекции ошибок Chipkill (IBM), позволяет исправлять несколько ошибок, в том числе и при порче целого чипа памяти. Другие технологии коррекции памяти, которые не предполагают независимость ошибок в разных битах, включают Extended ECC (Sun Microsystems), Chipspare (Hewlett-Packard) и SDDC (Intel).

Многие старые системы не сообщали об исправленных ошибках, сообщая только об обнаруженных ошибках, которые невозможно было исправить. Современные системы записывают как исправленные ошибки (CE, англ. correctable errors ), так и неисправляемые ошибки (UE, англ. uncorrectable errors ). Это позволяет вовремя заменить испорченную память: несмотря на то, что большое количество исправленных ошибок при отсутствии неисправляемых ошибок не влияет на корректность работы памяти, это может свидетельствовать о том, что для данного модуля памяти вероятность появления неисправляемых ошибок в будущем возрастёт .

Преимущество и недостатки

Память с коррекцией ошибок защищает от некорректной работы компьютерной системы в связи с порчей памяти и уменьшает вероятность фатального отказа системы. Однако такая память стоит дороже; материнская плата , чипсет и процессор , которые поддерживают память с коррекцией ошибок, тоже могут быть дороже, поэтому такая память используется в системах, в которых важна бесперебойная и корректная работа, таких как файловый сервер , научных и финансовых приложениях.

Память с коррекцией ошибок работает на 2-3 % медленнее (часто для проверки сумм требуется один дополнительный такт контроллера памяти), чем обычная память, в зависимости от приложений . Дополнительная логика, реализующая подсчет, проверку ECC и исправление ошибок, требует логических ресурсов и времени на свою работу либо в самом контроллере памяти, либо в интерфейсе между CPU и контроллером памяти .

См. также

Примечания

  1. Werner Fischer. RAM Revealed (неопр.) . admin-magazine.com . Дата обращения 20 октября 2014.
  2. Архивированная копия (неопр.) (недоступная ссылка) . Дата обращения 20 ноября 2016. Архивировано 18 апреля 2016 года.
  3. Single Event Upset at Ground Level, Eugene Normand, Member, IEEE, Boeing Defense & Space Group, Seattle, WA 98124-2499
  4. «A Survey of Techniques for Modeling and Improving Reliability of Computing Systems », IEEE TPDS, 2015
  5. Кузнецов В. В. Солнечно-земная физика (курс лекций для студентов физиков). Лекция 7. Солнечная активность. // Солнечные бури. Горно-Алтайский государственный университет. 2012
  6. Gary M. Swift and Steven M. Guertin. "In-Flight Observations of Multiple-Bit Upset in DRAMs". Jet Propulsion Laboratory
  7. Borucki, "Comparison of Accelerated DRAM Soft Error Rates Measured at Component and System Level", 46th Annual International Reliability Physics Symposium, Phoenix, 2008, pp. 482–487
  8. Schroeder, Bianca; Pinheiro, Eduardo; Weber, Wolf-Dietrich. DRAM Errors in the Wild: A Large-Scale Field Study (неопр.) // SIGMETRICS/Performance. - ACM, 2009. - ISBN 978-1-60558-511-6 .
  9. Using StrongArm SA-1110 in the On-Board Computer of Nanosatellite (неопр.) . Tsinghua Space Center, Tsinghua University, Beijing. Дата обращения 16 февраля 2009. Архивировано 2 октября 2011 года.
  10. Doug Thompson, Mauro Carvalho Chehab. «EDAC - Error Detection And Correction» Архивировано 5 сентября 2009 года. . 2005-2009. «The "edac" kernel module goal is to detect and report errors that occur within the computer system running under linux.»
  11. Discussion of ECC on pcguide (неопр.) . Pcguide.com (17 апреля 2001). Дата обращения 23 ноября 2011.

Очень часто при выборе комплектующих мы сталкиваемся с различными непонятными терминами и понятиями. При выборе оперативной памяти это может быть DDR, DDR2, DDR3, DDR4, RDRAM, RIMM и т.п. Если с основными типами ОЗУ всё более-менее понятно, а поддержка каждого типа указана в описании к материнской плате, то такой параметр, как ECC у многих вызывает некоторые вопросы. Что такое ECC-память? Можно ли использовать ECC оперативку на домашнем компьютере и в чём главное отличие ECC RAM и non-ECC RAM?

Что такое ECC-память?

Это особый вид оперативной памяти со встроенными аппаратными средствами коррекции ошибок. Подобные модули памяти были разработаны специально для серверов, где требования к корректности данных и надёжности их обработки значительно выше чем на персональных компьютерах.

ECC-Ram автоматически распознаёт спонтанные изменения данных в блоках хранения, то есть возникшие ошибки. Обычная — десктопная память без поддержки механизмов коррекции называется non-ECC.

На что способна ECC-память и как это работает?

Память с коррекцией ошибок может определить и исправить 1 бит изменённых данных в каждом машинном слове. Что это значит? Если данные между записью и чтением были по каким-либо причинам изменены (то есть возникла ошибка), то ECC ОЗУ скорректирует значение до верного. Подобная функциональность требует поддержки со стороны контроллера оперативной памяти. Эта поддержка может быть организована со стороны чипсета материнской платы, встроенного контроллера ОЗУ в современные процессоры.

Алгоритм исправления ошибок основан на коде Хэмминга, но для исправления более одной ошибки применяются прочие алгоритмы. На практике используются модули памяти, где для каждых 8 микросхем памяти добавляется ещё по одной микросхеме, хранящей ECC-коды (8 бит на каждые 64 бита основной памяти).

Почему искажается значение в ячейках памяти RAM?

Одна из основных причин искажения данных — космические лучи. Хотя мы находимся на Земле под защитой атмосферы, космические лучи несут с собой некие элементарные частицы, способные влиять на электронику, в том числе, на компьютерную память. Под действием энергии этих частиц возможно изменение состояния ячейки памяти, что ведёт к искажению данных и возникновению ошибок. Интересно, что воздействие космических лучей увеличивается с ростом высоты, поэтому компьютерные системы, находящиеся на большой высоте требуют лучшей защиты.

Как работает память с поддержкой ECC

Один из механизмов контроля ошибок в оперативной памяти — использовать технологию контроля чётности, что позволяет фиксировать факт возникновения ошибки в данных, но не позволяет скорректировать данные.

Для ECC коррекции используется код Хэмминга. ECC защищает компьютерные системы от некорректной работы в связи с порчей памяти и снижает вероятность критического отказа системы. Память с поддержкой ECC работает на 2-3 % медленнее чем non-ECC в зависимости от приложений.

Причины использовать ЕСС-память

Объективных причин использовать оперативную память с поддержкой ECC в настольных компьютерах нет. Так как вероятность возникновения ошибок данных крайне мала, то в обычных сценариях использования ПК крайне маловероятно, что возникновение ошибки приведёт к возникновению проблем или критических сбоев в работе ПК. Самый страшный сценарий — появление синего экрана смерти BSOD. Кроме того, использование ECC-ОЗУ затруднено тем, что настольные процессоры и материнские платы в своём большинстве не поддерживают данный тип оперативной памяти.

Использование оперативки с коррекцией ошибок ECC актуально для сервером и корпоративного сегмента, где требования к отказоустойчивости и надёжности очень высоки, а корректность данных может влиять на результаты вычислений и работу системы в целом.

Как Вам? -
mob_info