Русский
Русский
English
Статистика
Реклама

Короткая заметка по инциденту с перегревом RAID-контроллера LSI в сервере в холодном ЦОДе

TL;DR; настройка режима работы системы охлаждения сервера Supermicro Optimal не обеспечивает стабильность работы LSI-контроллера MegaRAID 9361-8i в холодном ЦОД-е.


Мы стараемся не использовать аппаратные контроллеры RAID, но есть у нас один клиент, который предпочитает именно конфигурации c LSI MegaRAID. Сегодня мы столкнулись с перегревом карты MegaRAID 9361-8i в связи с тем, что платформа не чувствовала перегрева, а RAID-контроллер его чувствовал.


Вид платформы с RAID-картой представлен на рисунках ниже:



Несколько важных моментов, связанных с этим сервером и средой эксплуатации:


Инженер, собиравший платформу специально поставил напротив карты два вентилятора, поскольку знает, что LSI-контроллеры сильно греются. Обратите внимание на материнскую плату, она под контроллер практически не заходит, заканчиваясь через 3 см после слота PCI-E.


Как видите, все вентиляторы подключены штатно к материнской плате Supermicro и в режиме Optimal "дуют" в зависимости от сенсоров на ней, температуры CPU.


В данной платформе стоит Xeon E-2236 весьма холодный CPU, который у клиента, видимо, сильно и не нагревался.


ЦОД, в котором стоит данный сервер весьма холодный холодный коридор дает 18-20 градусов.


Совокупность этих факторов привела к весьма интересному явлению перегреву RAID-контроллера.


Вероятная цепочка, как это произошло:


  1. холодный процессор и материнская плата сообщали вентиляторам о том, что дуть можно слабо.
  2. материнская карта под RAID-ом отсутствовала и не было датчиков, которые бы фиксировали перегрев.
  3. Вентиляторы, будучи сконфигурироваными, в режиме Optimal дули слабо, согласно потребностям материнской платы и CPU.
  4. Контроллер, не получая достаточного потока воздуха перегрелся.

Что сделали


Переключили вентиляторы в режим "Standard", при необходимости переведем в более высокий режим производительности.


Выводы


Скорее всего, если бы холодный коридор ЦОД-а был бы не таким холодным, или клиент бы интенсивно использовал CPU, данная проблема могла бы и не произойти, поскольку вентиляторы бы работали в более интенсивном режиме.


Для себя мы решили обязательно менять режим работы вентиляторов на серверах с RAID с Optimal на режим с повышенной частотой вращения.

Источник: habr.com
К списку статей
Опубликовано: 17.07.2020 08:05:27
0

Сейчас читают

Комментариев (0)
Имя
Электронная почта

Администрирование баз данных

Raid контроллер

Megaraid

Lsi sas

Supermicro

Цод

Системное администрирование

Категории

Последние комментарии

  • Имя: Murshin
    13.06.2024 | 14:01
    Нейросеть-это мозг вселенной.Если к ней подключиться,то можно получить все знания,накопленные Вселенной,но этому препятствуют аннуннаки.Аннуннаки нас от неё отгородили,установив в головах барьер. Подр Подробнее..
  • Имя: Макс
    24.08.2022 | 11:28
    Я разраб в IT компании, работаю на арбитражную команду. Мы работаем с приламы и сайтами, при работе замечаются постоянные баны и лаги. Пацаны посоветовали сервис по анализу исходного кода,https://app Подробнее..
  • Имя: 9055410337
    20.08.2022 | 17:41
    поможем пишите в телеграм Подробнее..
  • Имя: sabbat
    17.08.2022 | 20:42
    Охренеть.. это просто шикарная статья, феноменально круто. Большое спасибо за разбор! Надеюсь как-нибудь с тобой связаться для обсуждений чего-либо) Подробнее..
  • Имя: Мария
    09.08.2022 | 14:44
    Добрый день. Если обладаете такой информацией, то подскажите, пожалуйста, где можно найти много-много материала по Yggdrasil и его уязвимостях для написания диплома? Благодарю. Подробнее..
© 2006-2024, personeltest.ru