Собрали новое железо: сервер Supermicro запускается на ура, но при просмотре в MegaRaid Bios нас смущает температура этого контролера 96-97С, дальше просто не решаемся экспериментировать, хотя руки уже чешутся... )
Подскажите пожалуйста, кто-нибудь сталкивался с этой проблемой ?
Во вложении рис.:
1) полный "фарш" Supermicro
2) сам виновник LSI MegaRAID SAS 9271-8i
3) температура в MegaRaid BIOS
P.S. Просьба к "представителям в РФ Supermicro" не направлять, ибо уже связывались с "оными" !!!
(18)Если в сервере не правильно смонтирована система охлаждения, то по мимо выхода из строя комплектующих, будет не стабильная работа самого сервера, особенно в жаркие дни и на максимальных нагрузках. У вас температура 90 это смахивает на бракованную плату. Ставьте продольное охлаждение с вентиляторами 10-11 тыс об/мин, может и справится.
у меня редко максимальны загрузки. Сервер взят с запасом, по принципу бери пока дают. В целом не прогадал, если тогда бы не взял не было бы сервера еще лет пять)).
Я удерживаю температуру около критической сейчас 57 градусов. обдуваю его 120 низкооборотистым куллером.
Главное что бы ваш вентилятор не нагревал другие элементы, память, чипсеты на плате, жесткие диски.
Вентилятор меняет потоки. На мой взгляд из за него идет подсос воздуха сзади. В частности пыли((.Но координатно он потоки не меняет так как процессоры и память закрыты крышкой)). Да и единственный кулер который стоит на центральной стойке и дует в сторону RAID не особо на мой взгляд до него не достает. А вот через проц и память протягивают 4 кулера. 2 сзади и 2 на центрально стойке. Установкой 2 х вытяжных кулеров сзади я не решу проблему окончательно ? Корпус
Корпус серверный SuperMicro CSE-745TQ-R800B 4U 8x3.5"SAS/SATA Bays, 2x800W
(24) Да такая + стоит Air Shroud тем самым поток в Air Shroud идет от двух вентиляторов на проц и память, а поток от самого нижнего идет уже без Air Shroud на плату контролера.
(27)Остается либо вентиляторы (должны стоять 5000RPM) стоят слабые не обеспечивают нужный поток, либо контроллер бракованный. Нагрузите контроллер работой если начнет глючить, то в утиль, или замените нижний вентилятор на 10000RPM
Остается либо вентиляторы (должны стоять 5000RPM) стоят слабые не обеспечивают нужный поток, либо контроллер бракованный. Нагрузите контроллер работой если начнет глючить, то в утиль, или замените нижний вентилятор на 10000RPM
Глюков при работе не обнаружено. Единственный глюк это зависание при загрузке(не всегда). И то не понятно вообще имеет ли вообще отношению к контролеру или все же к ОС и тд.
Единственная проблема это "циферки" температуры. Хотя я так понимаю эти "циферки" температуры могут вылиться проблемы в будущем.
Единственная проблема это "циферки" температуры. Хотя я так понимаю эти "циферки" температуры могут вылиться проблемы в будущем.
Это большая проблема и зависание ОС при загрузке может быть связанно с этим, контроллер тормозит, и плохо определяется системой. Лучше не рисковать а вернуть контроллер поставщику или весь сервер для комплексной диагностики, не стоит рисковать
(32) Тогда поддерживайте температуру у сервера около 20 градусов, и желательно замените вентилятор на более производительный. Летом если будет на улице жарко температура может достигнуть критической и контроллер будет выключатся. Также про мониторьте температуру в закрытом корпусе
(33) У меня окружающая среда больше 26 градусов. ...А вот еще два вентилятора на выдув напротив ПСИ слотов запросил у производителя в декабре до сих пор динамит((. Говорит что все ок должно быть....они лишние.
В корпусе около 35-40 градусов.
(23) Посмотрите еще режим работы самих вентиляторов в BIOS матплаты или через IPMI. Там же его можно и выставить, например, HeavyIO или Full, Ну да, будет гудеть довольно сильно.
Посмотрите еще режим работы самих вентиляторов в BIOS матплаты или через IPMI. Там же его можно и выставить, например, HeavyIO или Full, Ну да, будет гудеть довольно сильно.
нет там стоит Fan to Optimal Speed. Опять же включение Full не понижает значительно температуру. Потому что проц и тд и так не греются, а когда идет нагрузка и греются сервер сам увеличивает обороты. (Заметно по шуму его загрузку) опять же 90 процентов времени сервер загружен на 10-15 процентов. И кулеры работают на мин режиме.
(1)для таких контроллеров ставят вентиляторы на обдув, по крайне мере во всех стоечных корпусах есть такие вентиляторы, в десктопах может не ставят но места предусмотрены.
такая температура не критичная но если он на холостом ходу так греется то это плохо
такой нагрев явно говорит о проблемном железе контролера , поэтому нужно так или иначе решать вопрос с официалами, учитывая степень критичности данного узла, в боевом сервере я бы десять раз подумал прежде чем ставить
(6) landings, плата должна стоять вертикально, тогда никаких проблем с перегревон не возникает, если, конечно, грамотно организован продув внутри корпуса. А при расположении "радиатором вниз" плата нуждается в принудительной вентиляции. Мне в свое время попадалась подобная информация на сайте Intel, где обсуждался перегрев аналогичного контроллера.
У Adaptek, кстати, на держателе радиатора есть даже отверстия с резьбой М2,5 для установки вентилятора (кажется, 40х40), мы всегда их ставим в таких корпусах.
Железо не проблемное, тут проблема "мелкого шрифта в примечании к сноске".
у нас тоже сервера SuperMicro и бывает летом температура контролера Adaptec поднимается до 100 градусов. Температура не нормальная, но только когда уже более 110 идет warning в програме контролера. я думаю такая же ситуация с LSI. поставьте программу и если горячо она вам сама скажет.
У меня такая же проблема. ужасный контроллер. Неужели нельзя сделать за такие деньги запас на охолождение? Поднимаю для того тему что бы поднять если холодные или хотя бы продуманные контроллеры ?
Еще рекомедуют поддержание температуры в серверных помещениях - https://habrahabr.ru/post/235245/ А то "дунуть на ужасный контроллер" воздухом 30-35 градусов(особенно летом) как-то совсем нехорошо...
А я парюсь по поводу того, что на одном из серверов батарейка LSI контроллера греется аж до 40 градусов, в то время как на других 28-32.
в батарейка LSI контроллера греется аж до 40 градусов, в то время как на других 28-32.
у меня 28 градусов батарейка. В помещении значит 23-26. То есть, если она греется до 40 и в помещении не 35 градусов, то я опять же считаю значит батарейку не там расположили (в горячем месте) и тд.
Я понимаю, что есть требование, но эти требования к сожалению не могут выполнить 80 процентов компаний. Опять же десктопные системы работают же в таких условиях.Я не говорю про режимы 100 процентной загрузки, я говорю, что не должен контроллер в простое(при малой нагрузке) ночью так греется и это недоработка разработчика. Не один компонент в моем случае при этой нагрузке и температуре не перегревается кроме контролера. Или вы считаете, что производили другого железа неправильно сделали, что их оборудование может успешно работать и при немного повышеной температуре ?
Офтопик. Приезжаю в сервис на ВАЗ говорю, тут стучит. Ответ, а что ты хочешь это ваз, это его особенность что тут все стучит и тд. (Сделал в другом сервисе и все ок). Приезжаю в сервис на авто за 30 тыс баксов (1 000 000 млн до 2014 года) говорю авто почти новое а тут уже ..... говорят а что ты хочешь это особенность корейских ведер.... Опять же я скажу производителю у которого авто заведется в минус 30, а те тому кто мне напишет, что мы тут подумали и разрешаем эксплатировать наш автомобиль от -15 до +30 и все.....
"дунуть на ужасный контроллер" воздухом 30-35 градусов(особенно летом) как-то совсем нехорошо...
Не спорю, что я сам не прав, нарушая рекомендации по температуре, но и производитель не прав производя оборудование которое в чуть не штатной ситуации перегревается.
У друга была серверная, так случилось, что кондей сломался, а второй не справлялся. температура резко возрастала и ему пришлось охолождать оборудование подручными средствами (напольный кондей). В итоге оборудование работало при повышено температуре 3 суток. Иными словами даже в серверной с кондеем, могут быть всякие нештатные ситуации.... а что говорит вот в новый год у хостера в дата центре был сбой на 5-8 часов((.
Как раз на нештатные ситуации хочется иметь определены запас для маневра.
Я с вами согласен. Беда в том, что сборщик сервера было поставлено условия тихого сервера, работающего в помещении с людьми. В начально конфигурации не было раид, он был «навязан» сборщиком, что можно экономить на всем, но рейд поставь. Да и сервер это мой первый был.
Я конечно понимаю это нарушение, но скажем грузовик, который можно грузить до 20 тонн, а загрузив его до 21 тонны он развалился – я больше не куплю. ИМХО должен быть запас прочности, просто нужно понимать, что этим ты убиваешь технику.
2) телефон который нельзя ронять, но уронив с высоты 70 см и он разбился, я не куплю. Я понимаю, что все зависит от точки удара и тд. Пока говорим абстрактно взяли 3 телефона все одинаково уронили и выжило 2 из 3. Опять же производитель запрещает их ронять, но это доп. преимущество.
3) Купив 2 лампочки разных производителей и установив в одну люстру одна работает, другая перегорела. Опять я в будущем выберу более надежную и не важно, что обе проработали 1000 часов (ха ха), но одна проработала 1001 час, а вторая 1500 часов.
Но ваша позиция мне ясна, это проф. оборудование, значит любителю тут не место («любительским» условиям) и тут ставят минимум защит от дурака. Хотя бывает и наоборот, некоторые ручные приборы уровня проф, наоборот более живущие и им не почем падения, холод и тд.
Моя же позиция, такая что прибор дорогой (да и дешёвый если бы был тоже не дело, но более простительно) и должны быть продумано (хотя бы должен быть в продаже их куллер или радиатор усиленный, который нужно докупить если оборудование работает в сложных условиях ) все и многочисленные жалобы в интернете говорят о том, что они сделали сначала молоток, а потом сказали, что им нельзя бить с силой больше N. Об этом свидетельствует так же что даже сборщик серверов, зная сложные условия и получил полный зеленый свет на кол-во кулеров не смог собрать, так что бы устройство не перегревалось ((.
Чип LSISAS2208 Dual- core 6Gb/s ROC допускает температуру 115С самого чипа, и 60С окружающей среды. Особого повода для беспокойства нет если Вы ещё далеки от 115С.