Server Supermicro перегрев LSI MegaRAID SAS 9271-8i

1. Roman Snigur (remix950) 9 22.10.14 11:25 Сейчас в теме
Добрый день

Собрали новое железо: сервер Supermicro запускается на ура, но при просмотре в MegaRaid Bios нас смущает температура этого контролера 96-97С, дальше просто не решаемся экспериментировать, хотя руки уже чешутся... )

Подскажите пожалуйста, кто-нибудь сталкивался с этой проблемой ?

Во вложении рис.:
1) полный "фарш" Supermicro
2) сам виновник LSI MegaRAID SAS 9271-8i
3) температура в MegaRaid BIOS

P.S. Просьба к "представителям в РФ Supermicro" не направлять, ибо уже связывались с "оными" !!!
Прикрепленные файлы:
Ответы
2. Александр (AlexInqMetal) 45 22.10.14 17:53 Сейчас в теме
(1) remix950, крышку корпуса пробовали закрывать?
remix950; +1 Ответить
3. Roman Snigur (remix950) 9 23.10.14 02:43 Сейчас в теме
(2) AlexInqMetal, Температура стала 84С, заявленная должна быть 60С по тех документации
4. Владимир (hogik) 423 23.10.14 02:48 Сейчас в теме
(1)
Поддерживаю текст из (2) сообщения. ;-)
А ещё надо на эту плату дунуть сильно. Маловат радиатор...
Думаю, разработчик этой платы планировали несколько другое её положение относительно вентиляторов. Т.е. в корпусе с сильным продольным продувом. Рекомендую купить или сделать подобное устройство:
http://www.nix.ru/autocatalog/titan_coolers/TITAN_TTCSC03TZ_Universal_VGA_H­eat_Terminator_33_24004400_PCI_ISA_33569.html?city_id=1721
drogs; remix950; +2 Ответить
5. Roman Snigur (remix950) 9 23.10.14 03:49 Сейчас в теме
(4) hogik, Точно, так и сделаю. Спасибо всем. Тема закрыта !
9. Роман Романов (drogs) 26.12.14 09:32 Сейчас в теме
(4) hogik, все верно. вентилятор по мощнее и вперед.
16. Александр alex_2h2008 (alex_sh2008) 5 24.01.17 08:28 Сейчас в теме
(1)Пока сервер на гарантии и не запустили в работу вернуть поставщику, пусть голову ломает. Не должен контроллер грется так сильно
18. Cthutq Иванов (ewqewqewq) 25.01.17 14:08 Сейчас в теме
(16)
Пока сервер на гарантии и не запустили в работу вернуть поставщику, пусть голову ломает. Не должен контроллер грется так сильно

Поздно. Это мой первый сервер. Поэтому много было доверия сборщику. Да и в эксплуатацию я его вводил не быстро.


20. Александр alex_2h2008 (alex_sh2008) 5 25.01.17 14:57 Сейчас в теме
(18)Если в сервере не правильно смонтирована система охлаждения, то по мимо выхода из строя комплектующих, будет не стабильная работа самого сервера, особенно в жаркие дни и на максимальных нагрузках. У вас температура 90 это смахивает на бракованную плату. Ставьте продольное охлаждение с вентиляторами 10-11 тыс об/мин, может и справится.
21. Cthutq Иванов (ewqewqewq) 25.01.17 17:07 Сейчас в теме
(20)
особенно в жаркие дни и на максимальных нагрузках
у меня редко максимальны загрузки. Сервер взят с запасом, по принципу бери пока дают. В целом не прогадал, если тогда бы не взял не было бы сервера еще лет пять)).
Я удерживаю температуру около критической сейчас 57 градусов. обдуваю его 120 низкооборотистым куллером.
22. Александр alex_2h2008 (alex_sh2008) 5 25.01.17 18:58 Сейчас в теме
(21)Главное что бы ваш вентилятор не нагревал другие элементы, память, чипсеты на плате, жесткие диски.
23. Cthutq Иванов (ewqewqewq) 25.01.17 20:37 Сейчас в теме
(22)
Главное что бы ваш вентилятор не нагревал другие элементы, память, чипсеты на плате, жесткие диски.


Вентилятор меняет потоки. На мой взгляд из за него идет подсос воздуха сзади. В частности пыли((.Но координатно он потоки не меняет так как процессоры и память закрыты крышкой)). Да и единственный кулер который стоит на центральной стойке и дует в сторону RAID не особо на мой взгляд до него не достает. А вот через проц и память протягивают 4 кулера. 2 сзади и 2 на центрально стойке. Установкой 2 х вытяжных кулеров сзади я не решу проблему окончательно ? Корпус
Корпус серверный SuperMicro CSE-745TQ-R800B 4U 8x3.5"SAS/SATA Bays, 2x800W
24. Александр alex_2h2008 (alex_sh2008) 5 25.01.17 20:56 Сейчас в теме
(23) По этой ссылке https://www.supermicro.com/manuals/chassis/tower/SC745.pdf, документация на корпус, в нем предусмотрено 3 вентилятора которые обдувают как процессор с памятью, так и слоты, у вас такая же конфигурация?
27. Cthutq Иванов (ewqewqewq) 26.01.17 12:04 Сейчас в теме
(24) Да такая + стоит Air Shroud тем самым поток в Air Shroud идет от двух вентиляторов на проц и память, а поток от самого нижнего идет уже без Air Shroud на плату контролера.

29. Александр alex_2h2008 (alex_sh2008) 5 26.01.17 13:04 Сейчас в теме
(27)Остается либо вентиляторы (должны стоять 5000RPM) стоят слабые не обеспечивают нужный поток, либо контроллер бракованный. Нагрузите контроллер работой если начнет глючить, то в утиль, или замените нижний вентилятор на 10000RPM
30. Cthutq Иванов (ewqewqewq) 26.01.17 16:41 Сейчас в теме
(29)
Остается либо вентиляторы (должны стоять 5000RPM) стоят слабые не обеспечивают нужный поток, либо контроллер бракованный. Нагрузите контроллер работой если начнет глючить, то в утиль, или замените нижний вентилятор на 10000RPM

Глюков при работе не обнаружено. Единственный глюк это зависание при загрузке(не всегда). И то не понятно вообще имеет ли вообще отношению к контролеру или все же к ОС и тд.

Единственная проблема это "циферки" температуры. Хотя я так понимаю эти "циферки" температуры могут вылиться проблемы в будущем.
31. Александр alex_2h2008 (alex_sh2008) 5 26.01.17 18:12 Сейчас в теме
(30)
Единственная проблема это "циферки" температуры. Хотя я так понимаю эти "циферки" температуры могут вылиться проблемы в будущем.

Это большая проблема и зависание ОС при загрузке может быть связанно с этим, контроллер тормозит, и плохо определяется системой. Лучше не рисковать а вернуть контроллер поставщику или весь сервер для комплексной диагностики, не стоит рисковать
32. Cthutq Иванов (ewqewqewq) 26.01.17 20:40 Сейчас в теме
(31) сервер уже боевой. Хоть по сути все в гипервизоре все ровно переносить не куда особо. ((
33. Александр alex_2h2008 (alex_sh2008) 5 26.01.17 21:01 Сейчас в теме
(32) Тогда поддерживайте температуру у сервера около 20 градусов, и желательно замените вентилятор на более производительный. Летом если будет на улице жарко температура может достигнуть критической и контроллер будет выключатся. Также про мониторьте температуру в закрытом корпусе
34. Cthutq Иванов (ewqewqewq) 27.01.17 02:23 Сейчас в теме
(33) У меня окружающая среда больше 26 градусов. ...А вот еще два вентилятора на выдув напротив ПСИ слотов запросил у производителя в декабре до сих пор динамит((. Говорит что все ок должно быть....они лишние.
В корпусе около 35-40 градусов.
35. Александр alex_2h2008 (alex_sh2008) 5 27.01.17 11:18 Сейчас в теме
(34) Эти вентиляторы должны быть такие же как основной иначе, горячий воздух не будет выдуваться из корпуса.
В корпусе около 35-40 градусов.

При такой температуре контроллер греться должен 50-55, если больше то охлаждение не справляется
25. Александр alex_2h2008 (alex_sh2008) 5 25.01.17 21:00 Сейчас в теме
(23)+ если такая же то проверьте куда направлен воздушный поток, может у вас поток идет не в сторону платы, а наоборот.
26. Андрей Sh. (ansh15) 25.01.17 21:32 Сейчас в теме
(23) Посмотрите еще режим работы самих вентиляторов в BIOS матплаты или через IPMI. Там же его можно и выставить, например, HeavyIO или Full, Ну да, будет гудеть довольно сильно.
28. Cthutq Иванов (ewqewqewq) 26.01.17 12:14 Сейчас в теме
(26)
Посмотрите еще режим работы самих вентиляторов в BIOS матплаты или через IPMI. Там же его можно и выставить, например, HeavyIO или Full, Ну да, будет гудеть довольно сильно.

нет там стоит Fan to Optimal Speed. Опять же включение Full не понижает значительно температуру. Потому что проц и тд и так не греются, а когда идет нагрузка и греются сервер сам увеличивает обороты. (Заметно по шуму его загрузку) опять же 90 процентов времени сервер загружен на 10-15 процентов. И кулеры работают на мин режиме.
6. Евгений Попов (landings) 15.12.14 11:15 Сейчас в теме
такой нагрев явно говорит о проблемном железе контролера , поэтому нужно так или иначе решать вопрос с официалами, учитывая степень критичности данного узла, в боевом сервере я бы десять раз подумал прежде чем ставить
7. Станислав (audion) 22.12.14 17:43 Сейчас в теме
(6) landings, плата должна стоять вертикально, тогда никаких проблем с перегревон не возникает, если, конечно, грамотно организован продув внутри корпуса. А при расположении "радиатором вниз" плата нуждается в принудительной вентиляции. Мне в свое время попадалась подобная информация на сайте Intel, где обсуждался перегрев аналогичного контроллера.
У Adaptek, кстати, на держателе радиатора есть даже отверстия с резьбой М2,5 для установки вентилятора (кажется, 40х40), мы всегда их ставим в таких корпусах.
Железо не проблемное, тут проблема "мелкого шрифта в примечании к сноске".
8. Андрей Вовк (wowkai) 4 24.12.14 15:32 Сейчас в теме
у нас тоже сервера SuperMicro и бывает летом температура контролера Adaptec поднимается до 100 градусов. Температура не нормальная, но только когда уже более 110 идет warning в програме контролера. я думаю такая же ситуация с LSI. поставьте программу и если горячо она вам сама скажет.
10. Cthutq Иванов (ewqewqewq) 11.01.17 19:23 Сейчас в теме
У меня такая же проблема. ужасный контроллер. Неужели нельзя сделать за такие деньги запас на охолождение? Поднимаю для того тему что бы поднять если холодные или хотя бы продуманные контроллеры ?
11. Андрей Sh. (ansh15) 11.01.17 19:42 Сейчас в теме
Еще рекомедуют поддержание температуры в серверных помещениях - https://habrahabr.ru/post/235245/
А то "дунуть на ужасный контроллер" воздухом 30-35 градусов(особенно летом) как-то совсем нехорошо...
А я парюсь по поводу того, что на одном из серверов батарейка LSI контроллера греется аж до 40 градусов, в то время как на других 28-32.
12. Cthutq Иванов (ewqewqewq) 12.01.17 15:36 Сейчас в теме
(11)
в батарейка LSI контроллера греется аж до 40 градусов, в то время как на других 28-32.

у меня 28 градусов батарейка. В помещении значит 23-26. То есть, если она греется до 40 и в помещении не 35 градусов, то я опять же считаю значит батарейку не там расположили (в горячем месте) и тд.

Я понимаю, что есть требование, но эти требования к сожалению не могут выполнить 80 процентов компаний. Опять же десктопные системы работают же в таких условиях.Я не говорю про режимы 100 процентной загрузки, я говорю, что не должен контроллер в простое(при малой нагрузке) ночью так греется и это недоработка разработчика. Не один компонент в моем случае при этой нагрузке и температуре не перегревается кроме контролера. Или вы считаете, что производили другого железа неправильно сделали, что их оборудование может успешно работать и при немного повышеной температуре ?


Офтопик. Приезжаю в сервис на ВАЗ говорю, тут стучит. Ответ, а что ты хочешь это ваз, это его особенность что тут все стучит и тд. (Сделал в другом сервисе и все ок). Приезжаю в сервис на авто за 30 тыс баксов (1 000 000 млн до 2014 года) говорю авто почти новое а тут уже ..... говорят а что ты хочешь это особенность корейских ведер.... Опять же я скажу производителю у которого авто заведется в минус 30, а те тому кто мне напишет, что мы тут подумали и разрешаем эксплатировать наш автомобиль от -15 до +30 и все.....
14. Андрей Sh. (ansh15) 12.01.17 17:26 Сейчас в теме
Вот требования - http://ask.adaptec.com/app/answers/detail/a_id/15345/~/temperature-requirement-for-series-2,-5,-6,-7,-and-8-adaptec-raid-controllers.
и http://serverfault.com/questions/541816/lsi-megaraid-expected-chip-temperature (там ответ от LSI)
(12) Думаю, что Adaptec, LSI и производители контроллеров на основе чипов LSI(те же Intel или Supermicro) свои топовые контроллеры позиционируют не для десктопного применения. и для обеспечения долговременной устойчивой работы с заявленными характеристиками таких контроллеров требуются доп. условия по охлаждению.
https://www.google.ru/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0ahU­KEwjxoMOI3rzRAhWE1SwKHX64DqIQFggcMAA&url=https%3A%2F%2Fdocs.broadcom.com%2Fdocs%2F12348578&usg=AFQjCNF5EcKB70xXEbC7SQ2R1toa3vVp4w­ - графики зависимости температуры около чипсета от скорости обдува и и температуры входного воздушного потока.
13. Cthutq Иванов (ewqewqewq) 12.01.17 15:44 Сейчас в теме
(11)
"дунуть на ужасный контроллер" воздухом 30-35 градусов(особенно летом) как-то совсем нехорошо...


Не спорю, что я сам не прав, нарушая рекомендации по температуре, но и производитель не прав производя оборудование которое в чуть не штатной ситуации перегревается.
У друга была серверная, так случилось, что кондей сломался, а второй не справлялся. температура резко возрастала и ему пришлось охолождать оборудование подручными средствами (напольный кондей). В итоге оборудование работало при повышено температуре 3 суток. Иными словами даже в серверной с кондеем, могут быть всякие нештатные ситуации.... а что говорит вот в новый год у хостера в дата центре был сбой на 5-8 часов((.

Как раз на нештатные ситуации хочется иметь определены запас для маневра.
15. Cthutq Иванов (ewqewqewq) 23.01.17 17:43 Сейчас в теме
Я с вами согласен. Беда в том, что сборщик сервера было поставлено условия тихого сервера, работающего в помещении с людьми. В начально конфигурации не было раид, он был «навязан» сборщиком, что можно экономить на всем, но рейд поставь. Да и сервер это мой первый был.

Я конечно понимаю это нарушение, но скажем грузовик, который можно грузить до 20 тонн, а загрузив его до 21 тонны он развалился – я больше не куплю. ИМХО должен быть запас прочности, просто нужно понимать, что этим ты убиваешь технику.
2) телефон который нельзя ронять, но уронив с высоты 70 см и он разбился, я не куплю. Я понимаю, что все зависит от точки удара и тд. Пока говорим абстрактно взяли 3 телефона все одинаково уронили и выжило 2 из 3. Опять же производитель запрещает их ронять, но это доп. преимущество.
3) Купив 2 лампочки разных производителей и установив в одну люстру одна работает, другая перегорела. Опять я в будущем выберу более надежную и не важно, что обе проработали 1000 часов (ха ха), но одна проработала 1001 час, а вторая 1500 часов.
Но ваша позиция мне ясна, это проф. оборудование, значит любителю тут не место («любительским» условиям) и тут ставят минимум защит от дурака. Хотя бывает и наоборот, некоторые ручные приборы уровня проф, наоборот более живущие и им не почем падения, холод и тд.

Моя же позиция, такая что прибор дорогой (да и дешёвый если бы был тоже не дело, но более простительно) и должны быть продумано (хотя бы должен быть в продаже их куллер или радиатор усиленный, который нужно докупить если оборудование работает в сложных условиях ) все и многочисленные жалобы в интернете говорят о том, что они сделали сначала молоток, а потом сказали, что им нельзя бить с силой больше N. Об этом свидетельствует так же что даже сборщик серверов, зная сложные условия и получил полный зеленый свет на кол-во кулеров не смог собрать, так что бы устройство не перегревалось ((.




17. Андрей Sh. (ansh15) 24.01.17 20:25 Сейчас в теме
(15) http://forum.ixbt.com/topic.cgi?id=66:7088
Это давняя тема.
Для сервера в "офисе с людьми" надо что-то попроще.
19. Cthutq Иванов (ewqewqewq) 25.01.17 14:09 Сейчас в теме
(17)Это мой первый сервер. Поэтому сборщику доверился и поставил задачу. Но в целом термимо.
Оставьте свое сообщение