Server Supermicro перегрев LSI MegaRAID SAS 9271-8i

1. remix950 9 22.10.14 11:25 Сейчас в теме
Добрый день

Собрали новое железо: сервер Supermicro запускается на ура, но при просмотре в MegaRaid Bios нас смущает температура этого контролера 96-97С, дальше просто не решаемся экспериментировать, хотя руки уже чешутся... )

Подскажите пожалуйста, кто-нибудь сталкивался с этой проблемой ?

Во вложении рис.:
1) полный "фарш" Supermicro
2) сам виновник LSI MegaRAID SAS 9271-8i
3) температура в MegaRaid BIOS

P.S. Просьба к "представителям в РФ Supermicro" не направлять, ибо уже связывались с "оными" !!!
Прикрепленные файлы:
Найденные решения
4. hogik 443 23.10.14 02:48 Сейчас в теме
(1)
Поддерживаю текст из (2) сообщения. ;-)
А ещё надо на эту плату дунуть сильно. Маловат радиатор...
Думаю, разработчик этой платы планировали несколько другое её положение относительно вентиляторов. Т.е. в корпусе с сильным продольным продувом. Рекомендую купить или сделать подобное устройство:
http://www.nix.ru/autocatalog/titan_coolers/TITAN_TTCSC03TZ_Universal_VGA_H­eat_Terminator_33_24004400_PCI_ISA_33569.html?city_id=1721
drogs; remix950; +2 Ответить
Остальные ответы
В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
2. AlexInqMetal 77 22.10.14 17:53 Сейчас в теме
(1) remix950, крышку корпуса пробовали закрывать?
remix950; +1 Ответить
3. remix950 9 23.10.14 02:43 Сейчас в теме
(2) AlexInqMetal, Температура стала 84С, заявленная должна быть 60С по тех документации
4. hogik 443 23.10.14 02:48 Сейчас в теме
(1)
Поддерживаю текст из (2) сообщения. ;-)
А ещё надо на эту плату дунуть сильно. Маловат радиатор...
Думаю, разработчик этой платы планировали несколько другое её положение относительно вентиляторов. Т.е. в корпусе с сильным продольным продувом. Рекомендую купить или сделать подобное устройство:
http://www.nix.ru/autocatalog/titan_coolers/TITAN_TTCSC03TZ_Universal_VGA_H­eat_Terminator_33_24004400_PCI_ISA_33569.html?city_id=1721
drogs; remix950; +2 Ответить
5. remix950 9 23.10.14 03:49 Сейчас в теме
(4) hogik, Точно, так и сделаю. Спасибо всем. Тема закрыта !
9. drogs 26.12.14 09:32 Сейчас в теме
(4) hogik, все верно. вентилятор по мощнее и вперед.
16. alex_sh2008 4 24.01.17 08:28 Сейчас в теме
(1)Пока сервер на гарантии и не запустили в работу вернуть поставщику, пусть голову ломает. Не должен контроллер грется так сильно
18. ewqewqewq 25.01.17 14:08 Сейчас в теме
(16)
Пока сервер на гарантии и не запустили в работу вернуть поставщику, пусть голову ломает. Не должен контроллер грется так сильно

Поздно. Это мой первый сервер. Поэтому много было доверия сборщику. Да и в эксплуатацию я его вводил не быстро.


20. alex_sh2008 4 25.01.17 14:57 Сейчас в теме
(18)Если в сервере не правильно смонтирована система охлаждения, то по мимо выхода из строя комплектующих, будет не стабильная работа самого сервера, особенно в жаркие дни и на максимальных нагрузках. У вас температура 90 это смахивает на бракованную плату. Ставьте продольное охлаждение с вентиляторами 10-11 тыс об/мин, может и справится.
21. ewqewqewq 25.01.17 17:07 Сейчас в теме
(20)
особенно в жаркие дни и на максимальных нагрузках
у меня редко максимальны загрузки. Сервер взят с запасом, по принципу бери пока дают. В целом не прогадал, если тогда бы не взял не было бы сервера еще лет пять)).
Я удерживаю температуру около критической сейчас 57 градусов. обдуваю его 120 низкооборотистым куллером.
22. alex_sh2008 4 25.01.17 18:58 Сейчас в теме
(21)Главное что бы ваш вентилятор не нагревал другие элементы, память, чипсеты на плате, жесткие диски.
23. ewqewqewq 25.01.17 20:37 Сейчас в теме
(22)
Главное что бы ваш вентилятор не нагревал другие элементы, память, чипсеты на плате, жесткие диски.


Вентилятор меняет потоки. На мой взгляд из за него идет подсос воздуха сзади. В частности пыли((.Но координатно он потоки не меняет так как процессоры и память закрыты крышкой)). Да и единственный кулер который стоит на центральной стойке и дует в сторону RAID не особо на мой взгляд до него не достает. А вот через проц и память протягивают 4 кулера. 2 сзади и 2 на центрально стойке. Установкой 2 х вытяжных кулеров сзади я не решу проблему окончательно ? Корпус
Корпус серверный SuperMicro CSE-745TQ-R800B 4U 8x3.5"SAS/SATA Bays, 2x800W
24. alex_sh2008 4 25.01.17 20:56 Сейчас в теме
(23) По этой ссылке https://www.supermicro.com/manuals/chassis/tower/SC745.pdf, документация на корпус, в нем предусмотрено 3 вентилятора которые обдувают как процессор с памятью, так и слоты, у вас такая же конфигурация?
27. ewqewqewq 26.01.17 12:04 Сейчас в теме
(24) Да такая + стоит Air Shroud тем самым поток в Air Shroud идет от двух вентиляторов на проц и память, а поток от самого нижнего идет уже без Air Shroud на плату контролера.

29. alex_sh2008 4 26.01.17 13:04 Сейчас в теме
(27)Остается либо вентиляторы (должны стоять 5000RPM) стоят слабые не обеспечивают нужный поток, либо контроллер бракованный. Нагрузите контроллер работой если начнет глючить, то в утиль, или замените нижний вентилятор на 10000RPM
30. ewqewqewq 26.01.17 16:41 Сейчас в теме
(29)
Остается либо вентиляторы (должны стоять 5000RPM) стоят слабые не обеспечивают нужный поток, либо контроллер бракованный. Нагрузите контроллер работой если начнет глючить, то в утиль, или замените нижний вентилятор на 10000RPM

Глюков при работе не обнаружено. Единственный глюк это зависание при загрузке(не всегда). И то не понятно вообще имеет ли вообще отношению к контролеру или все же к ОС и тд.

Единственная проблема это "циферки" температуры. Хотя я так понимаю эти "циферки" температуры могут вылиться проблемы в будущем.
31. alex_sh2008 4 26.01.17 18:12 Сейчас в теме
(30)
Единственная проблема это "циферки" температуры. Хотя я так понимаю эти "циферки" температуры могут вылиться проблемы в будущем.

Это большая проблема и зависание ОС при загрузке может быть связанно с этим, контроллер тормозит, и плохо определяется системой. Лучше не рисковать а вернуть контроллер поставщику или весь сервер для комплексной диагностики, не стоит рисковать
32. ewqewqewq 26.01.17 20:40 Сейчас в теме
(31) сервер уже боевой. Хоть по сути все в гипервизоре все ровно переносить не куда особо. ((
33. alex_sh2008 4 26.01.17 21:01 Сейчас в теме
(32) Тогда поддерживайте температуру у сервера около 20 градусов, и желательно замените вентилятор на более производительный. Летом если будет на улице жарко температура может достигнуть критической и контроллер будет выключатся. Также про мониторьте температуру в закрытом корпусе
34. ewqewqewq 27.01.17 02:23 Сейчас в теме
(33) У меня окружающая среда больше 26 градусов. ...А вот еще два вентилятора на выдув напротив ПСИ слотов запросил у производителя в декабре до сих пор динамит((. Говорит что все ок должно быть....они лишние.
В корпусе около 35-40 градусов.
35. alex_sh2008 4 27.01.17 11:18 Сейчас в теме
(34) Эти вентиляторы должны быть такие же как основной иначе, горячий воздух не будет выдуваться из корпуса.
В корпусе около 35-40 градусов.

При такой температуре контроллер греться должен 50-55, если больше то охлаждение не справляется
25. alex_sh2008 4 25.01.17 21:00 Сейчас в теме
(23)+ если такая же то проверьте куда направлен воздушный поток, может у вас поток идет не в сторону платы, а наоборот.
26. ansh15 25.01.17 21:32 Сейчас в теме
(23) Посмотрите еще режим работы самих вентиляторов в BIOS матплаты или через IPMI. Там же его можно и выставить, например, HeavyIO или Full, Ну да, будет гудеть довольно сильно.
28. ewqewqewq 26.01.17 12:14 Сейчас в теме
(26)
Посмотрите еще режим работы самих вентиляторов в BIOS матплаты или через IPMI. Там же его можно и выставить, например, HeavyIO или Full, Ну да, будет гудеть довольно сильно.

нет там стоит Fan to Optimal Speed. Опять же включение Full не понижает значительно температуру. Потому что проц и тд и так не греются, а когда идет нагрузка и греются сервер сам увеличивает обороты. (Заметно по шуму его загрузку) опять же 90 процентов времени сервер загружен на 10-15 процентов. И кулеры работают на мин режиме.
37. alex_sh2008 4 29.11.19 21:53 Сейчас в теме
(1)для таких контроллеров ставят вентиляторы на обдув, по крайне мере во всех стоечных корпусах есть такие вентиляторы, в десктопах может не ставят но места предусмотрены.
такая температура не критичная но если он на холостом ходу так греется то это плохо
6. landings 15.12.14 11:15 Сейчас в теме
такой нагрев явно говорит о проблемном железе контролера , поэтому нужно так или иначе решать вопрос с официалами, учитывая степень критичности данного узла, в боевом сервере я бы десять раз подумал прежде чем ставить
7. audion 22.12.14 17:43 Сейчас в теме
(6) landings, плата должна стоять вертикально, тогда никаких проблем с перегревон не возникает, если, конечно, грамотно организован продув внутри корпуса. А при расположении "радиатором вниз" плата нуждается в принудительной вентиляции. Мне в свое время попадалась подобная информация на сайте Intel, где обсуждался перегрев аналогичного контроллера.
У Adaptek, кстати, на держателе радиатора есть даже отверстия с резьбой М2,5 для установки вентилятора (кажется, 40х40), мы всегда их ставим в таких корпусах.
Железо не проблемное, тут проблема "мелкого шрифта в примечании к сноске".
8. wowkai 4 24.12.14 15:32 Сейчас в теме
у нас тоже сервера SuperMicro и бывает летом температура контролера Adaptec поднимается до 100 градусов. Температура не нормальная, но только когда уже более 110 идет warning в програме контролера. я думаю такая же ситуация с LSI. поставьте программу и если горячо она вам сама скажет.
10. ewqewqewq 11.01.17 19:23 Сейчас в теме
У меня такая же проблема. ужасный контроллер. Неужели нельзя сделать за такие деньги запас на охолождение? Поднимаю для того тему что бы поднять если холодные или хотя бы продуманные контроллеры ?
11. ansh15 11.01.17 19:42 Сейчас в теме
Еще рекомедуют поддержание температуры в серверных помещениях - https://habrahabr.ru/post/235245/
А то "дунуть на ужасный контроллер" воздухом 30-35 градусов(особенно летом) как-то совсем нехорошо...
А я парюсь по поводу того, что на одном из серверов батарейка LSI контроллера греется аж до 40 градусов, в то время как на других 28-32.
12. ewqewqewq 12.01.17 15:36 Сейчас в теме
(11)
в батарейка LSI контроллера греется аж до 40 градусов, в то время как на других 28-32.

у меня 28 градусов батарейка. В помещении значит 23-26. То есть, если она греется до 40 и в помещении не 35 градусов, то я опять же считаю значит батарейку не там расположили (в горячем месте) и тд.

Я понимаю, что есть требование, но эти требования к сожалению не могут выполнить 80 процентов компаний. Опять же десктопные системы работают же в таких условиях.Я не говорю про режимы 100 процентной загрузки, я говорю, что не должен контроллер в простое(при малой нагрузке) ночью так греется и это недоработка разработчика. Не один компонент в моем случае при этой нагрузке и температуре не перегревается кроме контролера. Или вы считаете, что производили другого железа неправильно сделали, что их оборудование может успешно работать и при немного повышеной температуре ?


Офтопик. Приезжаю в сервис на ВАЗ говорю, тут стучит. Ответ, а что ты хочешь это ваз, это его особенность что тут все стучит и тд. (Сделал в другом сервисе и все ок). Приезжаю в сервис на авто за 30 тыс баксов (1 000 000 млн до 2014 года) говорю авто почти новое а тут уже ..... говорят а что ты хочешь это особенность корейских ведер.... Опять же я скажу производителю у которого авто заведется в минус 30, а те тому кто мне напишет, что мы тут подумали и разрешаем эксплатировать наш автомобиль от -15 до +30 и все.....
14. ansh15 12.01.17 17:26 Сейчас в теме
Вот требования - http://ask.adaptec.com/app/answers/detail/a_id/15345/~/temperature-requirement-for-series-2,-5,-6,-7,-and-8-adaptec-raid-controllers.
и http://serverfault.com/questions/541816/lsi-megaraid-expected-chip-temperature (там ответ от LSI)
(12) Думаю, что Adaptec, LSI и производители контроллеров на основе чипов LSI(те же Intel или Supermicro) свои топовые контроллеры позиционируют не для десктопного применения. и для обеспечения долговременной устойчивой работы с заявленными характеристиками таких контроллеров требуются доп. условия по охлаждению.
https://www.google.ru/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0ahU­KEwjxoMOI3rzRAhWE1SwKHX64DqIQFggcMAA&url=https%3A%2F%2Fdocs.broadcom.com%2Fdocs%2F12348578&usg=AFQjCNF5EcKB70xXEbC7SQ2R1toa3vVp4w­ - графики зависимости температуры около чипсета от скорости обдува и и температуры входного воздушного потока.
13. ewqewqewq 12.01.17 15:44 Сейчас в теме
(11)
"дунуть на ужасный контроллер" воздухом 30-35 градусов(особенно летом) как-то совсем нехорошо...


Не спорю, что я сам не прав, нарушая рекомендации по температуре, но и производитель не прав производя оборудование которое в чуть не штатной ситуации перегревается.
У друга была серверная, так случилось, что кондей сломался, а второй не справлялся. температура резко возрастала и ему пришлось охолождать оборудование подручными средствами (напольный кондей). В итоге оборудование работало при повышено температуре 3 суток. Иными словами даже в серверной с кондеем, могут быть всякие нештатные ситуации.... а что говорит вот в новый год у хостера в дата центре был сбой на 5-8 часов((.

Как раз на нештатные ситуации хочется иметь определены запас для маневра.
15. ewqewqewq 23.01.17 17:43 Сейчас в теме
Я с вами согласен. Беда в том, что сборщик сервера было поставлено условия тихого сервера, работающего в помещении с людьми. В начально конфигурации не было раид, он был «навязан» сборщиком, что можно экономить на всем, но рейд поставь. Да и сервер это мой первый был.

Я конечно понимаю это нарушение, но скажем грузовик, который можно грузить до 20 тонн, а загрузив его до 21 тонны он развалился – я больше не куплю. ИМХО должен быть запас прочности, просто нужно понимать, что этим ты убиваешь технику.
2) телефон который нельзя ронять, но уронив с высоты 70 см и он разбился, я не куплю. Я понимаю, что все зависит от точки удара и тд. Пока говорим абстрактно взяли 3 телефона все одинаково уронили и выжило 2 из 3. Опять же производитель запрещает их ронять, но это доп. преимущество.
3) Купив 2 лампочки разных производителей и установив в одну люстру одна работает, другая перегорела. Опять я в будущем выберу более надежную и не важно, что обе проработали 1000 часов (ха ха), но одна проработала 1001 час, а вторая 1500 часов.
Но ваша позиция мне ясна, это проф. оборудование, значит любителю тут не место («любительским» условиям) и тут ставят минимум защит от дурака. Хотя бывает и наоборот, некоторые ручные приборы уровня проф, наоборот более живущие и им не почем падения, холод и тд.

Моя же позиция, такая что прибор дорогой (да и дешёвый если бы был тоже не дело, но более простительно) и должны быть продумано (хотя бы должен быть в продаже их куллер или радиатор усиленный, который нужно докупить если оборудование работает в сложных условиях ) все и многочисленные жалобы в интернете говорят о том, что они сделали сначала молоток, а потом сказали, что им нельзя бить с силой больше N. Об этом свидетельствует так же что даже сборщик серверов, зная сложные условия и получил полный зеленый свет на кол-во кулеров не смог собрать, так что бы устройство не перегревалось ((.




17. ansh15 24.01.17 20:25 Сейчас в теме
(15) http://forum.ixbt.com/topic.cgi?id=66:7088
Это давняя тема.
Для сервера в "офисе с людьми" надо что-то попроще.
19. ewqewqewq 25.01.17 14:09 Сейчас в теме
(17)Это мой первый сервер. Поэтому сборщику доверился и поставил задачу. Но в целом термимо.
36. Alexdirty 28.11.19 17:03 Сейчас в теме
Не переживайте так если Вы ещё далеки от 115С.

Чип LSISAS2208 Dual- core 6Gb/s ROC допускает температуру 115С самого чипа, и 60С окружающей среды. Особого повода для беспокойства нет если Вы ещё далеки от 115С.
Оставьте свое сообщение
Вакансии
1С аналитик
Москва
зарплата от 210 000 руб.
Полный день

Руководитель направления 1С
Москва
зарплата от 350 000 руб.
Полный день

1С Программист
Москва
зарплата от 180 000 руб.
Полный день

Программист 1С
Москва
зарплата от 180 000 руб. до 220 000 руб.
Полный день

Аналитик 1С / Бизнес-аналитик
Нижний Новгород
зарплата от 100 000 руб. до 250 000 руб.
Временный (на проект)