Zabbix: Мониторинг состояния сервера 1С

0. deevil deevil (deevil) 118 02.09.16 13:37 Сейчас в теме
Скрещиваем мощную систему мониторинга Zabbix с 1С

Перейти к публикации

Комментарии
1. Павел Колабухов (kolabaister) 1 02.09.16 23:24 Сейчас в теме
Спасибо огромное! Как раз задался этим вопросом и стал изобретать велосипед.
user616071_rinat_m83; olesha; deevil; +3 Ответить
2. deevil deevil (deevil) 118 04.09.16 17:08 Сейчас в теме
(1) kolabaister, буду рад если Вам пригодится.
Также если что-то не учел или будут предложения по улучшению - с радостью рассмотрю.
3. ValeriTim (ValeriTim) 20 05.09.16 09:59 Сейчас в теме
Отлично! Ты подал мне идею!
Долго мучился со своей проблемой ... но вот же ... идея :)
user616071_rinat_m83; deevil; +2 Ответить
4. deevil deevil (deevil) 118 05.09.16 13:41 Сейчас в теме
(3) ValeriTim, отлично)

Как решите - напишите итог.
Думаю будет интересно...
5. Евгений Бессонов (_evgen_b) 2 06.09.16 06:44 Сейчас в теме
Вот так совпадение.
Видимо во вселенной накопилась критическая масса :-)
https://github.com/bessonovevgen/srv-1c-linux-zabbix-template

Только я сделал с помощью консольных утилит администрирования сервера приложений 1с.


user616071_rinat_m83; headMade; Upiterus; artbear; deevil; +5 Ответить
6. deevil deevil (deevil) 118 06.09.16 12:36 Сейчас в теме
(5) _evgen_b, тоже отличный вариант)

Я думал насчет rac/ras, но честно говоря изначально все делалось ради самого первого показателя в списке "srv1c.avaible"
В общем я несколько раз сталкивался с тем что служба 1с работает, консоль тоже, но при этом 1с не работает.
Обычно это было из-за того что диск на котором хранятся темп файлы 1с и сессии иногда вылетает.
При этом вроде все норм, а по факту 1с не работает.
Поэтому мысль была в том чтобы изнутри продакшн базы сообщать забиксу что все норм.

Причем изначально я думал из 1с записывать в файл с временем и забикс агентом его читать.
Это самая распространенная схема при сложных аналитиках, чтобы таймауты агента не завышать.
Но когда наткнулся на трапер - мне показалось идеальным вариантом для такого мониторинга...

ИМХО каждый вариант имеет право на жизнь)))
7. Юрий Дешин (blackhole321) 494 06.09.16 12:52 Сейчас в теме
(6) Может быть в этом случае более правильно организовать мониторинг свободного пространства на диске и сообщить администратору, когда оно уменьшится до критического значения?
8. deevil deevil (deevil) 118 06.09.16 13:15 Сейчас в теме
(7) blackhole321, не совсем так.
в тех конкретных ситуациях просто диск отваливался.

но мысль несколько иная - мониторить не только и не столько состояние железа и служб, а максимально близко к пользователю.
ближе регламентного в продакшн базе я не вижу.

а диск итак уже мониторится))) причем тоже забиксом)))
9. Юрий Дешин (blackhole321) 494 06.09.16 14:03 Сейчас в теме
(8) Что будет происходить, если регламентное задание по каким либо причинам перестанет выполняться? Будет какой-то алерт?
10. deevil deevil (deevil) 118 06.09.16 14:12 Сейчас в теме
(9) blackhole321, да в забиксе тригер на то что в течении 2х минут 1с не говорила что с ней все норм...

Вообще изначально у меня был только он. остальное я потихоньку добавил. плюс еще пару метрик на конкретные базы, которые я не стал сюда писать.
11. Артур Аюханов (artbear) 921 07.09.16 11:26 Сейчас в теме
(0) Молодец, спасибо!
Хорошо бы еще какие-нибудь картинки приложить, аналогичные картинкам из srv-1c-linux-zabbix-template
13. deevil deevil (deevil) 118 07.09.16 13:03 Сейчас в теме
(11) artbear, Вам спасибо. Попробую с рабочего приложить. Но они не будут такими красочными)))

(12) Sergey.Noskov, хм.
Давай обсудим как их получить.
У меня просто все крутится на постгри и с блокировками давно не сталкивался (в основном бывает блокировка документа сеансом, но там человеческий фактор).
Подскажи как их получать или в какую сторону копать)))
14. deevil deevil (deevil) 118 07.09.16 15:07 Сейчас в теме
(11) artbear, добавил 2 графика из шаблона (у меня они правда чуть другие, но в целом картину думаю отражают)

Попутно перечитав возможности https://github.com/bessonovevgen/srv-1c-linux-zabbix-template подумал может стоит отделить пользователей от фоновых сеансов.
И еще может сделать отдельные счетчики для каждой ИБ.
19. Евгений Бессонов (_evgen_b) 2 29.10.16 09:30 Сейчас в теме
(14) тут думаю нужно копать в сторону автообнаружения и уже потом счетчики на обнаруженные базы.
12. Сергей Носков (Sergey.Noskov) 824 07.09.16 12:55 Сейчас в теме
(0), Еще полезно видеть количество и суммарное время ожидания на управляемых блокировок.
15. deevil deevil (deevil) 118 07.09.16 18:52 Сейчас в теме
(12) Sergey.Noskov, полистав Гилева http://www.gilev.ru/setupdeadlock/ и http://www.gilev.ru/deadlock/, я так понял для такого анализа лучше всего подходит тех. журнал и подключение к MSSQL.

Не уверен что смогу тягаться с инструментами Гилева)))
А если серьезно - наверное можно будет прикрутить, но без аналитики о причине думаю это не будет особо ценной информацией.
А подобную аналитику заносить в забикс думаю несколько неправильно...

Хотя если будут конкретные предложения и кейсы - можно попробовать что-то собрать)
16. Сергей Носков (Sergey.Noskov) 824 12.10.16 14:49 Сейчас в теме
(15) извиняюсь за длительное молчание
Обычно любые данные мониторинга не нужны, пока не сталкиваешься с какой либо проблемой. Думаю желание мониторить конкретно эти параметры, описанные в статье, родилось не просто так;)
Да, график блокировок сам по себе проблему не решает (как, впрочем, и любой другой график), но может подсказать куда копать. У нас в Zabbix выводится и число упр. блокировок и APDEX. Вывести блокировки достаточно просто - по свойству сеанса blockedByLS. Потребуется или нет - никто наперед не скажет, но чем выше требования к работоспособности базы, тем больше параметров необходимо логировать.
18. deevil deevil (deevil) 118 12.10.16 21:43 Сейчас в теме
(16) Sergey.Noskov, ок. Попробую посмотреть и протестировать - после этого обновлю статью и шаблон.
Просто есть такой момент, что блокировка длиться 5-10 секунд. Но не минутами - по крайней мере насколько я понимаю.
И вопрос в том, что даст если мы раз в минуту будем получать эти цифры.
В моем понимании отслеживание блокировок эффективно отслеживать по ТЖ или статистикам БД, там можно аналитику строить и все такое...

(17) SuhoffGV, как раз первая проверка для этого и существует.
Если сеансы не могут запуститься, то и фоновое задание не запуститься и как следствие 1С не скажет забиксу, что работает.
А тригер настроен на то, что 1с отвечает раз в 2-3 минуты.

Есть конечно вероятность что в вашем случае фоновые задания будут запускаться, но если нет рабочих процессов, то не должно...
17. Дмитрий К (SuhoffGV) 12.10.16 17:06 Сейчас в теме
deevil, А будет ли данный способ работать при отвале всех рабочих процессов в 1с? У меня на 8.2 иногда возникают ситуации когда сервер запущен, но клиенты не могут запуститься с сообщением "Не запущен ни один рабочий процесс. Соединение с информационной базой невозможно".
20. Yauhen Makei (mrDSide) 102 01.12.16 17:09 Сейчас в теме
Возможно будет полезно/интересно - PowerShell
21. Владимир Натров (user827387) 14.09.17 12:25 Сейчас в теме
Подскажите, пожалуйста, как можно скачать файл шаблона, предложенного в статье? Если считаете это возможным.
Есть вероятность, что не подойдёт для желаемого, но глянуть - хотелось бы, а только из-за этого платить 1500 - несколько дороговато,по моему.
Спасибо за любой ответ.
22. Саныч Байкович (user861096) 13.11.17 02:53 Сейчас в теме
аналогично. проблема тоже висит для 1С мониторинга. но в сети информации очень мало. нашел одну тему на хабре, но вот шаблон там кривой, забикс ругается что много ошибок. я исправил парочку ошибок, но они все не кончаются. может каму и пригодится мой полукривой исправленый шаблон. взят с сайта Хабрахабр.
Прикрепленные файлы:
1c.xml
Оставьте свое сообщение