Столкнулся с проблемой перегрузки процессора по ЦП:
Поставили СВ 8.0.15
1С:Предприятие 8.3 (8.3.17.1549)
На днях СВ стал жрать 2 процессами по 25% как итог сервер захлебывается и не дает работать в 1С.
В это время стояла джава не последняя и вылетело сообщение об ошибке.
Обновили джаву и проблема якобы ушла.
Сегодня такого нет, пользователь запустил групповую обработку и снова загрузка ЦП.
Кто сталкивался с этим, как лечили?
В 1С, чтобы отписать по проблеме нужно покупать СВ, пока не купили, есть другой способ им отписать?
Дополнительно по ИТС обратились к своему партнеру.
Похоже нашли в чем возможно была проблема.
Для работы системы взаимодействия на компьютере необходимо наличие следующих программных продуктов:
● Oracle Java 8 (64-разрядная) – версия 1.8.
Скачать Java: https://www.java.com/ru/download/.
В мануале на ИС сначала стоит JRE. А затем JDK.
Админ в конфигах и прописал пути к JDK.
У другого клиента jdk вообще не стояла и там проблемы нет.
Админ переписал в конфигах пути с JDK на JRE и по идее проблема ушла.
(15) пришел ответ от 1С.
Сказали что нет проблемы с СВ. Есть проблема с кластером 1С.
2. Нужно изменить параметры pingperiod/pingtimeout, установите 5000/25000 соответственно.
Изменить параметры pingperiod/pingtimeout можно так: https://wonderland.v8.1c.ru/blog/mekhanizm-otslezhivaniya-tselostnosti-setevykh-soedineniy/ "Для соединений внутри кластера значения периода проверки и таймаута вы можете задать с помощью параметров командной строки pingPeriod, и pingTimeout. Эти параметры можно использовать при запуске агента сервера как службы, «демона», или как приложения."
То есть в строку запуска Агента нужно дописать параметры pingperiod и pingtimeout, после чего перезапустить Агент.
Пример:
"C:\Program Files\1cv8\8.3.15.1489\bin\ragent.exe" -srvc -agent -regport 1541 -port 1540 -range 1560:1591 -d "C:\Program Files\1cv8\srvinfo" -pingPeriod 5000 -pingTimeout 25000
3. Необходимо остановить службу Агента на сервере 1С, Далее открыть папку "C:\Program Files\1cv8\srvinfo\reg_1541" и зайти в каждую папку с GUID-ом, кроме "snccntx_xxx". В них будет подпапка "1Cv8FTxt". Заходите в неё и удалите её содержимое. После чего запустите Агент 1С и выполните (или дождитесь выполнения) регламентное задание "Обновление индекса ППД" для каждой рабочей ИБ.
Можно и через предприятие ручками в нужных базах очистить.
4. В настройках кластера установите галочку "Принудительно завершать проблемные процессы" и укажите значение в 120 сек
Как я понял 1С теряет связь с миром и наступают тяжелые времена.
Выход терпеть(возможно с этими настройками это можно будет делать) или обновлять железо.
Похоже нашли в чем возможно была проблема.
Для работы системы взаимодействия на компьютере необходимо наличие следующих программных продуктов:
● Oracle Java 8 (64-разрядная) – версия 1.8.
Скачать Java: https://www.java.com/ru/download/.
В мануале на ИС сначала стоит JRE. А затем JDK.
Админ в конфигах и прописал пути к JDK.
У другого клиента jdk вообще не стояла и там проблемы нет.
Админ переписал в конфигах пути с JDK на JRE и по идее проблема ушла.
(4) JDK отличается от JRE той же версии и поставщика только наличием дополнительных утилит и файлов, необходимых/полезных разработчику. Из самого банального - наличием компилятора.
(5) ну очевидно, не только. Иначе почему JRE работает без сбоев, а с JDK проблемы.
Или так написан код СВ, что в некоторых местах из-за путаницы начинается мешанина.
(6) Либо они таки разные (версии или еще что), либо просто перезапуск полечил. Возможно, временно.
Если вы качаете из одного места JDK и JRE одного "выпуска", то виртуальная машина в них (java.exe плюс библиотеки) должна быть одинаковая. JRE - это "голая" виртуальная машина, минимум что необходимо для исполнения java-программ (R - runtime). А JDK просто дополнительно включает еще инструментарий и доп-материалы для их создания (D - Development).
(12) в логах (C:\ProgramData\1C\1CE\instances\cs\logs):
2020/10/12-09:48:15.153-0,JAVA,0,level=ERROR,pid=13572,threadId=153,thread=nioEventLoopGroup-3-6,logger=com._1c.ecs.internal.websocket.server.b.a,message=An existing connection was forcibly closed by the remote host,exception=java.io.IOException: An existing connection was forcibly closed by the remote host
И потом каждую минуту эту ошибку било.
Потом перезагрузили сервер и стало работать стабильно.
(13) заметили еще 1 баг, в 1С запустили тяжелый запрос и клиент отвалился. В этот момент СВ стал жрать проц.
Вылечил снова перезагрузкой, тяжелый запрос не вызывал.
(14) сценарий воспроизведения простой. Пользователь на своем ПК запустил тонкий клиент сеть 100 мб. Открывает настройку "способов поддержания запасов" через склад и 1С ложится. СВ начинает жрать проц. В этой ситуации проблема со службой hazelcast, логи: C:\ProgramData\1C\1CE\instances\hazelcast\logs
(15) пришел ответ от 1С.
Сказали что нет проблемы с СВ. Есть проблема с кластером 1С.
2. Нужно изменить параметры pingperiod/pingtimeout, установите 5000/25000 соответственно.
Изменить параметры pingperiod/pingtimeout можно так: https://wonderland.v8.1c.ru/blog/mekhanizm-otslezhivaniya-tselostnosti-setevykh-soedineniy/ "Для соединений внутри кластера значения периода проверки и таймаута вы можете задать с помощью параметров командной строки pingPeriod, и pingTimeout. Эти параметры можно использовать при запуске агента сервера как службы, «демона», или как приложения."
То есть в строку запуска Агента нужно дописать параметры pingperiod и pingtimeout, после чего перезапустить Агент.
Пример:
"C:\Program Files\1cv8\8.3.15.1489\bin\ragent.exe" -srvc -agent -regport 1541 -port 1540 -range 1560:1591 -d "C:\Program Files\1cv8\srvinfo" -pingPeriod 5000 -pingTimeout 25000
3. Необходимо остановить службу Агента на сервере 1С, Далее открыть папку "C:\Program Files\1cv8\srvinfo\reg_1541" и зайти в каждую папку с GUID-ом, кроме "snccntx_xxx". В них будет подпапка "1Cv8FTxt". Заходите в неё и удалите её содержимое. После чего запустите Агент 1С и выполните (или дождитесь выполнения) регламентное задание "Обновление индекса ППД" для каждой рабочей ИБ.
Можно и через предприятие ручками в нужных базах очистить.
4. В настройках кластера установите галочку "Принудительно завершать проблемные процессы" и укажите значение в 120 сек
Как я понял 1С теряет связь с миром и наступают тяжелые времена.
Выход терпеть(возможно с этими настройками это можно будет делать) или обновлять железо.
(16) рекомендация помогла частично.
Служба 1ce-hazelcast не грузит процессор, но стала грузить служба 1ce-cs.
1С попросила снять дампы, чтобы выявить проблему.
(16) Увеличение таймаутов - это замазывание проблемы с производительностью, а не "проблема с кластером 1С". Плюс чистка индекса полнотекстового поиска. То есть это больше стучание по шинам.
СВ и халакаст стал кушать по 25 процентов после повторения описанного сценария. Но пользователя 1С не выкинуло.
Фризы на РДП были частые, 1 раз более 5 секунд.
У админа просить права на процесс или с чем связано отказ в доступе? Консоль не под администратором запустил?
(21) ага админ там подшаманил. Но все равно ошибку получал.
До этого консоль с правами админа не запускал.
Возможно настроек от админа не требовалось, запустил консоль как администратор:
Вариант развертывания сервера взаимодействия на одном компьютере в первую очередь ознакомительный.
Полнотекстовый поиск 1С сам по себе довольно тяжелый, так еще и запускается полнотекстовый поиск по объектам системы взаимодействия.
По рекомендациям Elasticsearch Inc. их продукт желательно разворачивать на отдельном сервере, отдавать RAM 50/50 Elasticsearch и Lucene (который у эластика под капотом), увеличивать число файловых дескрипторов. Попробуйте развернуть Elasticsearch отдельно и скажите, повторяется ли проблема? Если нет возможности выделить отдельные серверы под сервер взаимодействия, то попробуйте задать для Elasticsearch параметры -Xms, -Xmx.
По вопросам администрирования Elasticsearch необходимо обратиться к документации продукта https://www.elastic.co/elasticsearch/
В общем симптомы остались, рекомендовал либо пики нагрузок убирать, либо новый сервер.
Ну вариант с переходом в облако еще остается.