0. SeiOkami 755 06.06.19 10:51 Сейчас в теме

Чем расщепить или "СтрРазделить() VS РазложитьСтрокуВМассивПодстрок()" ?

Сравнение методов по "расщеплению" строк
Какой и когда использовать? Платформенный или БСП?
Приходим к выводу - и тот и другой.

Перейти к публикации

Комментарии
Избранное Подписка Сортировка: Древо
1. A_Max 16 06.06.19 18:08 Сейчас в теме
Хороший разбор нюансиков.
ram8291; Бубузяка; +2 Ответить
2. MikhailDr 07.06.19 07:58 Сейчас в теме
Классная статья, спасибо
3. EliasShy 47 07.06.19 08:58 Сейчас в теме
Интересно было бы по производительности и потреблению памяти на больших объемах
Yashazz; PLAstic; +2 Ответить
4. Dmitryiv 120 07.06.19 09:43 Сейчас в теме
Вместо того, чтобы реализовать в платформе поддержку регулярных выражений занимаются велосипедостроением.
A_Max; Yashazz; sashocq; Shmell; nikita0832; Поручик; DitriX; +7 Ответить
5. Поручик 4267 07.06.19 11:03 Сейчас в теме
Сам обжёгся как-то. Не посмотрел как следует, потом срочно обновлял конфы на пяти серверах. К счастью, без последствий.
6. DitriX 1645 07.06.19 11:58 Сейчас в теме
тут стоит отметить, что СтрРазделить - работает оптимально при количестве строк не более 1000-2000, если больше - то дешевле вначале разделить их на массивы, а потом уже вызвать разделение как надо и объединять,ибо скорость падает экспоненциально.
Yashazz; for_sale; SeiOkami; +3 Ответить
7. SeiOkami 755 07.06.19 12:29 Сейчас в теме
(6)
если больше - то дешевле вначале разделить их на массивы

интересно, так не пробовали. Надо будет провести эксперимент и, возможно, доработать обёртку с учётом этого
8. vasilev2015 1000 07.06.19 13:53 Сейчас в теме
Есть очень простой прием, чтобы получить подстроки из строки с разделителями.

Замените разделитель на Символы.ВК (или Символы.ПС - извините, пишу по памяти)

Результат - многострочная строка, к каждой подстроке можно обращаться по номеру, метод СтрПолучитьСтроку.

БСП рулит.
WellMaster; Yashazz; Rego1337h; madonov; Поручик; +5 Ответить
10. SeiOkami 755 07.06.19 14:59 Сейчас в теме
(8) проблема будет, когда в тексте уже есть этот специальный символ.
for_sale; +1 Ответить
23. madonov 153 10.06.19 08:28 Сейчас в теме
Что мешает использовать не один специальный символ, а их последовательность, которую никогда не встретишь в реальном тексте?

//Меняем перенос строки на редкую последовательность символов, которая никогда не встретится в реальном тексте
НачальнаяСтрока = СтрЗаменить(НачальнаяСтрока, Символы.ПС, "~#!#!#~");

//Меняем строку разделитель на перенос строки
МногоСтрочнаяСтрока = СтрЗаменить(НачальнаяСтрока, Разделитель, Символы.ПС);

//Обходим многострочную строку
Для СчетчикСтрок = 1 По СтрЧислоСтрок(МногоСтрочнаяСтрока) Цикл
	
	Стр = СтрПолучитьСтроку(МногоСтрочнаяСтрока, СчетчикСтрок);
	
	//Меняем последовательность символов обратно на пернос строки
	Стр = СтрЗаменить(Стр , "~#!#!#~", Символы.ПС);
	
	Сообщить(Стр);
	
КонецЦикла;
Показать
9. uno-c 42 07.06.19 14:57 Сейчас в теме
РазложитьСтрокуВМассивПодстрок() уйдёт в небытие...
Что будет? зациклится?
11. starik-2005 1852 07.06.19 22:07 Сейчас в теме
Массиф = СтрРазделить(СтрЗаменить(ИсходнаяСтрока, Разделитель, "|"), "|")
Это на тему как бороться с неодинаковостью. С пустыми строками все вообще плывет, поэтому или они тебе нужны, или нет - ты должен это сразу понимать. Юзать БСПшный механизм бессмысленно совершенно.
12. SeiOkami 755 07.06.19 22:21 Сейчас в теме
(11) это не выход. Что будет, если в строке изначально был символ "|" ?
13. starik-2005 1852 07.06.19 23:26 Сейчас в теме
(12)
изначально был симво
Так тыжпрограммист - должен знать, что у тебя в строчке будет, а что - нет. Так у тебя в строчке может и разделитель вдруг потребоваться, а он заменой символов выпилится )))

ЗЫ: но это все фигня. Я как-то давненько на С++ написал прогу для чтения паспортов недействительных (120кк штук). При компиляции без оптимизации они читались минуты полторы на FX8320 (3500MHz), а с оптимизацией - за 16 сек вроде бы. И что-то я забыл про эту прогу. А сегодня скачал компилятор оптимизирующий от АМД, в итоге прогнал вообще без оптимизации на Ryzen 1600 (3200MHz) - 29 сек, т.е. раза этак в два с лишним быстрее 8320-го. Ну, думаю, давай-ка заоптимайзю с -march=native и О3 - в итоге 8 сек. Круть, думаю, давай-ка -flto - 7.5 сек. Ну, думаю, совсем круто - буду собирать постгрес, но решил посмотреть что и в обычном g++-7 - оказалось, что ровно то же. Потом поглядел в пакетах, а там g++-8 уже. Поставил его и на нем со всей этой оптимизацией - в итоге 6.9 сек. А странно то, что у коллеги на i9-9900K медленнее работает, хотя операция однопоточная.

А Вы мне тут про СтрРазделить )))
14. SeiOkami 755 08.06.19 05:31 Сейчас в теме
(13) ну вот и получается, что это очередной метод с "нюансом", который нужно помнить и обрабатывать. И когда в строке окажется символ "|", нужно будет либо перебирать другие возможные символы для замены и проверять их наличие в строке, либо, в конце концов, просто применить универсальный механизм БСП.
15. starik-2005 1852 08.06.19 12:55 Сейчас в теме
(14) так на то ты и программист. Не нравится палка - замени на решетку, доллар, амперсанд, собаку, какой-нить непечатаемый символ и т.д. Использовать БСП-шный механизм резона нет никакого совершенно.

ЗЫ: из реального мира пример - замена кучи всяких символов, включая ограничители тегов, в XML на "&хххх;". Ну и всяческие извращения при вставке кавычек в строку. Кто-то \" пишет, кто-то "".
16. SeiOkami 755 08.06.19 12:58 Сейчас в теме
(15) так и как мне поступить, если мне нужно разобрать любой текст разделителем из единой строки?
Пока нет альтернативы, используем БСП. В этом и резон.
17. starik-2005 1852 08.06.19 13:00 Сейчас в теме
(16)
так и как мне поступить, если мне нужно разобрать любой текст
1. Ограничить ввод, т.е. определить правила для входящего потока.
2. Проверять перед разделением на наличие включений решеток и иных символов.
3. Не ставить задачи разобрать любой текст - учитесь у создателей XML и всех его подвидов - они просто запилили стандарт.
19. SeiOkami 755 08.06.19 13:08 Сейчас в теме
(17)разговор ни о чём. У платформы есть универсальный механизм. У БСП есть универсальный механизм. Каждый применяется в своём время/месте. Если Вам в задаче не нужен универсальный механизм, а нужен свой - применяйте. Но глупо говорить, что универсальный механизм не нужен вовсе. Всему своё место и время.
20. starik-2005 1852 08.06.19 13:10 Сейчас в теме
(19)
Каждый применяется в своём время/месте.
Если Ваш алгоритм плох - да. Если он хорош - достаточно механизмов платформы. Но Вы всегда можете привести конкретный пример (не в общем и целом, а вот очень конкретно с данными), где нужна именно БСП-шная функция.
18. starik-2005 1852 08.06.19 13:06 Сейчас в теме
(16) кстати, вот у Вас там есть какой-то конструктор ВПФ, а в нем я какой-то запросник увидел на картинке. Как Вы анализируете запрос, например, на наличие временных таблиц, подзапросов и прочего? Да, можно юзать схему запроса - там все есть, но с большой конфигурацией она работает долго. Быстрее получается разделить запрос на строки и в цикле проанализировать его, найти в нем все начала строк, комментарии, отсечь их, и уже потом в запросе без строковых констант и комментариев производить анализ. И исходя из задачи при анализе в данном случае совершенно любого текста запроса нам БСП-шная функция понадобится, как Вы думаете?
21. Бубузяка 62 09.06.19 11:53 Сейчас в теме
Достойное исследование. Автору респект. У самого в конфигурации есть костылик ....
Функция РазобратьСтрокуСРазделителями(ИсходнаяСтрока, Разделитель = ",") Экспорт
	
	РезМассив = Новый Массив;
	
	// Разделитель бывает длиной строки > 1, учитывая особенность "СтрЗаменить",
	// заменим его на редкий односимвольный разделитель (смайлик) Символ(9786).
	Сепаратор = Символ(9786);
	Образец   = СтрЗаменить(ИсходнаяСтрока, Разделитель, Сепаратор);
	РезМассив = СтрРазделить(Образец, Сепаратор, Ложь);
		
	Возврат РезМассив;
	
КонецФункции
Показать
22. for_sale 705 09.06.19 19:27 Сейчас в теме
Да, есть такая гадость.
1С как всегда в своём репертуаре - вместо того, чтобы реализовать нормальную нужную функцию, под её видом реализуют неведомую фигню. Интересно, кто-то когда-то вообще сталкивался с чем-то, что решается вот этой вот стандартной 1Совской хренью? Я даже навскидку придумать не могу, нахрена она вообще нужна.
24. borodatii 2 10.06.19 08:35 Сейчас в теме
Было бы здорово, если бы какой-нибудь из методов ещё научился понимать, что текст внутри кавычек не нужно разделять, несмотря на наличие разделителя внутри.
starik-2005; SeiOkami; Perfolenta; +3 Ответить
26. SeiOkami 755 10.06.19 09:20 Сейчас в теме
(24) очень было бы полезно. Каждый раз приходится изобретать свой дикий велосипед для подобных задач
25. SeiOkami 755 10.06.19 09:18 Сейчас в теме
Объявляем сбор всех вариантов алгоритма по расщеплению. После этого проведём анализ, соберём "обёртку" со всеми алгоритмами и проведём "нагрузочное" тестирование 🤘
27. vec435 15 10.06.19 09:52 Сейчас в теме
28. Vlan 11 10.06.19 15:41 Сейчас в теме
Я за РазложитьСтрокуВМассивПодстрок() с ее предсказуемым результатом. Не пользовался встроенной функцией, сам не знаю почему, на интуитивном уровне. Теперь картина прояснилась. Автору спасибо.
29. Yashazz 2370 10.06.19 16:02 Сейчас в теме
Давно собирался раскопать эти нюансы, автору спасибо. Да, платформа "молодец", но и БСП я бы не доверял. Обычно юзаю вариант с Символы.ПС и СтрПолучитьСтроку, а перед этим экранирую исходные ПС, но наиболее люто плюсую мысли о регулярках, которых нет (зато есть видеозвонки, ага ага).
30. for_sale 705 11.06.19 12:09 Сейчас в теме
(29)
(зато есть видеозвонки, ага ага)

Интересно, а видеозвонками и этими чатами их вообще кто-нибудь пользуется? По количеству никому не нужных изобретений 1С скоро сравняется в виндавсом))
31. dmalyshev 22 13.06.19 10:16 Сейчас в теме
Если вы знаете как работает функция - то и результат можешь предсказать. и не нужно писать аналитическую статью.
Поэтому замена строки разделителя на символ и использование СтрРазложить - интуитивно понятно и просто даже без статьи.
Не нужно искать универсальных функций на все случаи жизни. Вы же программисты. Чего нет - всегда можно самому написать. Как пример - функция РазложитьСтрокуВМассивПодстрок() - посадили разработчики БСП студента Васю, и он написал такую функцию. Чем вы хуже?

.
32. starik-2005 1852 13.06.19 14:12 Сейчас в теме
(31)
посадили разработчики БСП студента Васю, и он написал такую функцию.
Ну может и не студент написал эту функцию. А нужна она была т.к. в платформе раньше "СтрРазделить" не было вообще. А добрым 1С-никам давно пора бы сделать разложение с регулярками, вот тогда заживем! ))) Хотя... Есть у меня на эту тему одна мысль относительно 14-й платформы.
33. dmalyshev 22 13.06.19 18:31 Сейчас в теме
(32) Согласен что не было. Все же меняется. Будьте гибче.
Оставьте свое сообщение
Новые вопросы с вознаграждением
Автор темы объявил вознаграждение за найденный ответ, его получит тот, кто первый поможет автору.

Вакансии

Программист 1С
Бобров
зарплата от 100 000 руб. до 150 000 руб.
Временный (на проект)

Студент (стажер) 1С
Нижний Новгород
зарплата от 25 000 руб.
Полный день

Программист 1С
Санкт-Петербург
зарплата от 120 000 руб.
Полный день

Программист 1С
Нижний Новгород
зарплата до 100 000 руб.
Полный день

Программист 1С
Новосибирск
зарплата от 80 000 руб.
Полный день