Нечеткий поиск одним запросом

02.04.16

Разработка - Запросы

Использование механизма полнотекстового поиска в 1С не всегда оправдано, т.к. построение индекса и поддержание его в актуальном состоянии может значительно нагружать систему. Предлагаемая реализация нечеткого поиска методом N-грамм выполняется одним запросом, что позволяет производить поиск в любой таблице и не требует предварительного построения индекса.

Скачать исходный код

Наименование Файл Версия Размер
Нечеткий поиск данных под УФ
.epf 8,65Kb
76
.epf 1.02 8,65Kb 76 Скачать
Нечеткий поиск файлов под УФ
.epf 9,28Kb
4
.epf 9,28Kb 4 Скачать
Нечеткий поиск метаданных ОФ+УФ
.epf 13,09Kb
20
.epf 13,09Kb 20 Скачать

СтрокаПоиска разбивается на подстроки длиной 3 символа. Вхождение каждой из подстрок проверяется в запросе оператором ПОДОБНО.

СтрокаПоиска = Лев(СтрокаПоиска, 300);
ДлинаСтроки = СтрДлина(СтрокаПоиска);

Если НЕ ДлинаСтроки > 2 Тогда
	Возврат;	
КонецЕсли;

ТекстПоиск = "0";
Для Индекс = 1 По ДлинаСтроки - 2 Цикл
	ТекстПоиск = ТекстПоиск + " + ВЫБОР КОГДА ИсточникДанных." + ИмяРеквизит + " ПОДОБНО ""%" + Сред(СтрокаПоиска, Индекс, 3) + "%"" ТОГДА 1 ИНАЧЕ 0 КОНЕЦ";	
КонецЦикла;

Нечеткость будет определяться как отношение количества найденных к общему количеству подстрок. Если найденная строка оказывается длиннее чем поисковая, то берется отношение к общему количеству подстрок в найденной строке.

ТекстРанг = "ВЫБОР КОГДА ПОДСТРОКА(ИсточникДанных." + ИмяРеквизит + ", " + (ДлинаСтроки + 1) + ", 3) = """" ТОГДА " + ДлинаСтроки + " ИНАЧЕ " + ТекстДерево + " КОНЕЦ";

Для определения длины найденной строки используется способ, описанный здесь.

Запрос.Текст = "
	|ВЫБРАТЬ ПЕРВЫЕ 20
	|	ИсточникДанных.Ссылка КАК Ссылка,
	|	ИсточникДанных." + ИмяРеквизит + " КАК Реквизит,
	|	100*(" + ТекстПоиск + ")/(" + ТекстРанг + " - 2) КАК Ранг
	|ИЗ " + ИмяИсточникДанных + " КАК ИсточникДанных
	|
	|УПОРЯДОЧИТЬ ПО
	|	Ранг УБЫВ";	

Вот и все. Такой запрос обрабатывает порядка 7000 строк в секунду в файловом варианте. Скорость выполнения запроса в SQL версии будет значительно ниже, чем в файловой. Эта проблема решается оптимизацией запроса. Делитесь своими достижениями.

Запрос Поиск

См. также

Infostart Toolkit: Инструменты разработчика 1С 8.3 на управляемых формах

Инструментарий разработчика Роли и права Запросы СКД Платформа 1С v8.3 Управляемые формы Запросы Система компоновки данных Конфигурации 1cv8 Платные (руб)

Набор инструментов программиста и специалиста 1С для всех конфигураций на управляемых формах. В состав входят инструменты: Консоль запросов, Консоль СКД, Консоль кода, Редактор объекта, Анализ прав доступа, Метаданные, Поиск ссылок, Сравнение объектов, Все функции, Подписки на события и др. Редактор запросов и кода с раскраской и контекстной подсказкой. Доработанный конструктор запросов тонкого клиента. Продукт хорошо оптимизирован и обладает самым широким функционалом среди всех инструментов, представленных на рынке.

10000 руб.

02.09.2020    124637    681    389    

732

Пропорциональное распределение в запросе с использованием АвтоНомерЗаписи()

Запросы Платформа 1С v8.3 Конфигурации 1cv8 Бесплатно (free)

Часто поступают задачи по произвольному распределению общих сумм. После распределения иногда пропадают копейки. Суть решения добавить АвтоНомерЗаписи() в ВТ распределения, и далее используя функции МАКСИМУМ или МИНИМУМ можем положить разницу копеек в первую или последнюю строку знаменателя распределения.

11.04.2024    2084    andrey_sag    9    

27

Для чего используют конструкцию запроса "ГДЕ ЛОЖЬ" в СКД на примере конфигурации 1С:ERP

Запросы СКД Платформа 1С v8.3 Запросы Система компоновки данных 1С:ERP Управление предприятием 2 Бесплатно (free)

В типовых конфигурациях разработчики компании 1С иногда используют в отчетах, построенных на СКД, такую конструкцию, как "ГДЕ ЛОЖЬ". Такая конструкция говорит о том, что данные в запросе не будут получены совсем. Для чего же нужен тогда запрос?

13.02.2024    5973    KawaNoNeko    23    

25

Набор-объект для СКД по тексту или запросу

Запросы СКД Платформа 1С v8.3 Управляемые формы Конфигурации 1cv8 Абонемент ($m)

Есть список полей в виде текста, или запрос - закидываем в набор СКД.

1 стартмани

31.01.2024    2139    2    Yashazz    0    

30

Запрос 1С copilot

Инструментарий разработчика Запросы Платформа 1С v8.3 Управляемые формы Конфигурации 1cv8 Абонемент ($m)

Пишем на человеческом языке, что нам надо, и получаем текст запроса на языке 1С. Используются большие языковые модели (LLM GPT) от OpenAI или Яндекс на выбор.

5 стартмани

15.01.2024    6601    31    mkalimulin    27    

51

PrintWizard: поддержка представлений ЗУП в конструкторе

Инструментарий разработчика Запросы Платформа 1С v8.3 Бесплатно (free)

Одной из интересных задач, стоящих в процессе разработки, была поддержка механизма представлений в ЗУП. Но не просто возможность исполнения запросов с ними. Основная проблема была в том, чтобы с ними было удобно работать, а именно: создавать, модифицировать и отлаживать. Кратко о том, что в итоге получилось...

14.12.2023    1874    vandalsvq    7    

29

Объектная модель запроса "Схема запроса" 2

Запросы Платформа 1С v8.3 Запросы Конфигурации 1cv8 Бесплатно (free)

Далеко уже не новый тип данных "Схема запроса". Статья о том, как использовать его "попроще". Примеры создания текста запроса с нуля и изменение имеющегося запроса.

06.12.2023    5602    user1923546    26    

46

Начните уже использовать хранилище запросов

HighLoad оптимизация Запросы

Очень немногие из тех, кто занимается поддержкой MS SQL, работают с хранилищем запросов. А ведь хранилище запросов – это очень удобный, мощный и, главное, бесплатный инструмент, позволяющий быстро найти и локализовать проблему производительности и потребления ресурсов запросами. В статье расскажем о том, как использовать хранилище запросов в MS SQL и какие плюсы и минусы у него есть.

11.10.2023    16556    skovpin_sa    14    

101
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. Светлый ум 406 28.12.15 06:22 Сейчас в теме
Еще пару плюшек в тему:
Некоторые полезные новичкам платформы 1С8.х приёмы работы с запросами:
1.Обработка пустого результата в самом запросе.
2.Построение многовариантного запроса.
3.Использование функции Значение.
4.Выгрузка результатов запроса в табличную часть.5.
5.Добавление необходимых значений в результат запроса.
6.По многочисленным просьбам пример чуть посложнее, результат запроса будет выгружен в регист остатков.
http://infostart.ru/public/80366/
+
2. AlX0id 28.12.15 12:22 Сейчас в теме
Хм. А если, например, ищем строку "ССССССССС" - я правильно понимаю, что запрос выдаст одинаковую нечеткость при наличии в реквизитах поиска в разных записях "СССАААВВВ", "ССССССААА" и "ССССССССС"?
+
3. vasvl123 119 28.12.15 13:17 Сейчас в теме
(2) AlX0id, да так и есть
+
4. DoctorRoza 29.12.15 13:50 Сейчас в теме
Не понятно, где такое использовать! Важную информацию нужно найти точно, а для маловажной подойдет и штатный полнотекстовый поиск!
+
5. vasvl123 119 29.12.15 13:56 Сейчас в теме
(4) DoctorRoza, например, чтобы избежать дублей при наполнении справочника информацией из разных источников.
v.l.; +1
6. NN2P 415 17.11.17 20:15 Сейчас в теме
Крах при поиске:
Монитор Benq 21.5" GW2270 черный VA LED 5ms 16:9 DVI Mat 20000000:1 250cd

с ошибкой
{ВнешняяОбработка.НечеткийПоиск.Форма.Форма.Форма(43)}: Ошибка при вызове метода контекста (Выполнить)
РезультатЗапроса = Запрос.Выполнить();
по причине:
{(5, 1360)}: Синтаксическая ошибка "%""
100*(0 + ВЫБОР КОГДА ИсточникДанных.НаименованиеПолное ПОДОБНО "%Мон%" ТОГДА 1 ИНАЧЕ 0 КОНЕЦ + ВЫБОР КОГДА ИсточникДанных.НаименованиеПолное ПОДОБНО "%они%" ТОГДА 1 ИНАЧЕ 0 КОНЕЦ + ВЫБОР КОГДА ИсточникДанных.НаименованиеП
+
7. vasvl123 119 18.11.17 20:46 Сейчас в теме
(6)
Монитор Benq 21.5" GW2270 черный VA LED 5ms 16:9 DVI Mat 20000000:1 250cd
Запрос ломает кавычка в стоке поиска.
+
8. Artem1405 25 19.05.18 20:26 Сейчас в теме
скачал "Нечеткий поиск данных под УФ" обработка под обычные формы, дайте под УФ пожалуйста.
+
9. Artem1405 25 20.05.18 07:49 Сейчас в теме
(8) Извиняюсь, запутался в обработках. Все верно обработка для управляемой формы.
+
Внимание! Тема сдана в архив