Как оптимально сравнить две таблицы значений?

1. Nadushka74 5 10.10.14 15:23 Сейчас в теме
наименование колонок и типы данных в колонках идентичны, обе таблицы отсортированы по данным первой колонке. как оптимально произвести их сравнение?
По теме из базы знаний
Вознаграждение за ответ
Показать полностью
Найденные решения
467. ildarovich 7861 02.02.15 12:13 Сейчас в теме
По результатам текущего обсуждения выпущена статья Лучшие методы сравнения таблиц значений.

В ней задача обобщена на случай составного ключа. Для этого все функции переписаны. Также изменено представления результатов сравнения. Это я сделал на свой страх и риск. Возражения принимаются.

Поэтому возможны помарки и может оказаться необходимой перепроверка. Если есть желание - подключайтесь. Обнаружены интересные артефакты, связанные, вероятно с местом хранения строк таблицы значений. Они еще требуют объяснения.

Несколько методов осталось "в запасе". Например, использование нового объекта 8.3, позволяющего рассчитать хэш-функцию. Ну и разные доработки свертки.

Но зато выводы получились очень четкими. Каждому методу нашлось свое место. Буквально таблицу решений по выбору метода можно построить. Посмотрю на результаты обсуждения (если оно будет) и сделаю это.
dj_serega; +1 Ответить
387. ildarovich 7861 05.11.14 23:26 Сейчас в теме
(386) kostyaomsk, причина пояснит приложенная картинка. Это результаты теста при использовании SQL-сервера. Тут есть и запросные (вторая часть строчек) и беззапросные методы. Обратите внимание на последнюю строку. Это время выполнения вот такой процедуры
Функция СравнениеТаблицЗначений(Таблица1, Таблица2, ПрочиеКолонки = "") Экспорт
	
	ИмяКлюча = Таблица1.Колонки[0].Имя;
	
	Для ё = 1 По Таблица1.Колонки.Количество() - 1 Цикл ПрочиеКолонки = ПрочиеКолонки +  ", " + Таблица1.Колонки[ё].Имя
	КонецЦикла;
	
	Запрос = Новый Запрос(
	
	"ВЫБРАТЬ Т.Ключ, -1 КАК Знак
	|ПОМЕСТИТЬ Т1
	|ИЗ	&Таблица1 КАК Т
	|;
	|ВЫБРАТЬ Т.Ключ,  1 КАК Знак
	|ПОМЕСТИТЬ Т2
	|ИЗ	&Таблица2 КАК Т"
	
	);
	
	Запрос.Текст = СтрЗаменить(Запрос.Текст, "Т.Ключ,", ИмяКлюча + " КАК Ключ" + ПрочиеКолонки + ",");
	
	Запрос.УстановитьПараметр("Таблица1", Таблица1);
	Запрос.УстановитьПараметр("Таблица2", Таблица2);
	
	Возврат Запрос.Выполнить().Выгрузить()
	
КонецФункции
Показать
В ней ничего не делается. Никакой обработки. Только производится ввод данных из таблиц значений во временные таблицы. Видите время? - 1896 мс. А за это время - за 1588 мс. свертка уже успела получить и выдать готовый результат!
Конечно, если вычесть это время из времени 2631 самого быстрого запроса полного соединения, то получается, что на обработку SQL потратит меньше времени 735 мс, но вод передача данных в запрос все портит!
Прикрепленные файлы:
411. Никулин Леонид 12.11.14 09:33 Сейчас в теме
У меня была похожая задачка. Могу посоветовать выгрузить ТЗ в табличные части и сравнивать их запросом





// Функция сравнивает ТЧ док "ОприходованиеТоваров" и ТЧ док "ЗаказНаПроизводство" (с учетом всех корректировок)
// Если они одинаковые вернет Истину в противном случае Ложь
Функция ПроверкаЗаполненияОприходования(ОприходованиеТоваров,ЗаказНаПроизводство)

Запрос = Новый Запрос;
Запрос.Текст =
"ВЫБРАТЬ РАЗРЕШЕННЫЕ
| Подсчет.Номенклатура,
| Подсчет.ЕдиницаИзмерения,
| Подсчет.Количество,
| СУММА(Подсчет.Счетчик) КАК СчетчикМин,
| СУММА(Подсчет.Счетчик) КАК СчетчикМакс
|ИЗ
| (ВЫБРАТЬ
| ПотребностиЗаказовНаПроизводство.Номенклатура КАК Номенклатура,
| ПотребностиЗаказовНаПроизводство.ЕдиницаИзмерения КАК ЕдиницаИзмерения,
| ПотребностиЗаказовНаПроизводство.Количество КАК Количество,
| 0.5 КАК Счетчик
| ИЗ
| РегистрНакопления.ПотребностиЗаказовНаПроизводство КАК ПотребностиЗаказовНаПроизводство
| ГДЕ
| ПотребностиЗаказовНаПроизводство.ЗаказНаПроизводство.Ссылка = &ЗаказНаПроизводство
|
| ОБЪЕДИНИТЬ ВСЕ
|
| ВЫБРАТЬ
| ОприходованиеТоваровТовары.Номенклатура,
| ОприходованиеТоваровТовары.ЕдиницаИзмерения,
| ОприходованиеТоваровТовары.Количество,
| 0.5
| ИЗ
| Документ.ОприходованиеТоваров.Товары КАК ОприходованиеТоваровТовары
| ГДЕ
| ОприходованиеТоваровТовары.Ссылка = &ОприходованиеТоваров) КАК Подсчет
|
|СГРУППИРОВАТЬ ПО
| Подсчет.Номенклатура,
| Подсчет.Количество,
| Подсчет.ЕдиницаИзмерения
|ИТОГИ
| МИНИМУМ(СчетчикМин),
| МАКСИМУМ(СчетчикМакс)
|ПО
| ОБЩИЕ";
Запрос.УстановитьПараметр("ОприходованиеТоваров", ОприходованиеТоваров);
Запрос.УстановитьПараметр("ЗаказНаПроизводство", ЗаказНаПроизводство);
Выборка = Запрос.Выполнить().Выбрать();
Выборка.Следующий();

ТЧ_Совпадают = (Выборка.СчетчикМин = Выборка.СчетчикМакс И Выборка.СчетчикМин = 1);

Возврат ТЧ_Совпадают;

КонецФункции
//...-Никулин
Остальные ответы
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
5. Xershi 1484 10.10.14 16:52 Сейчас в теме
(1) Nadushka74, есть в типовых конфигурация процедура сравнения двух таблиц. В моей УСО:
Функция СравнитьТаблицыНаборовЗаписей(ТаблицаЗначений1, ТаблицаЗначений2) Экспорт

	Если ТипЗнч(ТаблицаЗначений1) <> Тип("ТаблицаЗначений") ИЛИ ТипЗнч(ТаблицаЗначений2) <> Тип("ТаблицаЗначений") Тогда
		Возврат Ложь;
	КонецЕсли; 
	
	Если ТаблицаЗначений1.Количество() <> ТаблицаЗначений2.Количество() Тогда
		Возврат Ложь;
	КонецЕсли; 

	Если ТаблицаЗначений1.Колонки.Количество() <> ТаблицаЗначений2.Колонки.Количество() Тогда
		Возврат Ложь;
	КонецЕсли;
	
	// Проверим поля
	Для каждого Колонка Из ТаблицаЗначений1.Колонки Цикл
		Если ТаблицаЗначений2.Колонки.Найти(Колонка.Имя) = Неопределено Тогда
			Возврат Ложь;
		КонецЕсли;
	КонецЦикла; 
	Для каждого Колонка Из ТаблицаЗначений2.Колонки Цикл
		Если ТаблицаЗначений1.Колонки.Найти(Колонка.Имя) = Неопределено Тогда
			Возврат Ложь;
		КонецЕсли;
	КонецЦикла; 
	
	// сформируем строку индекса для оптимизации поиска по таблице значений
	СтрокаИндекса = "";
	Для каждого Колонка Из ТаблицаЗначений1.Колонки Цикл
		Если СтрокаИндекса = "" Тогда
			СтрокаИндекса = Колонка.Имя;
		Иначе
			СтрокаИндекса = СтрокаИндекса+","+Колонка.Имя;
		КонецЕсли;
	КонецЦикла;
	// добавим индекс
	ТаблицаЗначений2.Индексы.Добавить(СтрокаИндекса);
	
	// Проверим записи
	Для каждого СтрокаТаблицы Из ТаблицаЗначений1 Цикл
		СтруктураПоиска = Новый Структура;
		Для каждого Колонка Из ТаблицаЗначений1.Колонки Цикл
			СтруктураПоиска.Вставить(Колонка.Имя, СтрокаТаблицы[Колонка.Имя]);
		КонецЦикла;
		СтрокиТаблицы2 = ТаблицаЗначений2.НайтиСтроки(СтруктураПоиска);
		Если СтрокиТаблицы2.Количество() <> 1 Тогда
			Возврат Ложь;
		КонецЕсли; 
	КонецЦикла;
	
	// сформируем строку индекса для оптимизации поиска по таблице значений
	СтрокаИндекса = "";
	Для каждого Колонка Из ТаблицаЗначений2.Колонки Цикл
		Если СтрокаИндекса = "" Тогда
			СтрокаИндекса = Колонка.Имя;
		Иначе
			СтрокаИндекса = СтрокаИндекса+","+Колонка.Имя;
		КонецЕсли;
	КонецЦикла;
	// добавим индекс
	ТаблицаЗначений1.Индексы.Добавить(СтрокаИндекса);
	
	Для каждого СтрокаТаблицы Из ТаблицаЗначений2 Цикл
		СтруктураПоиска = Новый Структура;
		Для каждого Колонка Из ТаблицаЗначений2.Колонки Цикл
			СтруктураПоиска.Вставить(Колонка.Имя, СтрокаТаблицы[Колонка.Имя]);
		КонецЦикла;
		СтрокиТаблицы1 = ТаблицаЗначений1.НайтиСтроки(СтруктураПоиска);
		Если СтрокиТаблицы1.Количество() <> 1 Тогда
			Возврат Ложь;
		КонецЕсли; 
	КонецЦикла;
	
	Возврат Истина;
	
КонецФункции // СравнитьТаблицыЗначений()
Показать
6. МихаилМ 10.10.14 17:24 Сейчас в теме
(5)
решение по скорости медленнее раз в 100 , если сравнивть тз в 10 000 строк
7. Salavat 13 10.10.14 17:33 Сейчас в теме
(1) Nadushka74, а просто
Если ТаблицаЗначений1 <> ТаблицаЗначений2 Тогда
        Возврат "Разные";
    КонецЕсли;
не работает?
или - нужно именно отличия получить?
dyuha; 3762515; NewKid_InTown; +3 1 Ответить
37. Lama12-1 8 20.10.14 17:23 Сейчас в теме
(1) Nadushka74, Выгрузить в Excel.
Одна таблица на один лист, вторая на второй.
На третьем листе пишем функцию а1лист1=а1лист2 и растягиваем ее на ширину колонок таблицы и на глубину таблицы.
На четветом листе делаем функцию "И" с параметрами таблицы с третьего листа (вся таблица).
56. Lama12-1 8 22.10.14 10:00 Сейчас в теме
Хм... интересную штуку заметил у ТС.
В (1) говорится об оптимальном сравнении таблиц. Вопрос - что есть оптимально?
В современной теории разработки прикладного ПО (не системного) основной упор делается на удобство модификации и поддержки кода.
Исходя из этого, наиболее оптимальный ответ в (5).
64. ildarovich 7861 22.10.14 13:18 Сейчас в теме
(56) Lama12-1, код в (5) только по форме правильный, а по сути - ужасен. То, что делается одной строкой кода растянуто на 76 строк. Есть такое выражение "переливать из пустого в порожнее". Это можно делать не только в устной речи, но и в письменной и при написании кода тоже.
Можно было бы просто написать что то типа
Функция СравнитьТаблицыНаборовЗаписей(ТаблицаЗначений1, ТаблицаЗначений2, ИменаПолейЧерезЗапятую) Экспорт
    Возврат ТаблицаЗначений1.Сортировать(ИменаПолейЧерезЗапятую).ЗначениеВСтрокуВнутр() = ТаблицаЗначений2.Сортировать(ИменаПолейЧерезЗапятую).ЗначениеВСтрокуВнутр()
КонецФункции
А вместо этого... Мало того, что (5) это длинно, но еще и работает жутко медленно.
aleksey2; ivangrant; mvxyz; creatermc; Восьмой; zyama; +6 Ответить
65. Тсрпё 22.10.14 13:29 Сейчас в теме
(64) ну, такое прокатит, если обе тз отсортированы изначально одинаково.
58. AnryMc 849 22.10.14 10:28 Сейчас в теме
(1) Nadushka74,

Который раз меня удивляет отсутствие метода отбора "НЕ",
а было бы так просто...

1) сравнил размеры таблиц (количество строк)
2) меньшую запихал в отбор
3) из второй выбрал строки методом "НЕ ОТБОР"

получил строки которых нет в первой таблице

П.С. Правда в первой таблице могут быть строки которых нет во второй...
Поэтому просьба к автору топика

Конкретизировать критерии сравнения...

Например:
- Найти строки котрые совпадают в обоих таблицах
- Найти строки которые отличаются в обоих таблицах
- Найти строки которые "добавились" в одной из таблиц
-...
353. Serginio 938 05.11.14 11:44 Сейчас в теме
Кстати проверил как лучше заполнять результат
	Массив=ЗначениеИзФайла(КаталогПрограммы()+"ТаблицыДляТестов");
	Тз1=Массив[0];
	
	Старт = ТочноеТекущееВремя();

	Рез=Новый массив;
	
	Для каждого Стр Из Тз1 Цикл
	
	массив=Новый массив;
	Массив.Добавить(стр[0]);
	Массив.Добавить(1);
	Рез.Добавить(массив);
КонецЦикла;
 Сообщить("Время массива с добавлением " + (ТочноеТекущееВремя() - Старт)+ " мсек.");

 	Старт = ТочноеТекущееВремя();

 Рез=Новый массив;
	
	Для каждого Стр Из Тз1 Цикл
	
	массив=Новый массив(2);
	Массив[0]=стр[0];
	Массив[1]=1;
	Рез.Добавить(массив);
КонецЦикла;
 Сообщить("Время массива по индексу " + (ТочноеТекущееВремя() - Старт)+ " мсек.");

	Старт = ТочноеТекущееВремя();
 
 Рез=Новый Соответствие;
	
	Для каждого Стр Из Тз1 Цикл
	
	рез[стр[0]]=1;
	
КонецЦикла;
 Сообщить("Время соответствия " + (ТочноеТекущееВремя() - Старт)+ " мсек.");

Показать




Время массива с добавлением 136 мсек.
Время массива по индексу 133 мсек.
Время соответствия 76 мсек.
354. awk 741 05.11.14 11:55 Сейчас в теме
(353) Serginio, Советую перейти на: ТекущаяУниверсальнаяДатаВМиллисекундах() - Встроенная в 1С функция получения даты в миллисекундах...
Serginio; +1 Ответить
356. Serginio 938 05.11.14 12:00 Сейчас в теме
359. ildarovich 7861 05.11.14 12:18 Сейчас в теме
(353) Serginio, это всего лишь значит, что два больше чем один, то есть два оператора медленнее, чем один, а не сравнение массив - соответствие.
Чтобы точно сравнить скорость массива и соответствия предложенным кодом, нужно еще вычесть время работы "обертки", то есть прогнать холостой цикл - без всего и вычесть его время из полученного.
Я попробовал загонять результат в разные массивы, чтобы не хранить там же отметку: что это за ключ (удаленный, измененный, добавленный). Но общей картины это не поменяло.
394. Xershi 1484 06.11.14 11:49 Сейчас в теме
Ну вы тут и срач развели 100500 сообщений. А в (1) всего навсего из монотонных таблиц, где изменили петрова на сидорова нужно узнать что теперь у нас в строке 5 стоит сидоров.
maxster545; +1 1 Ответить
2. dj_serega 391 10.10.14 15:44 Сейчас в теме
Только идеи :)
1. Запросом (но смотря сколько колонок нужно сравнивать)
2. Циклом в цикле :)
341. Serginio 938 04.11.14 19:46 Сейчас в теме
340+ Если так модифицировать то слияние на некоторых тестах обходит Хэш

Функция ПолучитьИдексПоля(Тз,имяПоля)
	
	Колонки=Тз.Колонки;
	Колонка=Колонки.Найти(ИмяПоля);
	
	Если Колонка=неопределено Тогда
		тз.ВыбратьСтроку();
		
		ВызватьИсключение "Не найдена колонка "+ИмяПоля;
	КонецЕсли;	
	
	возврат Колонки.Индекс(Колонка);
КонецФункции

Функция ПолучитьМассивИдексовПолей(Тз,Колонки)
	Рез=Новый Массив;
	Для каждого стр из Колонки Цикл
		рез.Добавить(ПолучитьИдексПоля(Тз,стр))
	КонецЦикла;	
	возврат рез
КонецФункции	

Функция СравнитьТаблицы(Т1,Т2,Колонки, Ключ) Экспорт
	
	
	РезТ1=Новый Массив;
	РезТ2=Новый Массив;
	Одинаковые=Новый Массив;
	Измененные=Новый Массив;
	ИндексКлючаТ1=ПолучитьИдексПоля(Т1,Ключ);
	ИндексКлючаТ2=ПолучитьИдексПоля(Т2,Ключ);
	
	
	Индекс2=0;
	КолСтрВТз2=Т2.Количество();
	Сравнение = Новый СравнениеЗначений;
	
	ИндексыКолонокТ1=ПолучитьМассивИдексовПолей(Т1,Колонки);
	ИндексыКолонокТ2=ПолучитьМассивИдексовПолей(Т2,Колонки);
	//   СтрТ1=ПолучитьСтроку165(Т1,Индекс1);
	
	
	Если Индекс2 <> КолСтрВТз2 Тогда
		СтрТ2=Т2[Индекс2];
		Знач2=СтрТ2[ИндексКлючаТ2];
	КонецЕсли;
	
	Для каждого СтрТ1 Из т1   Цикл
		
		Если Индекс2 = КолСтрВТз2 Тогда
			РезТ1.Добавить(СтрТ1);
			Продолжить;
		КонецЕсли;
		
		Знач1=СтрТ1[ИндексКлючаТ1];
		Пока истина Цикл
			РезультатСравнения = Сравнение.Сравнить(Знач1,Знач2);
			Если РезультатСравнения < 0 Тогда
				РезТ1.Добавить(СтрТ1);
				
				прервать
			ИначеЕсли РезультатСравнения > 0 Тогда
				РезТ2.Добавить(СтрТ2);
				Индекс2=Индекс2+1;
				Если Индекс2 <> КолСтрВТз2 Тогда
					СтрТ2=Т2[Индекс2];
					Знач2=СтрТ2[ИндексКлючаТ2];
				Иначе
					прервать
				КонецЕсли;
				
			Иначе
				Массив=Новый Массив(2);
				Массив[0]=СтрТ1;
				Массив[1]=СтрТ2;
				
				КолонкиИдентичны=истина;
				сч2=0;
				Для каждого сч из ИндексыКолонокТ1 Цикл
					если СтрТ1[сч]<>СтрТ2[ИндексыКолонокТ2[сч2]] Тогда
						КолонкиИдентичны=ложь;
						прервать
					КонецЕсли;
					сч2=сч2+1;
				КонецЦикла;	   
				
				Если КолонкиИдентичны Тогда
					Одинаковые.Добавить(массив);
				Иначе
					Измененные.Добавить(массив);
				КонецЕсли;
				
				Индекс2=Индекс2+1;
				Если Индекс2 <> КолСтрВТз2 Тогда
					СтрТ2=Т2[Индекс2];
					Знач2=СтрТ2[ИндексКлючаТ2];
				КонецЕсли;
				
				прервать
			КонецЕсли;
		КонецЦикла; 
	КонецЦикла; 
	
	Пока Индекс2 <> КолСтрВТз2 Цикл
		СтрТ2=Т2[Индекс2];
		РезТ2.Добавить(СтрТ2);
		Индекс2=Индекс2+1;
	КонецЦикла; 
	
	
	Результат = Новый Структура("Одинаковые, Т1, Т2, Измененные",Одинаковые,РезТ1,РезТ2,Измененные);
	
	Возврат Результат;
КонецФункции
Показать
342. ildarovich 7861 04.11.14 21:26 Сейчас в теме
(341) Serginio, я переписал все упомянутые способы в едином стиле. При этом считал, что ответ нужен в виде пар: ключ-знак, где знак отмечает удаление, изменение или добавление строки, идентифицируемой значением "ключ". Таким образом, я посчитал, что одинаковые строки отмечать не нужно. При этом ваше слияние в моей интерпретации выглядит так:
Функция СравнениеТаблицЗначений_(Т1, Т2, Индекс1 = 0, Индекс2 = 0) Экспорт
	
	Ответ = Новый Соответствие;
	
	Сравнение = Новый СравнениеЗначений;
	
	ВГраница1 = Т1.Количество() - 1; 
	ВГраница2 = Т2.Количество() - 1; 
	
	ВГраница = Т1.Колонки.Количество() - 1;
	
	Пока Индекс1 <= ВГраница1 И Индекс2 <= ВГраница2 Цикл
		
		Ключ1 = Т1[Индекс1][0]; 
		Ключ2 = Т2[Индекс2][0];
		
		РезультатСравнения = Сравнение.Сравнить(Ключ1, Ключ2);
		
		Если РезультатСравнения < 0 Тогда
			Ответ[Ключ1] = -1;
			Индекс1 = Индекс1 + 1
		ИначеЕсли РезультатСравнения > 0 Тогда
			Ответ[Ключ2] =  1;
			Индекс2 = Индекс2 + 1
		Иначе
			Для ё = 1 По ВГраница Цикл 
				Если Т1[Индекс1][ё] <> Т2[Индекс2][ё] Тогда 
					Ответ[Ключ1] = 0; 
					Прервать 
				КонецЕсли 
			КонецЦикла;
			Индекс1 = Индекс1 + 1;
			Индекс2 = Индекс2 + 1
		КонецЕсли
		
	КонецЦикла;
	
	Пока Индекс1 <= ВГраница1 Цикл 
		Ответ[Т1[Индекс1][0]] = -1; 
		Индекс1 = Индекс1 + 1 
	КонецЦикла;
	
	Пока Индекс2 <= ВГраница2 Цикл 
		Ответ[Т2[Индекс2][0]] =  1; 
		Индекс2 = Индекс2 + 1
	КонецЦикла;
	
	Результат = Новый ТаблицаЗначений; Результат.Колонки.Добавить("Ключ"); Результат.Колонки.Добавить("Значение");
	
	Для Каждого Элемент Из Ответ Цикл 
		ЗаполнитьЗначенияСвойств(Результат.Добавить(), Элемент) 
	КонецЦикла;
	
	Результат.Колонки[1].Имя = "Знак";
	
	Возврат Результат
	
КонецФункции
Показать
Основной цикл здесь
Пока Индекс1 <= ВГраница1 И Индекс2 <= ВГраница2 Цикл
		
		Ключ1 = Т1[Индекс1][0]; 
		Ключ2 = Т2[Индекс2][0];
		
		РезультатСравнения = Сравнение.Сравнить(Ключ1, Ключ2);
		
		Если РезультатСравнения < 0 Тогда
			Ответ[Ключ1] = -1;
			Индекс1 = Индекс1 + 1
		ИначеЕсли РезультатСравнения > 0 Тогда
			Ответ[Ключ2] =  1;
			Индекс2 = Индекс2 + 1
		Иначе
			Для ё = 1 По ВГраница Цикл 
				Если Т1[Индекс1][ё] <> Т2[Индекс2][ё] Тогда 
					Ответ[Ключ1] = 0; 
					Прервать 
				КонецЕсли 
			КонецЦикла;
			Индекс1 = Индекс1 + 1;
			Индекс2 = Индекс2 + 1
		КонецЕсли
		
	КонецЦикла;
Показать
Вряд ли отсюда можно еще что-то убрать. //Хотя посмотрел еще раз на код и понял, что можно взять здесь не соответствие, а три массива, сейчас попробую...
В то же время соединение awk по соответствию выглядит у меня так:
Функция СравнениеТаблицЗначений_(Т1, Т2) Экспорт
	
	Ответ = Новый Соответствие;
	
	ХэшМап = Новый Соответствие;
	Для Каждого Строка Из Т2 Цикл 
		ХэшМап[Строка[0]] = Строка 
	КонецЦикла;
	
	Для Каждого Ведущая Из Т1 Цикл 
		Ключ = Ведущая[0]; 
		Ведомая = ХэшМап[Ключ]; 
		Если Ведомая = Неопределено Тогда 
			Ответ[Ключ] = -1 
		Иначе 
			Для ё = 1 По Т1.Колонки.Количество() - 1 Цикл 
				Если Ведущая[ё] <> Ведомая[ё] Тогда 
					Ответ[Ключ] = 0; 
					Прервать 
				КонецЕсли 
			КонецЦикла; 
			ХэшМап.Удалить(Ключ) 
		КонецЕсли 
	КонецЦикла;
	
	Для Каждого Элемент Из ХэшМап Цикл 
		Ответ[Элемент.Ключ] = 1 
	КонецЦикла;
	
	Результат = Новый ТаблицаЗначений; Результат.Колонки.Добавить("Ключ"); Результат.Колонки.Добавить("Значение");
	
	Для Каждого Элемент Из Ответ Цикл 
		ЗаполнитьЗначенияСвойств(Результат.Добавить(), Элемент) 
	КонецЦикла;
	
	Результат.Колонки[1].Имя = "Знак";
	
	Возврат Результат
	
КонецФункции
Показать
Основной цикл здесь - это
Для Каждого Ведущая Из Т1 Цикл 
		Ключ = Ведущая[0]; 
		Ведомая = ХэшМап[Ключ]; 
		Если Ведомая = Неопределено Тогда 
			Ответ[Ключ] = -1 
		Иначе 
			Для ё = 1 По Т1.Колонки.Количество() - 1 Цикл 
				Если Ведущая[ё] <> Ведомая[ё] Тогда 
					Ответ[Ключ] = 0; 
					Прервать 
				КонецЕсли 
			КонецЦикла; 
			ХэшМап.Удалить(Ключ) 
		КонецЕсли 
	КонецЦикла;
	
	Для Каждого Элемент Из ХэшМап Цикл 
		Ответ[Элемент.Ключ] = 1 
	КонецЦикла;
Показать
На вгляд, операций, выполняемых в цикле явно меньше. При этом число повторений цикла примерно равное. Это и объясняет худшие результаты слияния. Вот картина результатов на текущий момент. Для ее получения все циклы во всех вариантах я записывал в одну строку. Также я посмотрел профайлером затраты на перекладку результатов из соответствия в таблицу значений. Они не столь значительны, чтобы повлиять на результат.
Слиянию может помочь только сокращение числа операций в основном цикле (хвосты можно не смотреть). Не знаю, как этого добиться.
Также для простоты я беру все колонки, а первая (нулевая) - ключ. Чем определять номера нужных колонок и затем каждый раз их из массива выбирать, легче скопировать таблицу с нужным составом колонок на другое место.
Прикрепленные файлы:
343. awk 741 04.11.14 22:03 Сейчас в теме
(342) ildarovich, двойная свертка при приведении к Соответствии резко падает (нелинейно растет время выполнения). Код:

Функция СравнитьТаблицы(ТЗ1,ТЗ2,Колонки, ИмяПервойКолонки) Экспорт
    Результат = Новый Структура("Одинаковые, Т1, Т2, Измененные", Новый Соответствие, Новый Массив, Новый Массив, Новый Соответствие);
    ТЗ=ТЗ1.Скопировать();    
    ТЗ.Колонки.Добавить("РезультатСравнения");
    ТЗ.ЗаполнитьЗначения(-1,"РезультатСравнения");
    Для Каждого СтрокаТЗ2 из ТЗ2 Цикл
        СтрокаТЗ=ТЗ.Добавить();
		ЗаполнитьЗначенияСвойств(СтрокаТЗ,СтрокаТЗ2); 
        СтрокаТЗ.РезультатСравнения=1;
    КонецЦикла;
    ПереченьКолонок="";
    Для каждого Колонка из Колонки Цикл
        ПереченьКолонок=ПереченьКолонок+","+Колонка;
	КонецЦикла;
	ПереченьКолонок = Сред(ПереченьКолонок,2);
    ТЗПК=ТЗ.Скопировать(,ИмяПервойКолонки+",РезультатСравнения");
    ТЗПК.Свернуть(ИмяПервойКолонки,"РезультатСравнения");
    ТЗ.Свернуть(ПереченьКолонок,"РезультатСравнения");
	Для каждого СтрокаТЗПК из ТЗПК Цикл
		Если СтрокаТЗПК.РезультатСравнения=0 Тогда
			Ключ = СтрокаТЗПК[ИмяПервойКолонки];
			ПолнаяСтрока = ТЗПК.Найти(Ключ, ИмяПервойКолонки);
			Если ПолнаяСтрока.РезультатСравнения=0 Тогда
				Результат.Одинаковые.Вставить(ПолнаяСтрока, ПолнаяСтрока);
			Иначе
				Результат.Измененные.Вставить(ПолнаяСтрока, ПолнаяСтрока);
			КонецЕсли;
		ИначеЕсли СтрокаТЗПК.РезультатСравнения > 0 Тогда
			Результат.Т2.Добавить(СтрокаТЗПК);
		Иначе
			Результат.Т1.Добавить(СтрокаТЗПК);
        КонецЕсли;    
    КонецЦикла;
    Возврат Результат;
КонецФункции
Показать
344. ildarovich 7861 04.11.14 22:56 Сейчас в теме
(343) awk, я имел ввиду не эту двойную свертку, а вот эту
Функция СравнениеТаблицЗначений(Т1, Т2, ПрочиеКолонки = "") Экспорт
	
	ИмяКлюча = Т1.Колонки[0].Имя;
	
	Для ё = 1 По Т1.Колонки.Количество() - 1 Цикл ПрочиеКолонки = ПрочиеКолонки +  ", " + Т1.Колонки[ё].Имя
	КонецЦикла;
	
	Т2.Колонки.Добавить("Знак"); 
	Т2.ЗаполнитьЗначения(1, "Знак");
	
	ТЗ = Т1.Скопировать(); 
	ТЗ.Колонки.Добавить("Знак");	
	ТЗ.ЗаполнитьЗначения(-1, "Знак"); 
	ТЗ.Колонки.Добавить("Счет");
	
	Для ё = 1 По Т2.Количество() Цикл ТЗ.Вставить(0) КонецЦикла;
	
	Для ё = 0 По Т2.Колонки.Количество() - 1 Цикл ТЗ.ЗагрузитьКолонку(Т2.ВыгрузитьКолонку(ё), ё) КонецЦикла;
	
	Т2.Колонки.Удалить("Знак");
	
	ТЗ.ЗаполнитьЗначения(1, "Счет");
	
	ТЗ.Свернуть(ИмяКлюча + ПрочиеКолонки, "Знак,Счет");
	
	Ответ = ТЗ.Скопировать(Новый Структура("Счет", 1), ИмяКлюча + ",Знак");
	
	Ответ.Свернуть(ИмяКлюча, "Знак");
	
	Ответ.Колонки[0].Имя = "Ключ";
	
    Возврат Ответ
	
КонецФункции
Показать
345. ildarovich 7861 04.11.14 23:05 Сейчас в теме
(343) awk, а в том коде проблема всего лишь вот в этом операторе
ПолнаяСтрока = ТЗПК.Найти(Ключ, ИмяПервойКолонки);
так как у ТЗПК нет индекса по этой колонке.
Кстати, возможно, при формировании теста (в том куске, что я выкладывал) тоже не хватало индекса по ключевой колонке. И была проблема в том, что очень долго формировались тесты из-за проверки повторяемости значения ключа.
Я этот кусок переделал - сейчас у меня тестовые таблицы быстро строятся.
347. ildarovich 7861 04.11.14 23:34 Сейчас в теме
(343) awk, а вообще это более широкий вопрос. Его можно обсудить отдельно.
Соответствия Одинаковые, Измененные - это структуры, привязанные к сравниваемым таблицам, размещенным в памяти. Если таблицы переместить, скопировать, свернуть и т.п., то актуальность данных в этих структурах утрачивается. Они очень коротко-живущие, сиюминутные, промежуточные. Их нельзя ни сериализовать, ни вернуть из функции без самих таблиц, вообще никак без самих таблиц использовать.
Насколько они вообще нужны - это принципиальный вопрос.
Единственный способ их быстро получить после свертки - это еще раз выполнить соединение по ХэшМап (индексу). Никакого другого пути нет и быть не может. Так что требование возврата таких структур - это просто требование использования ХэшМап. Никакого соревнования, никаких вариантов. Очень жесткое требование.
Получается ни сравнение двух таблиц, а СВЯЗЫВАНИЕ строк экземпляров таблиц в оперативной памяти по ключевому полю.
То есть мы ответили на вопрос: как быстро связать ссылками две таблицы значений. Ответ - используйте соответствие. Это - единственно верный способ. Все остальные - потеря времени.
А как только мы отвяжемся от получения ничего не значащих ссылок, перейдем к содержательной стороне сравнения, поймем, а зачем нам на самом деле были нужны ссылки - для чего они нужны в конце-концов - тогда и появится неопределенность в выборе лучшего метода.
349. awk 741 04.11.14 23:46 Сейчас в теме
(347) ildarovich, Я выбрал такой результат как показательный в теле функции, а не как функциональный. Функцианал как мне кажется, полностью покрывающий практику ECUD (equil, create, update, delete):

1. "Равны" ли таблицы? Для срабатывания триггеров.
2. Что удалили? Для зачистки связанных данных.
3. Что изменили? Для перепроведения
4. Что добавили? Для генерации чего-либо.
5. Одинаковые элементы нужны для LRu кэша, но как то к 1С не применимо...
362. ildarovich 7861 05.11.14 13:00 Сейчас в теме
(349) awk, еще раз говорю: вопрос тоньше!

Сначала исключим психологические моменты:
1) Я не воспринимаю двойную свертку как свой метод - этот метод общеизвестный и первый какой приходит в голову. Я всего лишь его компактно записал, чтобы не было никаких потерь (YanTSys не все сделал для этого).
2) Я очень люблю соответствие (ХэшМап) и всюду его применяю - я за него так же болею.
3) Использование соответствия вместо индекса в этой задаче - это ваша и очень ценная находка, достойная отдельной публикации. В другой ветке народ уже интересовался - я эту вашу находку уже упоминал. Особенно, если речь будет идти о составных ключах [K1][K2]...[KN]. Правда, пока мне непонятно как красиво обрабатывать отсутствие ключа в очередном измерении.

Теперь о нашем соревновании. Углубившись в задачу, я очень многое про нее понял, над чем первоначально не задумывался.
И, в частности, вот что:
Результат, включающий соответствия Одинаковые[УказательНаСтрокуВТаблице1] -> УказательНаСтрокуВТаблице2 и Измененные[УказательНаСтрокуВТаблице1] -> УказательНаСтрокуВТаблице2 пользователю не требуется. Это промежуточные данные. Которые получаются как побочный эффект по ходу работы вашего метода.
Если пользователь спрашивает: какие строки изменились, то ему нельзя отвечать: изменились строки, расположенные в оперативной памяти по адресу 0x5555 и по адресу 0x7777. Ему это будет непонятно и не нужно. Но если он спросит: а сколько полей в этой записи изменилось, какие поля изменились, на сколько изменились поля, то на все эти содержательные вопросы и многие другие можно будет ответить, получив и имея эти соответствия.
Но, если задача ставится именно так: разместить в памяти структуру для быстрого ответа на такие вопросы, то решение становится безальтернативным. Если это спрашивается, то нужно использовать ХэшМап и только ХэшМап. - Никакого соревнования нет и быть не может! (слияние тоже не перемещает строки в памяти, но тратит больше отдельных операций и при реализации на 1С, видимо, проигрывает).
Так что если хотите допустить других участников, то разрешайте ответы, не содержащие УказательНаСтрокуВТаблице1 и УказательНаСтрокуВТаблице2, а содержащие КлючСтрокиВТаблице1 и КлючСтрокиВТаблице2. Тогда и будет соревнование.
363. awk 741 05.11.14 13:13 Сейчас в теме
(362) ildarovich,
Сначала исключим психологические моменты:
1) Я не воспринимаю двойную свертку как свой метод
Вызвало улыбку. Неужели кто-то считает общеизвестные алгоритмы своим изобретением?

Использование соответствия вместо индекса в этой задаче - это ваша
:))) Не моя. Типовое решение в другой среде... В Яве HashMap - это очень популярная коллекция. При добавлении 5 строчек в которую превращается во вполне эффективный LRU кэш.


Еще раз: результат функции - не принципиален. Например я бы в рабочей среде немного изменил сигнатуру вызова сравнения, дабы передать "посетителя". А вставки заменил с:

Результат.Одинаковые.Вставить(ПолнаяСтрока, ПолнаяСтрока);


на:

Попытка Посетитель.Одинаковые(ПерваяСтрока, ВтораяСтрока, Отказ); Исключение КонецПопытки;
Если Отказ Тогда Возврат Результат; КонецЕсли;
364. ildarovich 7861 05.11.14 13:59 Сейчас в теме
(363) awk, ну, мне показалось, что спор сворачивает в сторону: чей метод лучше. Чей - не в смысле изобретен, а кто предложил. Не так - ну и хорошо.

Попыток - исключений в коде интуитивно сторонюсь. Для меня это что-то типа goto. Хотя, может и зря. Нужно на скорость проверить.

Запихивать в ответ по второму разу полные строки?

Ну а если результат функции не принципиален, почему всем не взять "общительную" коллекцию типа массива или той же таблицы значений. Вы же за это даже баллы накидывать собирались. У меня дурацкая тяга к симметрии и мне в этой задаче нравится результат в виде таблицы значений. Типа на вход подали ТЗ и на выходе ТЗ. Такая матричная арифметика. Только одна структура.

Ну или по крайней мере исключить указатели на строки. Тогда все будут на равных. В общем, мое единственное условие - исключить указатели, то есть тип данных СтрокаТаблицыЗначений.
366. awk 741 05.11.14 14:08 Сейчас в теме
(364) ildarovich, Более красиво без попыток, но более сложно для клиента:


Если Поддерживает(Посетитель, "Одинаковые", 3) Тогда Посетитель.Одинаковые(ПерваяСтрока, ВтораяСтрока, Отказ); КонеЕсли;



То есть посетителю надо предусмотреть функцию:

Функция МетодыМодуля() Экспорт

Результат = Новый Структура();
Результат.Вставить("Одинаковые", Новый Структура("КоличествоПараметров, ВозвращаетЗначение", 3, Ложь));
Возврат Результат;

КонецФункции;
Показать



Вот только получение МетодыМодуля() все равно в попытке делать :))...
369. ildarovich 7861 05.11.14 14:24 Сейчас в теме
(366) awk, кажется, задача слишком простая, чтобы ООП сюда приворачивать, но это только мое мнение. Тут еще не исчерпана универсальность в виде задания состава ключей, в том числе КлючевыеКолонки = "". Что с этим делать? Меня больше интересует не интерфейс, а собственно способ, хотя связь есть - это понятно. Но, если сделать быструю универсальную функцию на базе этих изысканий - будет круто. Причем просто универсальна уже есть - на Мисте от fixin.
371. awk 741 05.11.14 14:40 Сейчас в теме
(369) ildarovich, ООП тут не причем. Обычный callback.
365. ildarovich 7861 05.11.14 14:07 Сейчас в теме
(363) awk, ну, и кстати, использование ХэшМап для поиска в ТЗ вместо индекса с замерами - напишите статью или заметку!
Актуальность вот из этого комментария следует http://forum.infostart.ru/forum24/topic119600/message1243153/#message1243153.
Я так понял в поиске через [К1][К2][КN] отсутствие данных по измерению попыткой-исключением обходите? Как с быстродействием - не снижается?
367. awk 741 05.11.14 14:09 Сейчас в теме
(365) ildarovich, Зачем? Если К1[П1] = Неопределено, то К1[П1][П2] нет смысла проверять...
368. ildarovich 7861 05.11.14 14:16 Сейчас в теме
(367) awk, но тогда потребуется некрасивая гребенка из Если ИначеЕсли вместо красивой, быстрой и компактной записи [][][]. Не съедят ли эти проверки весь выигрыш по сравнению с индексированием?
370. awk 741 05.11.14 14:37 Сейчас в теме
(368) ildarovich,


Функция СоздатьДерево(Данные, МассивКлючей)
	
	Дерево = Новый Соответствие;
	
	Для каждого ЭлементДанных Из Данные Цикл
		ДобавитьКлюч(Дерево, МассивКлючей, 0, ЭлементДанных);
	КонецЦикла; 
	
	Возврат Дерево;

КонецФункции

Процедура ДобавитьКлюч(Дерево, МассивКлючей, Уровень, ЭлементДанных)
    
    Если Уровень = МассивКлючей.ВГранице() Тогда
        Дерево[ЭлементДанных[МассивКлючей[Уровень]]] = ЭлементДанных;
	ИначеЕсли Уровень < МассивКлючей.ВГранице() Тогда
		Если Дерево[ЭлементДанных[МассивКлючей[Уровень]]] = Неопределено Тогда
			Дерево[ЭлементДанных[МассивКлючей[Уровень]]] = Новый Соответствие;
		КонецЕсли; 
		ДобавитьКлюч(Дерево, МассивКлючей, Уровень+1, ЭлементДанных);
    КонецЕсли;
    
КонецПроцедуры



Функция ПолучитьДанные(Дерево, МассивКлючей, Уровень=0)
	Если Дерево = Неопределено Тогда
		Возврат Неопределено;
	ИначеЕсли Уровень = МассивКлючей.ВГранице() Тогда
		Возврат Дерево[МассивКлючей[Уровень]];
	Иначе 
		Возврат ПолучитьДанные(Дерево[МассивКлючей[Уровень]], МассивКлючей, Уровень + 1);
	КонецЕсли;
КонецФункции

 
Показать


Не думаю что будут сильные задержки. Хотя построить индекс по идее должен выйграть.
374. ildarovich 7861 05.11.14 15:38 Сейчас в теме
(370) awk, ну, при таком расточительном способе еще кучу вариантов можно предложить.
Я бы тут предпочел при том, что сказал ранее
Попытка
X = ХэшМап[К1][К2][К3][К4][К5]
Исключение
Х = Неопределено
КонецПопытки
375. awk 741 05.11.14 15:44 Сейчас в теме
(374) ildarovich, Советую замерить быстродействие. Исключение генерирует достаточно много данных. Это может "убить" всю прелесть использования. То есть при "попадании" выигрышный в скорости, а при "стрельбе" мимо цели проигрыш.
377. ildarovich 7861 05.11.14 15:50 Сейчас в теме
(375) awk, да я это в порядке размышлений - не моя тема.
380. awk 741 05.11.14 16:21 Сейчас в теме
(377) ildarovich, Через попытку в пять раз медленней получается...
381. dj_serega 391 05.11.14 16:39 Сейчас в теме
(380) awk, Аналогичная ситуация и с отладчиком в 7.7. Код который выполняется в подключенной отладке медленнее чем обычное предприятие.
379. awk 741 05.11.14 16:13 Сейчас в теме
(374) ildarovich, Замерил 999 раз на данных:


	Дерево = Новый Соответствие;
	Дерево["К1"] = Новый Соответствие;
	Дерево["К1"]["Л1"] = 10;
	Дерево["К1"]["Л2"] = 10;
	Дерево["К2"] = Новый Соответствие;
	Дерево["К2"]["Л1"] = 10;
	Дерево["К2"]["Л2"] = 10;
	Массив = Новый Массив();
	Массив.Добавить(Новый Массив());
	Массив[0].Добавить("К1");
	Массив[0].Добавить("Л1");
	Массив.Добавить(Новый Массив());
	Массив[1].Добавить("Л1");
	Массив[1].Добавить("К1");

Показать


Ни разу попытка не обогнала если...
372. Serginio 938 05.11.14 14:59 Сейчас в теме
(368) Скорее всего съест. Но есть варианты, которые кстати применяются для уменьшения конкуренции на запись.
Процедура ДобавитьКлючиВТз(СоответствиеКлючей,СтрТз)
	ТзКлючей=СоответствиеКлючей[СтрТз[ПервоеПоле]];
	
	Если ТзКлючей=неопределено  Тогда
	    //Создадим тз с нужными колонками и одной строкой
		ТзКлючей=ТзКлючейДляЗаполнения.СкопироватьКолонки();
	    ТзКлючей.Добавить(КолонкиДляИндекса) 
	КонецЕсли; 
	СтрКлючей=ТзКлючей.Добавить();
	ЗаполнитьЗначенияСвойств(СтрКлючей,СтрТз)
КонецПроцедуры	

Функция НайтиКлючи(ПервоеПоле,СтрТз,НайденнаяСтрока)

	 ТзКлючей=СоответствиеКлючей[СтрТз[ПервоеПоле]];
	
	Если ТзКлючей=неопределено  Тогда
	
		возврат ложь
	
	КонецЕсли; 
	Структура=Новый Структура(КолонкиДляИндекса);
	ЗаполнитьЗначенияСвойств(Структура,СтрТз)

	Строки=ТзКлючей.НайтиСтроки(Структура);
	Если  Строки.Количество()=0 Тогда
		возврат ложь
	КонецЕсли;	
	
	НайденнаяСтрока=Строки[0];
	возврат истина
	
КонецФункции // НайтиКлючи
 // ()
Показать


КолонкиДляИндекса,ПервоеПоле,ТзКлючейДляЗаполнения можно сделать переменными модуля, что бы не таскать их через параметры
376. ildarovich 7861 05.11.14 15:48 Сейчас в теме
(372) Serginio, это полумеры. Как я понял, решение [][][][][] - это быстрое бескомпромиссное соответствие-соответствия-соответствия. Многоуровневое дерево, на каждом уровне которого ветвление по одному ключу.
378. Serginio 938 05.11.14 16:06 Сейчас в теме
(376) Ты посчитай затраты на составления дерева, [][][][][] при генерации исключения в попытке, как правильно заметил awk.
В 1С все нужно проверять, а потом утверждать.
Да и индексированная таблица с удалением по идее не должна сильно сливать Соответствию. А даже быть быстрее, за счет того, что не нужно программно строить Соответсвие.
393. Silenser 596 06.11.14 10:50 Сейчас в теме
(378) Serginio, Понятие сливает есть понятие относительное, зависит от условий. Прикрепил тест скорости поиска по ТЗ различными способами. В обсуждаемой обработке как раз используется соответствие и метод найти ТЗ. Сорри, если неверно понял предмет спора и влез с оффтопом.
Прикрепленные файлы:
Сравнение поиска.xlsx
ТестСкоростиПоиска.epf
395. Serginio 938 06.11.14 12:04 Сейчас в теме
(393) Ну вот в (391) ildarovich уже выложил вылизанные алгоритмы. И по сути они мало отстают друг от друга.
Было интересно, как именно оптимально эти алгоритмы использовать учитывая интерпретатор 1С например в (350)
А так алгоритмы известны давным давно смотри (339)
373. awk 741 05.11.14 15:34 Сейчас в теме
(365) ildarovich, Там видать просто пытались использовать соответствие не для тех целей. (токо сейчас заметил ссылку). По статье надо подумать...
ildarovich; +1 Ответить
396. Silenser 596 06.11.14 14:44 Сейчас в теме
(362) ildarovich,
Правда, пока мне непонятно как красиво обрабатывать отсутствие ключа в очередном измерении.

Можно добавлять какой-либо редко используемый символ к представлению каждого измерения.
[k1][k2][][][k5] - z1;z2;;;z5;
397. ildarovich 7861 06.11.14 14:59 Сейчас в теме
(396) Silenser, - эх! - не получится - слишком много памяти съест - ведь продолжать придется все возможные ветки.
398. Silenser 596 06.11.14 21:06 Сейчас в теме
(397) ildarovich, Можно проверить. Результаты в 393 показывают, что все не так уж и плохо, при увеличении длины ключа.
346. Serginio 938 04.11.14 23:28 Сейчас в теме
(342) в 341 как раз вылизано все, что только возможно. При этом от первоначального варианта скорость увеличена в 2 раза.
348. ildarovich 7861 04.11.14 23:41 Сейчас в теме
(346) Serginio, я уже ответил awk, но здесь отвечу короче. Чтобы вылизать (341) и выжать все, что возможно, нужно использовать ХэшМап, то есть повторить большую часть алгоритма соединения по ХэшМап. То есть требовать соответствий СТРОК (указателей, по своей сути) таблиц значений от свертки - это заставлять стартовать его после того, как прибежит ХэшМап. Может он тогда когда-нибудь выиграть?
Потому что свертка работает с содержимым таблиц, а не с хранящими это содержимое структурами.
350. Serginio 938 05.11.14 10:14 Сейчас в теме
(348) Ты возьми и сравни (341), а не говори голословно. У меня он на некоторых наборах даже обходит Хэш. Но его тоже можно оптимизировать. Сам по себе алгоритм слияния для полного соединения самый быстрый, но в условиях 1С выполняется больше операторов интерпретатора.

Так увеличение дает код

Для каждого стр из Тз Цикл


перед
Индекс=Индекс+1;
Стр=Тз[Индекс];


Значение=Стр[ИндексКолонки]

перед
Значение=Стр[ИмяПоля]


Одинаковые.Вставить

перед
Результат.Одинаковые.Вставить



Кроме того по алгоритму слияния одно и тоже значение может сравниваться несколько раз

Поэтому сравнивать лучше
Сравнение.Сравнить(Значение1,Значение2)

перед
Сравнение.Сравнить(СтрТ1[Поле],СтрТ2[Поле])
360. ildarovich 7861 05.11.14 12:27 Сейчас в теме
(350) Serginio, я бы с удовольствием сравнил и эту реализацию, но не могу в точности воссоздать условия, так как в моей тестовой обертке вывод идет в таблицу значений из двух колонок: ключ - знак. Я пошел другим путем: аккуратно и старательно переписал ваш метод слияния на этот случай. Считаете, что я где-то ошибся?
Сейчас попробую запустить в точности ваш код без приведения результата к одному виду (ОК = Нет).
Я вообще все циклы после отладки записываю в одну строку - это стандартный прием оптимизации, исключающий к тому же влияние разного стиля написания.
361. Serginio 938 05.11.14 12:40 Сейчас в теме
(360) Подправил, но не проверял
Функция ПолучитьИдексПоля(Тз,имяПоля)
    
    Колонки=Тз.Колонки;
    Колонка=Колонки.Найти(ИмяПоля);
    
    Если Колонка=неопределено Тогда
        тз.ВыбратьСтроку();
        
        ВызватьИсключение "Не найдена колонка "+ИмяПоля;
    КонецЕсли;    
    
    возврат Колонки.Индекс(Колонка);
КонецФункции


Функция СравнитьТаблицы(Т1,Т2,Колонки, Ключ) Экспорт
    
Ответ=Новый Соответствие;    
    ИндексКлючаТ1=ПолучитьИдексПоля(Т1,Ключ);
    ИндексКлючаТ2=ПолучитьИдексПоля(Т2,Ключ);
    
    
    Индекс2=0;
    КолСтрВТз2=Т2.Количество();
    Сравнение = Новый СравнениеЗначений;
 
    
    Если Индекс2 <> КолСтрВТз2 Тогда
        СтрТ2=Т2[Индекс2];
        Знач2=СтрТ2[ИндексКлючаТ2];
    КонецЕсли;
    
    Для каждого СтрТ1 Из т1   Цикл
       
        Если Индекс2 = КолСтрВТз2 Тогда
           Ответ[СтрТ1[ИндексКлючаТ1]]=-1;
            Продолжить;
        КонецЕсли;
         Знач1=СтрТ1[ИндексКлючаТ1];

                Пока истина Цикл
            РезультатСравнения = Сравнение.Сравнить(Знач1,Знач2);
            Если РезультатСравнения < 0 Тогда
               Ответ[Знач1]=-1;
                
                прервать
            ИначеЕсли РезультатСравнения > 0 Тогда
                Ответ[Знач2]=1;
                Индекс2=Индекс2+1;
                Если Индекс2 <> КолСтрВТз2 Тогда
                    СтрТ2=Т2[Индекс2];
                    Знач2=СтрТ2[ИндексКлючаТ2];
                Иначе
                    прервать
                КонецЕсли;
                
            Иначе
                               
                КолонкиИдентичны=истина;
                сч2=0;
                Для каждого Колонка из Колонки Цикл
                    если СтрТ1[Колонка]<>СтрТ2[Колонка] Тогда
                        Ответ[Знач1]=0;
                        прервать
                    КонецЕсли;
               
                КонецЦикла;       
                               
                Индекс2=Индекс2+1;
                Если Индекс2 <> КолСтрВТз2 Тогда
                    СтрТ2=Т2[Индекс2];
                    Знач2=СтрТ2[ИндексКлючаТ2];
                КонецЕсли;
                
                прервать
            КонецЕсли;
        КонецЦикла; 
    КонецЦикла; 
    
    Пока Индекс2 <> КолСтрВТз2 Цикл
        СтрТ2=Т2[Индекс2];
         Ответ[СтрТ2[ИндексКлючаТ2]]=1;
        Индекс2=Индекс2+1;
    КонецЦикла; 
    
    
    
    Возврат Ответ;
КонецФункции
Показать
382. ildarovich 7861 05.11.14 17:21 Сейчас в теме
(361) Serginio, - ДА!!!!

Проверил ваш код, потом посмотрел, где теряю и переписал свой. Оказалось - можно выиграть на Строка1 = Таблица1[Индекс1]; Ключ1 = Строка1[0] вместо Ключ1 = Таблица1[Индекс1][0]. Причем я
1) эту подсказку видел, но, каюсь, не думал, что будет так существенно быстрее;
2) у меня так было сначала и написано, а я решил проверить гипотезу сокращения количества операторов и забыл вернуть как было.
Теперь результаты поменялись:
Слияние 1 - это код из (361). Результаты работы везде совпадают (ОК = Да). Правда на 50000 Слияние опять проигрывает, но
Прикрепленные файлы:
383. Serginio 938 05.11.14 17:30 Сейчас в теме
(382) Прикрепи обработку. Наверняка и соответствие и индексированную таблицу можно ускорить
384. ildarovich 7861 05.11.14 18:25 Сейчас в теме
(383) Serginio, дерзайте, у меня тут еще есть идея как зависимость двух индексов учесть в слиянии. У меня так сделано в Минимализмах - думаю, еще несколько процентов можно будет со слияния сбросить. Единственно, у меня в этом варианте на массивы переписано, и мне код перекладки не нравится. Я решил вернуться к ответу-соответствию по ХэшМапу и слиянию как уже выкладывал в комметариях. Но сейчас нет времени самому возвращать тот вариант - сделаю это позже.
Прикрепленные файлы:
ТестСпособовСравненияТаблицЗначений.erf
3. IvanAlekseev 77 10.10.14 16:19 Сейчас в теме
1. Сначала сравнить количество строк в обоих таблицах.
2. Сравниваем первую и последнюю строку.
3. Так как количество строк и первая, последняя строки совпадают, то может быть только "сдвижка" (какого-то значения нет, но позже появляется лишнее значение, в итоге к концу Тз выходим на тоже значение) по первой колонке и изменения значений по остальным.
4 Дальше итерационно пробегаем подобно методу "деление отрезка пополам": сравниваем серединную строку, следом у каждого полученного куска опять сравниваем серединную строку и т.д. В конце концов мы попадем на участок, где есть сдвижка и там значения первой колонки будут отличаться, либо будут отличаться значения остальных колонок.

По сути так работает индекс. Хотя вызов функции- достаточно накладная операция...
245. IvanAlekseev 77 30.10.14 14:50 Сейчас в теме
в (3) написан ПРАВИЛЬНЫЙ ответ (разве что рекурсию заменить циклами). Только избыточное изобретательство не позволяет это понять.
259. ildarovich 7861 30.10.14 19:56 Сейчас в теме
(245) IvanAlekseev, понять это мешает отсутствие кода. Сами попробуете запрограммировать эту идею - тогда и скажете "ой". Я дихотомию в похожей задаче использовал - посмотрите мою статью "Компаратор оборотов баз" - там есть готовая обработка. Уверенно могу сказать, что тут такое не прокатит.
261. IvanAlekseev 77 30.10.14 21:29 Сейчас в теме
(259) Вопрос разбивается на две части:

1. Поиск оптимального ИНСТРУМЕНТА. Другими словами, некоторые думают так: 1с косячно реализовала функционал, и мы пытаемся найти тот объект, в котором для данной задачи косяки минимально проявились. Думаю при таком ощущении мира более грамотно необходимый функционал реализовать на С, и скорость повысится ~1000 раз (сам делал замеры на реальной задаче).

2. Поиск оптимального АЛГОРИТМА. Так вот, если мы ищем именно алгоритм, то в (3) представлен самый быстрый алгоритм.

Код писать лень, поскольку он очевиден: заводим МассивОтложенныхЗадач, в котором последовательной парой храним первый и последний индекс строк сравниваемых Тз (предварительно проверяем равенство первой и последней строки и добавляем в МассивОтложенныхЗадач 0 и КоличествоСтрок-1). В цикле без условия (Пока Истина Цикл) с помощью переменной хранящей последний индекс МассиваОтложенныхЗадач получаем текущий "кусок", сравниваем центральную строку текущего "куска", удаляем только что исследованный "кусок" и добавляем два других (на которые разбивается отрезок делением пополам, если первый и последний индекс не отличаются на 1). Как только индекс отложенных задач дойдет до -2 - прерываем цикл (отложенные задачи исчерпались).

Накладные расходы- определение центрального индекса (полусумма крайних индексов "куска") и добавление/удаление индексов в МассивОтложенныхЗадач. За эти расходы мы получаем благо- можем прервать обработку, так как пользуемся упорядочиванием Тз по первой колонке. Ничего быстрее с точки зрения АЛГОРИТМА быть не может.
263. awk 741 30.10.14 21:55 Сейчас в теме
(261) IvanAlekseev,
1. Индекс так не работает.
2. Это вариант Nested Loop, не в самой быстрой реализации.
4. МихаилМ 10.10.14 16:35 Сейчас в теме
опишите критерии оптимальности
например так
http://www.forum.mista.ru/topic.php?id=506669%29
Stety; Evil Beaver; ZLENKO; +3 Ответить
8. tsmgeorg@gmail.com 10.10.14 17:58 Сейчас в теме
В запросе создаем две временные таблицы на основании запроса с номерами строк ТЗ. Далее поля таблицы индексируем, после этого два запроса делаем в котором выводим различные строки и все. Лучше по любому чем циклом перебирать.
andogskiy; ojiojiowka; Korolev; OksDallas; Dimon93dimon; jobkostya1c_ERP; Bad_Developer; +7 Ответить
9. МихаилМ 10.10.14 18:07 Сейчас в теме
(8) tsmgeorg@gmail.com,
можно и построчно сравнить отсортированные тз
без лишних найти()

если тз больше 10000 строк и бд в файловом то не лучше. не дождетесь вообще результата работы такого запроса.
если толстый клиент + сервер 1с и сервер субд на физически разных компьютерах то тоже будет медленнее.
12. tsmgeorg@gmail.com 13.10.14 10:00 Сейчас в теме
(9) МихаилМ, А здесь и не будет выполнятся метод найти) Я имею сначала Таблица1 Лефт джойн Таблица2, и Таблица2 Лефт джойн Таблица 1 и выводить записи где Таблица2 и Таблица1 естьнулл, ну или выводить все и вывести признак (ЗАписьРавна = истина или ложь), а потом объединить их вот в результате и получим таблицу сравнения))) Естественно этот метод можно доработать, а не перебор циклом. А результат этого запроса или в ТЗ или обработка запроса вот и все.
10. Nadushka74 5 11.10.14 10:20 Сейчас в теме
количество строк думаю не более 100. Надо указать различия, т.е основной у нас является 1 колонка. Сначала надо сравнить есть ли различия в ней. Т.е выводим строки которых нет либо в первой ТЗ либо во Второй ТЗ.
(8) tsmgeorg@gmail.com, а что значит индексируем? я просто большой чайник в этом
11. Salavat 13 11.10.14 10:28 Сейчас в теме
(10) Nadushka74, это значит индексы создавать.
индексы нужны для ускорения работы (поиск - например),... вобщем немалая это тема.
в запросе это на закладке "Индекс" (при типе запроса - создание временной таблице) - задаются поля для которых индексы создавать надо.
13. Xershi 1484 13.10.14 11:06 Сейчас в теме
(10) Nadushka74, переделайте функцию чтобы агрегировало различия, а не возвращало лишь результат, что различны.
30. ildarovich 7861 18.10.14 01:23 Сейчас в теме
(10) Nadushka74, а не могли бы уточнить по поводу значений в первой колонке. Может ли такое быть, чтобы в одной таблице в этой колонке были бы в разных строках два одинаковых значения? То есть играет ли она роль "ключа" в этой таблице, то есть значение в ней однозначно определяет остальные данные строки. А то из
Надо указать различия, т.е основной у нас является 1 колонка. Сначала надо сравнить есть ли различия в ней. То есть выводим строки которых нет либо в первой ТЗ либо во Второй ТЗ.
можно подумать и так и так.

А от того, допустимы ли одинаковые значения в первой колонке, либо вообще - одинаковые строки в одной таблице, зависит выбор метода решения. Если одинаковых значений в первой колонке одной таблицы быть не может, то за основу нужно брать сортировку слиянием из комментария (14). Отсортированность по первой колонке поможет решить задачу сравнения быстрее. Если одинаковые значения встречаются, то отсортированность вообще не нужна и нужно взять за основу предложение из (4) и развивать в сторону универсальности решение (18).
15. ildarovich 7861 17.10.14 09:54 Сейчас в теме
Хочется увидеть нормальный и быстро работающий код, соответствующий условию задачи.
17. Serginio 938 17.10.14 10:37 Сейчас в теме
(15) Вот вариант для 7 ки отсюда http://files.rsdn.ru/19608/C1InDelphi.zip
аналогично можно и для 8 ки

//*******************************************
Перем СлучайноеЧисло;
Функция ПолучитьСлучайноеЧисло( МинЗначение, МаксЗначение )
	СлучайноеЧисло = 16807 * СлучайноеЧисло;
	СлучайноеЧисло = СлучайноеЧисло - Цел( СлучайноеЧисло / 2147483647 ) * 2147483647;
	Если ( ( МаксЗначение - МинЗначение + 1 ) > 1 ) Тогда
		Возврат МинЗначение + Цел( ( МаксЗначение - МинЗначение + 1 ) * СлучайноеЧисло / 2147483648 )
	Иначе        Возврат ( СлучайноеЧисло / 2147483648 )
	КонецЕсли
КонецФункции

//=================================
Функция ИзСтрокиСРазделителями(Стр,Разделитель) 
	Сз=СоздатьОбъект("СписокЗначений"); 
	ТемпСтр=СокрЛП(Стр);
	поз=Найти(ТемпСтр,Разделитель);
	Пока Поз>0 Цикл
	    Сз.ДобавитьЗначение(СокрЛП(Лев(ТемпСтр,Поз-1)));
		ТемпСтр=Сред(ТемпСтр,Поз+1);
		поз=Найти(ТемпСтр,Разделитель);
	КонецЦикла;
	    Если ПустаяСтрока(ТемпСтр)=0 Тогда
	       Сз.ДобавитьЗначение(СокрЛП(ТемпСтр)); 
	КонецЕсли;
	Возврат Сз
КонецФункции  

Процедура ДобавитьРеквизиты(Тз,ТзТемп,Индекс,Резулт,СписокПолей)
	Для сч=1 По СписокПолей.РазмерСписка()  Цикл
	Поле=СписокПолей.ПолучитьЗначение(сч);
	Значение=ТзТемп.ПолучитьЗначение(ТзТемп.НомерСтроки,Поле);
	Тз.УстановитьЗначение(индекс,Поле,Значение);
    
КонецЦикла;
Тз.ПолучитьСтрокуПоНомеру(Индекс);
 Тз.Резулт=Резулт;
КонецПроцедуры

Функция ТзРавны(Тз1,тз2,СписокПолей)
	Для сч=1 По СписокПолей.РазмерСписка()  Цикл
	Поле=СписокПолей.ПолучитьЗначение(сч);
	Если не (Тз1.ПолучитьЗначение(Тз1.НомерСтроки,Поле)=Тз2.ПолучитьЗначение(Тз2.НомерСтроки,Поле)) Тогда
		Возврат 0;
	КонецЕсли; 

    
КонецЦикла;
Возврат 1;
КонецФункции
Функция Сравнение(ТзДляСравнений,Тз1,Тз2,СписокПолей,СпзСписокПолей) 
        
     Если ТзРавны(Тз1,тз2,СпзСписокПолей)=1 Тогда
	 	Возврат 0;
     КонецЕсли;
      ДобавитьРеквизиты(ТзДляСравнений,Тз1,1,-1,СпзСписокПолей);
      ДобавитьРеквизиты(ТзДляСравнений,Тз2,2,1,СпзСписокПолей);
      
     
     ТзДляСравнений.Сортировать(СписокПолей);
      ТзДляСравнений.ПолучитьСтрокуПоНомеру(1);
      Возврат ТзДляСравнений.Резулт;
     
         КонецФункции
    
    Процедура СравнитьТз(Тз1,Тз2,СписокПолей,ТзДляСравнений)
    
		СпзСписокПолей=ИзСтрокиСРазделителями(СписокПолей,",");
    Таб=СоздатьОбъект("таблица");
    //Таб.ИсходнаяТаблица("Таблица");
    Таб.ВывестиСекцию("Шапка");
     
    Тз1.Сортировать(СписокПолей);
    Тз2.Сортировать(СписокПолей);
    Тз2.ВыбратьСтроки();
    Тз1.ВыбратьСтроки();
    
    Фл1=Тз1.ПолучитьСтроку();
    Фл2=Тз2.ПолучитьСтроку();
    Пока (Фл1=1) И (Фл2=1) Цикл  
        ФлСравнения=Сравнение(ТзДляСравнений,тз1,Тз2,СписокПолей,СпзСписокПолей);
        Если ФлСравнения=-1 Тогда
//             Выводим Тз1.СравниваемыйЭлемент нен В Тз2 нет такого элемента
 
              Таб.ВывестиСекцию("ЕстьТолькоВТз1");       
            Фл1=Тз1.ПолучитьСтроку();
            // Получаем новую строку Тз1,

        ИначеЕсли  ФлСравнения=1 Тогда
            // Выводим Тз2.СравниваемыйЭлемент нен В Тз1 нет такого элемента
 
          Таб.ВывестиСекцию("ЕстьТолькоВТз2"); 
            Фл2=Тз2.ПолучитьСтроку();
        иначе
            //Строки равны 
 
            //     ТзРазличий.НоваяСтрока();
 Таб.ВывестиСекцию("ТзРавны"); 
            
            Фл1=Тз1.ПолучитьСтроку();
            Фл2=Тз2.ПолучитьСтроку();
        КонецЕсли;
        
        КонецЦикла;      
        
        //====== Проверяем остатки неравных строк
 
        Если (Фл1=0) и (Фл2=1) Тогда
                        
            Пока Фл2=1 Цикл
               
            //Оставшиеся строки По тз2
            Таб.ВывестиСекцию("ЕстьТолькоВТз2"); 
            Фл2=Тз2.ПолучитьСтроку();
        
            КонецЦикла;
            //Выводим ОстаткиТз2
 
        ИначеЕсли (Фл1=1) и (Фл2=0) Тогда
            //Выводим ОстаткиТз1    
 
            Пока фл1=1 Цикл
            //Оставшиеся строки По тз1
            Таб.ВывестиСекцию("ЕстьТолькоВТз1");
        
            Фл1=Тз1.ПолучитьСтроку();
            КонецЦикла;
        КонецЕсли;  
         
        Таб.Показать();
    КонецПроцедуры

	Функция ПолучитьТзДляСравнения()
	Тз=СоздатьОбъект("ТаблицаЗначений");
	Тз.НоваяКолонка("Поле1","Число",10,0);
	Тз.НоваяКолонка("Поле2","Число",10,0);
	Тз.НоваяКолонка("Результат","Число",10,0);
	
	Для сч=1 По 100   Цикл
		Тз.НоваяСтрока();
	Тз.Поле1=ПолучитьСлучайноеЧисло( 1, 10 );	
	Тз.Поле2=ПолучитьСлучайноеЧисло( 1, 10 );
	Тз.Результат=1;
КонецЦикла;
Тз.Свернуть("Поле1,Поле2","Результат");
Возврат тз;
КонецФункции // ТестДляГруппировкиДанных()

Процедура Сформировать()
ТзДляСравнений=СоздатьОбъект("ТаблицаЗначений");
        ТзДляСравнений.НоваяКолонка("Поле1","Число");
        ТзДляСравнений.НоваяКолонка("Поле2","Число");
        ТзДляСравнений.НоваяКолонка("Резулт","число",2,0);
		
		//Создадим Две Строки в Таблице сравнений для заполнения по номеру строки
        ТзДляСравнений.НоваяСтрока(); 
		ТзДляСравнений.НоваяСтрока();
		
		Тз1=ПолучитьТзДляСравнения();
		Тз2=ПолучитьТзДляСравнения();
		
		СравнитьТз(Тз1,Тз2,"Поле1,Поле2",ТзДляСравнений)
КонецПроцедуры

//*******************************************
Показать


СлучайноеЧисло=67865
27. ildarovich 7861 17.10.14 15:14 Сейчас в теме
(17) Serginio, (18) YanTsys, (20) _censored, ни один вариант пока не является законченным решением для данной задачи.
(17) не на 8-ке и сортировка делается всех полей, а в задаче говорится о сортировке только по первому полю.
(18) очень не универсально (чтобы сравнить нужные таблицы имена полей нужно явно записать в код) и после свертки различия не выделены.
(20) не учтена особая роль первой колонки, имена колонок вшиты в запрос, таблицы значений не введены в запрос.

Вроде бы как (17) ближе всего к тому, что нужно, но это пока не законченное решение. И насколько оно оптимально?

(26) Кажется сомнительным такой способ проверки на полное совпадение. Будет показывать некоторые разные ТЗ как одинаковые. Лучше сериализовать (ЗначениеВСтрокуВнутр) и сериализации сравнивать.
Через Найти(Отбор) долго будет работать на большом количестве строк. То есть не оптимально. Ну и также не совсем для условий задачи.
31. YanTsys 12 18.10.14 10:51 Сейчас в теме
(27) ildarovich, ну вот а как по вашему обработка сама определит по каким колонкам автору нужно делать сравнение а по каким нет?
Если нужно сделать сравнение по всем колонкам, то разве тут у кого-то не хватит знаний чтобы загнать в строку имена колонок через запятую?
И что значит различия не выделены? Если ИсточникСтроки=-1 то строка с уникальными колонками есть только в первой таблице, если +1 то строка с этими уникальными колонками есть только во второй таблице, если ноль значит строка с такими значениями есть в обеих таблицах...
32. ildarovich 7861 18.10.14 11:50 Сейчас в теме
(31) YanTsys, сама обработка не определит - тут спора нет.
То, что загнать имена колонок через запятую не хватит знаний - у кого-то может или знаний не хватит или желания полуфабрикат использовать. Решение должно быть универсальным и готовым к использованию.

Должны выводиться только отличия - сказано однозначно. Так что строки с нулем нужно убирать. А если могут быть одинаковые строки, то может быть и +2 и +3 и -2 и -3 и так далее, что будет означать, что во второй таблице таких строк на две больше, на три больше, на одну меньше и т.п.

А вот то, что
основной у нас является 1 колонка
натолкнуло меня на мысль о том, что в ответе должно быть три состояния: строка (идентифицированная по первой колонке) удалена, строка добавлена, строка изменена.
33. YanTsys 12 18.10.14 12:00 Сейчас в теме
(32) ildarovich, кстати если бы только +2 и -3 то ладно бы... очевидно может быть хуже -1+1-1 = -1 хотя на самом деле есть одинаковые строки процедура покажет что такая строка была только в первой таблице :(
Кстати где на форуме смайлики? Программирование оно ведь тоже вызывает эмоции...!!!
16. YanTsys 12 17.10.14 10:13 Сейчас в теме
1. В одной из ТЗ поменять знак числовых полей на обратный.
2. Соединить ТЗ в одну.
3. В объединенной ТЗ выполнить операцию свернуть.
На выходе имеем ТЗ в которой будут суммы расхождения значений первой и второй исходной ТЗ

P.S. Знак числовых полей можно менять не в исходной второй ТЗ а в процессе объединения двух ТЗ
43. adamx 36 21.10.14 11:33 Сейчас в теме
(16) YanTsys, Если в 1 таблице есть строки Иваново 30, Иваново 20. А во второй Иваново 50 - то в в твоем случае будет косяк. Таблицы не равны, а мы будем думать что равны...
18. YanTsys 12 17.10.14 11:00 Сейчас в теме
Мой вариант попроще :) да еще и позволяет некоторые поля не сравнивать а находить расхождение

	//ТЗ1,ТЗ2=> исходные ТаблицаЗначений;
	
	ТЗ3=ТЗ1.Скопировать();
	ТЗ3.Колонки.Добавить("ИсточникСтроки");
	ТЗ3.ЗаполнитьЗначения(-1,"ИсточникСтроки");
	Для Каждого СтрокаТЗ2 из ТЗ2 Цикл
		СтрокаТЗ3=ТЗ3.Добавить();
		СтрокаТЗ3.ИсточникСтроки=1;
		Для каждого Колонка из ТЗ2.Колонки Цикл
			Если Колонка.Имя="Сумма1" или Колонка.Имя="Сумма2" Тогда				
				СтрокаТЗ3[Колонка.Имя]=-СтрокаТЗ2[Колонка.Имя];
			Иначе
				СтрокаТЗ3[Колонка.Имя]=СтрокаТЗ2[Колонка.Имя];
			КонецЕсли;			
		КонецЦикла;		
	КонецЦикла;
	ТЗ3.Свернуть("ИмяКолонки1,ИмяКолонки2,ИмяКолонки3,ИмяКолонки4","Сумма1,Сумма2,ИсточникСтроки");

Показать


В итоговой таблице если ИсточникСтроки=-1 то строка есть только в ТЗ1 если ИсточникСтроки=+1 то исходная строка есть только в ТЗ2 если ИсточникСтроки=0 то все поля кроме тех которые мы решили не сравнивать а находить сумму расхождения т.е. кроме Сумма1 и Сумма2 одинаковые а вот в полях Сумма1 и Сумма2 будет сумма отклонения этих полей
tsiiinf; Тсрпё; Азбука Морзе; +3 Ответить
19. Serginio 938 17.10.14 11:12 Сейчас в теме
(18) Такой вариант хорош только для числовых полей. Мой универсален и не зависит от типа поля. Единственно, что для семерки для ссылок при сортировке нужно добавлять *. Для 8и достаточко класса сравнение
Функция ПолучитьСтрокуСортПоля(Колонка,Тз,ЕстьСпр,ЕстьДок)
	перем Тип,Длина,Точность;
	поле=Тз.ПолучитьПараметрыКолонки(Колонка,тип,Длина,Точность);
	
	Тип=Врег(Тип);
	
	Если Найти(Тип,"СПРАВОЧНИК")=1 Тогда
		ЕстьСпр=1;
		Резулт=Колонка+"*"
	ИначеЕсли 	Найти(Тип,"ДОКУМЕНТ")=1 Тогда
		ЕстьДок=1;
		Резулт=Колонка+"*"
	Иначе
		Резулт=Колонка;
	КонецЕсли;
	
	Возврат Резулт	 
КонецФункции // ПолучитьСтрокуСортПоля
Показать
23. YanTsys 12 17.10.14 11:54 Сейчас в теме
(19) Serginio, и кстати автор отдельно оговорил что типы полей в ТЗ совпадают, следовательно разные типы сравнивать не придется в принципе... а значения одинакового типа функция свернуть в ТЗ и сама прекрасно сравнивает на равенство...
57. Азбука Морзе 105 22.10.14 10:19 Сейчас в теме
Наиболее оптимальный и самый быстрый по моему мнению в (18), т.к. все вычисления происходят в оперативной памяти, код простой, понятный и легко модифицируемый под конкретные нужды. Конечно можно наворотить и более универсальную функцию, но основная идея метода (18) не должна измениться
81. Тсрпё 22.10.14 15:08 Сейчас в теме
Мой вариант будет аналогично (18):
    ТЗ3=ТЗ1.Скопировать();
    ТЗ3.Колонки.Добавить("Отклонение1");
    ТЗ3.Колонки.Добавить("Отклонение2");
    ТЗ3.ЗагрузитьКолонку(ТЗ3.ВыгрузитьКолонку("Сумма1"),"Отклонение1");
    ТЗ3.ЗагрузитьКолонку(ТЗ3.ВыгрузитьКолонку("Сумма2"),"Отклонение2");

    Для Каждого СтрокаТЗ2 из ТЗ2 Цикл
        СтрокаТЗ3=ТЗ3.Добавить();
        Для каждого Колонка из ТЗ2.Колонки Цикл
            СтрокаТЗ3[Колонка.Имя]=-СтрокаТЗ2[Колонка.Имя];  
            Если Колонка.Имя="Сумма1" Тогда                
                СтрокаТЗ3.Отклонение1=-СтрокаТЗ2[Колонка.Имя];
            ИначеЕсли Колонка.Имя="Сумма2"
                СтрокаТЗ3.Отклонение2=СтрокаТЗ2[Колонка.Имя];
            КонецЕсли;            
        КонецЦикла;        
    КонецЦикла;
    ТЗ3.Свернуть("ИмяКолонки1,ИмяКолонки2,ИмяКолонки3,ИмяКолонки4","Сумма1,Сумма2,Отклонение1,Отклонение2");
Показать


ну а далее обход, отклонение будет в Отклонение1,Отклонение2,
начальные значения в ТЗ, соответственно (Сумма1+Отклонение1)/2 и (Сумма1-Отклонение1)/2 ...аналогично, для второй колонки
20. _censored 17.10.14 11:38 Сейчас в теме
Если таблицы отсортированы, то можно запросом:

ВЫБРАТЬ
	ВложенныйЗапрос.НомерСтроки,
	ВложенныйЗапрос.Колонка1,
	...
	ВложенныйЗапрос.КолонкаN,
	СУММА(ВложенныйЗапрос.Индикатор) КАК Индикатор
ИЗ
	(ВЫБРАТЬ
		ТЗ1.НомерСтроки,
		ТЗ1.Колонка1,
		...
		ТЗ1.КолонкаN,
 		1 КАК Индикатор
	ИЗ
		 ТЗ1 КАК ТЗ1
	
	ОБЪЕДИНИТЬ ВСЕ
	
	ВЫБРАТЬ
		ТЗ2.НомерСтроки,
 		ТЗ2.Колонка1,
		...
		ТЗ2.КолонкаN,
		-1
	ИЗ
		ТЗ1 КАК ТЗ1) КАК ВложенныйЗапрос

СГРУППИРОВАТЬ ПО
	ВложенныйЗапрос.НомерСтроки,
	ВложенныйЗапрос.Колонка1,
	...
	ВложенныйЗапрос.КолонкаN

ИМЕЮЩИЕ
	СУММА(ВложенныйЗапрос.Индикатор) <> 0
Показать


И потом:

Если Выборка.Следующий() Тогда
//ТЗ различны
Иначе
//ТЗ одинаковы
КонецЕсли
22. YanTsys 12 17.10.14 11:52 Сейчас в теме
(20) _censored, так не получится, автор просит не просто проверить равенство таблиц а найти различные строки, в вашем варианте все испортит НомерСтроки если отличается НомерСтроки то они у вас уже будут считаться различными даже если все остальное совпадет...
25. Serginio 938 17.10.14 12:02 Сейчас в теме
(22) Алгоритм подразумевает сортировку и сравнение нужных полей.
(23) Нужно сравнивать не только числа, но и строки, ссылки итд.
Я дал алгоритм который используется в БД, а именно Merge Join. Плох он или хорош решать тому, кто будет выбирать между алгоритмами. Например http://www.forum.mista.ru/topic.php?id=715574&page=1
21. YanTsys 12 17.10.14 11:42 Сейчас в теме
Я немного не понял, мой вариант позволяет числовые поля проверить на сумму расхождения, либо если числовые поля не выделять в алгоритме он их как и остальные просто проверит на равенство...

Например пишем вот так:
//ТЗ1,ТЗ2=> исходные ТаблицаЗначений;
    
    ТЗ3=ТЗ1.Скопировать();
    ТЗ3.Колонки.Добавить("ИсточникСтроки");
    ТЗ3.ЗаполнитьЗначения(-1,"ИсточникСтроки");
    Для Каждого СтрокаТЗ2 из ТЗ2 Цикл
        СтрокаТЗ3=ТЗ3.Добавить();
        СтрокаТЗ3.ИсточникСтроки=1;
        Для каждого Колонка из ТЗ2.Колонки Цикл
            Если Колонка.Имя="Сумма2" Тогда                
                СтрокаТЗ3[Колонка.Имя]=-СтрокаТЗ2[Колонка.Имя];
            Иначе
                СтрокаТЗ3[Колонка.Имя]=СтрокаТЗ2[Колонка.Имя];
            КонецЕсли;            
        КонецЦикла;        
    КонецЦикла;
    ТЗ3.Свернуть("Сумма1,ИмяКолонки1,ИмяКолонки2,ИмяКолонки3,ИмяКолонки4","Сумма2,ИсточникСтроки");

Показать


И в результате строки в которых Сумма1 отличается будут выводится как разные строки.

А что ваш вариант еще делает кроме сравнения на равенство с нечисловыми полями?
24. Serginio 938 17.10.14 11:57 Сейчас в теме
18 Очень часто мне приходилось сравнивать разные базы по номенклатуре по наименованию.
Такой подход помогал находить одинаковые или близкие строки, что помогало их идентифицировать как одинаковые и прописывать одинаковый идентификатор для синхронизации между данными.
Ну и посмотри в 14 где есть ссылка на Merge Join. Вспоминаем сортировку слиянием.
26. Caspers 17.10.14 12:57 Сейчас в теме
Для ТЗ с идентичными колонками использую простой вариант:
Процедура Сравнение(ТЗ1,ТЗ2)
	
	ИмяОбщейКолонки = "ОбщСтрока";
	ИмяОбщейСуммы = "ОбщСумма";
	ИмяКоличестваСимволов = "ОбщКолСимволов";
	СтрСортровки = "ОбщКолСимволов,ОбщСумма,ОбщСтрока";
	
	ЕстьТЗ1 = ИнициализацияТЗ(ТЗ1, ИмяОбщейКолонки, ИмяОбщейСуммы, ИмяКоличестваСимволов, СтрСортровки);
	ЕстьТЗ2 = ИнициализацияТЗ(ТЗ2, ИмяОбщейКолонки, ИмяОбщейСуммы, ИмяКоличестваСимволов, СтрСортровки);
	
	Если (ТЗ1.Итог(ИмяОбщейСуммы)=ТЗ2.Итог(ИмяОбщейСуммы))И(ТЗ1.Количество()=ТЗ2.Количество())
		И(ТЗ1.Итог(ИмяКоличествасимволов)=ТЗ2.Итог(ИмяКоличествасимволов)) Тогда  // полное совпадение
		Сообщить("Таблицы идентичны");
	Иначе	
		Если ТЗ1.Количество()>ТЗ2.Количество() Тогда
			СравнениеКолонокТЗ(ТЗ1,ТЗ2,ИмяКоличестваСимволов,ИмяОбщейСуммы,ИмяОбщейКолонки); 	
		Иначе	
			СравнениеКолонокТЗ(ТЗ2,ТЗ1,ИмяКоличестваСимволов,ИмяОбщейСуммы,ИмяОбщейКолонки);
		КонецЕсли; 	
	КонецЕсли; 
	
КонецПроцедуры

Процедура СравнениеКолонокТЗ(ТЗИсточник,ТЗПриемник,ИмяКол1,ИмяКол2,ИмяКол3)
	// можно вместо ИмяКол1,ИмяКол2,ИмяКол3,.... передавать массив колонок
	
	Для каждого Стр Из ТЗИсточник Цикл
		Отбор = Новый Структура(""+ИмяКол1+","+ИмяКол2+","+ИмяКол3,Стр[ИмяКол1],Стр[ИмяКол2],Стр[ИмяКол3]);
		мОтбор = ТЗПриемник.НайтиСтроки(Отбор);
		Если мОтбор.ВГраница()=-1 Тогда
			Сообщить("Стр."+Стр.НомерСтроки+" отсутствует в "+ТЗПриемник);
		Иначе
			Для каждого мСтр Из мОтбор Цикл
				// примитивный вариант:
				Если Стр[ИмяКол1]<>мСтр[ИмяКол1] Тогда
					 Сообщить("Стр."+Стр.НомерСтроки+"не равна строке "+мСтр.НомерСтроки+" : "+ИмяКол1);
					 // ... если нужно - проходимся по нужным колонкам и сравниваем
				КонецЕсли;
				// .....  и т.д. 
			КонецЦикла; 
			Сообщить("Таблицы идентичны");
		КонецЕсли; 
	КонецЦикла; 	
	
КонецПроцедуры

Функция ИнициализацияТЗ(ТЗ, ИмяОбщейКолонки, ИмяОбщейСуммы, ИмяКоличестваСимволов, СтрСортировки=Неопределено)

	ТипЧисло = Тип("Число");
	ТЗ.Колонки.Добавить(ИмяОбщейКолонки,Тип("Строка"));
	ТЗ.Колонки.Добавить(ИмяОбщейСуммы,ТипЧисло);
	ТЗ.Колонки.Добавить(ИмяКоличестваСимволов,ТипЧисло);
	ТЗ.Колонки.Добавить("НомерСтроки",ТипЧисло);
	Если НЕ(СтрСортировки=Неопределено) Тогда
		ТЗ.Сортировать(СтрСортировки);
	КонецЕсли; 
	
	СчСтр = 1;
	Для каждого Стр Из ТЗ Цикл
		Стр.НомерСтроки = СчСтр; 
		СчСтр = СчСтр +1;
		
		ЗначениеОбщейКолонки = "";  ЗначениеОбщейСуммы = 0; ЗначениеОбщегоКоличестваСимволов = 0;
		Для каждого Кол Из ТЗ.Колонки Цикл
			Если Кол.Имя<>ИмяОбщейКолонки Тогда
				Если Кол.ТипЗначения = ТипЧисло Тогда
					ЗначениеОбщейСуммы = ЗначениеОбщейСуммы + Стр[Кол.Имя];
				Иначе	
					ЗначениеОбщейКолонки = ЗначениеОбщейКолонки + "" + Стр[Кол.Имя];
					ЗначениеОбщегоКоличестваСимволов = ЗначениеОбщегоКоличестваСимволов + СтрДлина(Стр[Кол.Имя]);
				КонецЕсли; 
			КонецЕсли; 	
		КонецЦикла; 
		Стр[ИмяОбщейКолонки] = ЗначениеОбщейКолонки;
		Стр[ИмяОбщейСуммы] = ЗначениеОбщейСуммы;
		Стр[ИмяКоличестваСимволов] = ЗначениеОбщегоКоличестваСимволов;
	КонецЦикла; 
	ТЗ.Сортировать(ИмяОбщейКолонки+","+ИмяКоличестваСимволов+","+ИмяОбщейСуммы); // возможно и не стоит
	
Возврат Истина;
// Можем при необходимости возвращать массивы имен колонок, участвующих в "ЗначениеОбщ..." и их итоговые суммы
// для ускорения последующих действий с данными
КонецФункции
Показать
28. artemka 17.10.14 15:34 Сейчас в теме
Нужно найти расхождения или просто определить что они различаются?
29. YanTsys 12 17.10.14 15:51 Сейчас в теме
(28) artemka, до 10 поста не осилил прочитать?
34. МимохожийОднако 141 19.10.14 10:20 Сейчас в теме
Замечу. В ветке предложено много интересных алгоритмов.
Вариантов сравнения ТЗ может быть очень много. Зависит от конкретных условий и целей. За универсальность платим скоростью исполнения. Зачастую достаточно не доводить до сравнения двух ТЗ, а решить задачу еще до получения этих таблиц.
odin777; Salavat; +2 Ответить
38. ildarovich 7861 20.10.14 18:15 Сейчас в теме
(34) МимохожийОднако, философии тут и так хватает, а мне конкретика (быстрая универсальная функция сравнения двух отсортированных по первой колонке и одинаковых по структуре колонок таблиц значений с выводом различий) нужна, однако...
40. Тсрпё 21.10.14 11:19 Сейчас в теме
(38) самый примитив - доп колонка , её заполнение и свёртка, это ежели не запросом делать
Одно только не ясно - свёрнуты ли до того как исходные тз
Celine.Angel; +1 Ответить
41. adamx 36 21.10.14 11:26 Сейчас в теме
(40) Тсрпё, Свертка не всегда возможна - не все типы можно сравнить при свертке. Она только по примитивным типам работает.
А так- да, я регулярно использую именно свертку когда нужно сравнить количество товаров в накладной и количество отгруженных со склада товаров...
63. pm74 199 22.10.14 12:53 Сейчас в теме
(38) А если вот так ?
* картинки неудачно вставились , вобщем идея в том чтобы после объединения таблиц получить числовое поле которое можно выразить в виде ax+by=c где a и b - это коэфициенты соответствующих таблиц , c - результат суммирования при сворачивании таблицы , x и y соответственно количество одинаковых строк в 1 и 2 таблице
Прикрепленные файлы:
сравнениеТЗ.epf
35. МихаилМ 20.10.14 15:45 Сейчас в теме
подзадачи для алгоритма сравнения сворачиванием

- более быстрый алгоритм объединения (UNION) двух (и более) тз( тк можно сравнивать таким образом много тз).
- для сравнения с учетом позиции строки - быстрая нумерация для последующей свертки.
ildarovich; +1 Ответить
36. МихаилМ 20.10.14 15:50 Сейчас в теме
+ 35

более быстрый , чем добавление строк с заполнением.
39. adamx 36 21.10.14 10:44 Сейчас в теме
Раз таблицы отсортированы по первой колонке - это уже ключ к разгадке этой тайны :-).
Но вообще надо отсортировать последовательно по всем колонкам. Если надо - запомнить с помощью колонки НомерСтроки начальный порядок строк.
А дальше:
1) МаксСтрока = Макс (КолвоСтрок1, КолвоСтрок2)
2) Текстрока1 = 1; ТекСтрока2 = 1
3) Пока ТекСтрока1<МаксСтрока и ТекСтрока2 < МаксСтрока Цикл
4) Сравниваем значения в первой строке
Если ТЗ[ТекСтрока1] = ТЗ[ТекСтрока2] Тогда ищем расхождения по этой строке
Если ТЗ[ТекСтрока1] > ТЗ[ТекСтрока2] Тогда ТекСтрока2++
Если ТЗ[ТекСтрока2] > ТЗ[ТекСтрока1] Тогда ТекСтрока1++

Таким образом мы найдем все различающиеся строки.

А вообще надо знать смысл таблиц, тогда можно с помощью функции свертки найти разницу.
42. adamx 36 21.10.14 11:29 Сейчас в теме
(39) adamx, Вот пример со сверткой:
1) Делаем доп. колонку "Доп"
2) Заполняем её для первой таблицы значением 1;
3) Заполняем её для второй таблицы значением -1;
4) Дописываем вторую таблицу в конец первой.
5) Сворачиваем первую таблицу по всем колонкам, кроме последней. Последнюю суммируем.
6) Там где в последней колонке сумма получилась 0 - значит эти строки совпадают.
В итоге имеем массив совпадающих строк, но их местоположение надо искать.
44. Тсрпё 21.10.14 11:35 Сейчас в теме
ну, по-уму, суммировать нужно не только доп колонку, но и все числовые (скопировав их в доп колонки и инвертировать значения в них), тогда можно будет точно узнать , что изменилось.
Оставьте свое сообщение

Для получения уведомлений об ответах подключите телеграм бот:
Инфостарт бот