Расширение для загрузки в 1С сканов документов, pdf файлов, распознанных с помощью OCR

11.01.22

Функциональные - Документооборот и делопроизводство (СЭД)

Подсистема, предназначенная для автоматического разбора распознанного файла, извлечение из него полезной информации и загрузки данных в 1С.

Скачать файлы

Наименование Файл Версия Размер
Расширение для загрузки в 1С сканов документов, pdf файлов, распознанных с помощью OCR:
.cfe 758,14Kb
201
.cfe 758,14Kb 201 Скачать бесплатно

Предисловие

Данную подсистему сделал в свободное время, так как была интересна тема распознавания изображений. Потом, в компании, в которой работаю, оценили разработку и успешно используют в загрузке специфичных и сложных для ручной обработки документов от вендера.

Выкладываю с одной целью - понять, актуально ли данное решение для других компаний, так как сейчас набирает популярность ЭДО (хотя на данном этапе у него много минусов). Если актуально, то собрать пожелания, идеи и сделать продукт, который полезен и выгоден для пользователя. 

PS. Данная штука не особо никому не нужна. Выложил всё в открытый доступ. Всё предоставляется "как есть".

Требования

Платформа не менее 8.3.12, режим совместимости не менее 8.3.12. Система Windows.

Описание

Программа использует различные варианты распознавания. Tesseract, ABBY FineReader, ABBY Hot Folder, ABBY Recognition Server, ABBYY Cloud OCR SDK. Выбор продукта зависит от количество документов и удобства использования в целом. Выбор пал именно на продукты ABBY, так как именно они выдают результат с наиболее приемлемым качеством распознавания и, самое важное, сохраняют структуру исходного файла. 

По сути, данная разработка - парсер, которая выуживает определённым способом данные из распознанного файла данные, структурирует их, и по настройкам пользователя загружает в 1с. Более того, позволяет пользователю расширять список документов для автоматического распознавания, что позволяет загружать не только какие-то типовые формы, но и произвольные (которые соответствуют определенным критериям, о которых ниже), притом именно в те документы в 1с, которые нужны пользователю, и так, как это нужно именно пользователю, а не как предусмотрел разработчик.

Механизм работы следующий. Файл преобразуется в htm файл (или xml, при работе с облаком). Если блок данных распознаётся как таблица, то программа пытается получить шапку таблицы и на основании этих данных, пытается соотнести информацию в ячейках к конкретной колонке в шапке. Поэтому:

Ограничение №1: Шапка таблицы должна быть только горизонтальная

Ограничение №2: Строки таблицы не должны быть многоуровневыми

Ограничение №3: Таблица должна распознаться, следовательно в исходном документе должна быть явно выделена

Если блок не таблица, то программа считает, что это информации относящиеся к шапке документа и пытается выделить из него полезную информацию, такие как поставщик, покупатель, номер, дата и прочее.

После программа пытается полученный массив полезных блоков информации логически разделить на документы, так как один документ может быть разбит на несколько файлов, так и в одном файле может содержаться несколько документов.

Пользователю выводится список файлов, на каждый вид документа есть своя настройка загрузки. По этой настройке данные загружаются в 1с. 

Порядок установки, работы и нюансы более подробно в документации.

Пример

Счет из Демо-базы УТ

При распознавании данного файла получим следующий результат.

Загрузим в «Приобретение услуг и прочих активов». Сделаем следующие настройки.

Создадим документ.

Осталось проверить корректность загрузки и заполнить требуемые поля.

OCR распознавание загрузка расширение

См. также

1С:Документооборот - цена на лицензии КОРП, ПРОФ и ДГУ

Документооборот и делопроизводство (СЭД) Типовые Платформа 1С v8.3 Управленческий учет Платные (руб)

Организуйте правильный документооборот на вашем предприятии. Ведение учета и хранения документов. Управление потоками документации между подразделениями. Работа с договорами в компании. Автоматизация подготовки, согласования и подписания документов. Сократите время и объем ошибок с 1С:Документооборот!

42500 руб.

19.02.2016    107003    103    5    

84

Таймлист (1С:Совещание, Таймлист Лайт)

Документооборот и делопроизводство (СЭД) Конфигурации 1cv8

«Таймлист» – экосистема сервисов («Таймлист Лайт», «1C:Совещание», «Таймлист Recorder»), основанная на искусственном интеллекте Таймлист, который позволяет эффективно работать с легкими поручениями за счет фиксации всех важных идей при расшифровке и последующем формировании автопротокола встречи. Сервисы, в которые интегрирован ИИ, позволяют работать с задачами (поручениями), полученными из автопротокола.

10000 руб.

06.12.2023    1261    0    0    

5

SALE! 30%

Распознавание и загрузка сканов в 1С "одним нажатием": УПД, ТОРГ-12, накладные, счета, номенклатура, заказы и т.д.

Загрузка и выгрузка в Excel Документооборот и делопроизводство (СЭД) Учет документов Распознавание документов и образов Управляемые формы 1С:Комплексная автоматизация 1.х 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Розница 2 1С:Управление производственным предприятием 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Управление холдингом 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Бухгалтерский учет Управленческий учет Платные (руб)

Универсальная программа для распознавания ЛЮБЫХ СКАНОВ ИЛИ ФОТО ТОВАРНЫХ ДОКУМЕНТОВ в 1С. Не требует указания параметров и предварительной настройки. Просто выбираете файл (PDF, JPG, DOC, XLS, HTML и т.д.) выбираете документ 1С и нажимаете кнопку "Распознать и загрузить".

6000 5520 руб.

04.06.2019    101390    296    173    

312

1С:Архив

Документооборот и делопроизводство (СЭД) Платформа 1С v8.3 Платные (руб)

"1С:Архив" – это универсальная система, обеспечивающая надежное долговременное хранение документов с гарантией юридической значимости на неограниченный срок. "1С:Архив" разработан на основе нормативно-правовых актов по архивному делу, поддерживает операции хранения документов – от попадания в архив до уничтожения – и не имеет ограничений на объем хранимых данных. "1С:Архив" сопровождается методологической поддержкой в виде организационных документов по хранению, входящих в состав "Комплекта нормативных документов" к "Методике управления документами и совместной работой", разработанной специалистами фирмы "1С". Использование "1С:Архива" позволяет организовать единое хранилище всех бумажных и электронных документов из разных информационных систем, вести архивный учет в соответствии с требованиями Росархива и снизить нагрузку на учетные системы. Продукт подходит для малых, средних, крупных предприятий и учреждений любых отраслей.

90000 руб.

24.10.2022    4860    4    1    

4

Легкий документооборот (+чат-бот для Telegram)

Документооборот и делопроизводство (СЭД) Мессенджеры и боты Учет документов Платформа 1С v8.3 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия государственного учреждения 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 Платные (руб)

Расширение для согласования справочников и документов в конфигурациях "1С: Бухгалтерия 3.0", "Управление нашей фирмой", "1С ERP Управление предприятием", "Бухгалтерия государственного учреждения". Ролевая адресация, условная маршрутизация, последовательное и параллельное согласование, уведомление о новых задачах на почту, блокировка объектов в зависимости от статуса, запрет проведения в зависимости от статуса, автозапуск процессов согласования, отчеты по исполнительской дисциплине. Не требуется снятие конфигурации с поддержки. Настройка без программирования. Версия для 1cfresh.com. Сертификат 1С-Совместимо.

14900 руб.

15.11.2018    27795    25    48    

57

Групповая выгрузка и загрузка файлов XML для ЭДО в каталог по приказу №820 ФНС (для УТ 10.3/11, КА2, ERP2, БП3, УНФ, УПП1.3, Розница2.3). Поддержка маркировки. Прослеживание товаров.

Документооборот и делопроизводство (СЭД) ЭДО и ОФД Файловый обмен (TXT, XML, DBF), FTP Обмен с ГосИС Платформа 1С v8.3 1С:Управление торговлей 10 1С:Розница 2 1С:Управление производственным предприятием 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Россия Бухгалтерский учет Платные (руб)

Групповая выгрузка файлов XML для ЭДО в каталог по приказу №820 ФНС для Контур.Диадок, СБИС и других провайдеров ЭДО. Поддержка УНФ 1.6, УНФ 3.0 Поддержка УТ 10.3, УПП 1.3 Поддержка Розница 2.3 Добавлена выгрузка непосредственно из документа

18000 руб.

15.12.2022    6427    106    25    

14

ЭДО: организация архива оригиналов первичных документов, комплексный отчет по ошибкам

Документооборот и делопроизводство (СЭД) ЭДО и ОФД Учет документов Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Мощный, единый инструмент для решения всех проблем, связанных с переходом на ЭДО. Экономит бумагу и время - организует архив оригиналов первичных документов прямо в базе 1С, в прикрепленных файлах к соответствующим документам. С помощью комплексного отчета по ошибкам в ЭДО позволяет выявить и исправить все возможные ошибки - ошибочно сопоставленные документы, не подписанные документы, подписанные, но не загруженные в 1С документы. Автоматически сопоставляет не сопоставленные между собой документы. Может работать по расписанию и присылать отчет о состоянии архива/по ошибкам на почту. Взаимодействует напрямую с сервисами Диадок/СБИС, имеет интуитивно понятный интерфейс и учитывает 3-х летний опыт 40+ клиентов.

14880 руб.

17.12.2018    44287    56    51    

71

1С:Бухгалтерия 3.0 ПРОФ + 1С:Документооборот. Модуль интеграции 1С:БП и 1С:ДО (ПРОФ или КОРП)

Обмен между базами 1C Документооборот и делопроизводство (СЭД) Учет документов Платформа 1С v8.3 Бухгалтерский учет 1С:Бухгалтерия 3.0 Бухгалтерский учет Платные (руб)

Бесшовная связь с 1С:Документооборот (КОРП или ПРОФ) - вот что обеспечит Вам и Вашим сотрудникам оперативный доступ и продуктивную работу с документами в учётной системе 1С на базе "1С:Бухгалтерия предприятия 3.0 ПРОФ". Интеграция позволяет экономить до 60% времени на поиск и согласование первичной документации (актов, счетов-фактур, накладных), не говоря уже о других полезных функциональных возможностях: создании и запуске бизнес-процессов, работе с электронной почтой, штрихкодировании документов и многом другом.

30000 руб.

23.05.2017    53781    34    67    

41
Комментарии
В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
1. duck 400 22.06.19 16:47 Сейчас в теме
Добрый день! А на каких условиях используются решения ABBYY? Это ведь наверняка коммерческие продукты.
2. trim89 107 23.06.19 01:43 Сейчас в теме
(1) добрый. Пользователь сам достаёт продукт Abby любым удобным для него способом и пользуется им сам. Лишних пару млн для покупки ядра, для встраиванья в решение, у меня нет.
3. batonbrest 7 01.12.19 18:18 Сейчас в теме
Добрый день!

Выбрал вариант работы через API.

попробовал распознать счет из pdf летит ошибка, взял картинку png из статьи, та же ошибка:

Распознование Текста, {ОбщийМодуль.ДлительныеОперации.Модуль(534)}: Ошибка при вызове процедуры ВыполнитьМетодКонфигурации общего модуля ДлительныеОперации.
Ошибка разбора XML: - [1,1]
Фатальная ошибка:
Extra content at the end of the document


не подскажите в чем может быть проблема?
4. trim89 107 02.12.19 00:38 Сейчас в теме
(3) Добрый. Я это тестировал больше полугода назад. Тогда они отсылали ответ в формате xml. Возможно что-то поменялось. В декабре-январе хотел перетестировать данную функцию.
5. batonbrest 7 02.12.19 22:49 Сейчас в теме
(4) Я как то получить код модуля можно? Можете в личку ответить...
6. trim89 107 03.12.19 02:21 Сейчас в теме
(5)нельзя. Имеет смысл перенести получение самого файла в общий модуль, а парсер оставить в закрытом. Как закончу, на яндекс диск выложить и в личку написать. Выложил бы тут, но я не знаю как бесплатным сделать. Всегда требует какую то сумму.
7. batonbrest 7 03.12.19 22:26 Сейчас в теме
(6) да, было бы неплохо получить доступ хотя бы к коду получения файла. Парсер сделаем сами, под свои требования. С нетерпением буду ждать от вас ссылку на яндекс диск. Спасибо большое)
8. LineykaSBK 5 14.04.21 09:14 Сейчас в теме
Прежде чем скачивать есть пару вопросов.
1. Для какой(их) конфигурации(ий) предназначена обработка?
2. Если установлен продукт Abby на клиенте, то будет ли работать на актуальных, на сегодня версиях конфигураций?
10. trim89 107 14.04.21 12:54 Сейчас в теме
(8)
1) Это не обработка, а расширение. Оно полностью автономно. В теории подходит к любой конфе на управляемых формах.
2) Расширение с помощью abbyy конвертирует изображение в html, что бы сохранилась структура, а потом парсит html типовыми средствами. Конвертирует через команды cmd. То есть конкретно с конфигурацией это не связано.

Кстати, это ооочень устаревшая штука. У меня пока руки не дошли тут всё исправить. Актуальная инфа тут http://www.docent.software
9. trim89 107 14.04.21 12:52 Сейчас в теме
11. LineykaSBK 5 15.04.21 15:32 Сейчас в теме
посмотрел. надежнее, быстрее обмениваться документами среди пользователей 1С в формате xml через пиктограмму конверт у любого документа 1С. быстрее и надежнее в будущем своих контрагентов перевести на обмен в формате xml. Спасибо за информацию.
12. trim89 107 11.01.22 04:33 Сейчас в теме
Снял защиту, выкладываю в общий доступ.
Оставьте свое сообщение