Редактирование PDF-файла по данным базы

1. pentanom 25 26.09.16 13:53 Сейчас в теме
Есть PDF-прайс-лист поставщика (с ценами и картинками). Хотелось бы в этом файле заменить цены на наши.
Если просто, то пересчитать цены поставщика по некой формуле.
Если сложнее, то брать цены из базы сопоставляя товар по артикулу.
Такое возможно ?
+
По теме из базы знаний
Ответы
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
2. SheremetevaValentina 26.09.16 14:14 Сейчас в теме
(1) pentanom, PDF формат это картинка. Как вы ее собираетесь программно редактировать? В общем случае нужно делать распознавание текста, изымать нужную информацию, затем после некоторого расчета перерисовывать нужные места. Не слишком ли сложно? На мой взгляд, проще иметь в базе соответствующую номенклатуру с загруженными картинками и прочей необходимой информацией, формировать прайс и сохранять его в любом формате, в том числе PDF, благо платформа позволяет.
Во всяком случае я еще не встречала такого фокуса - редактирование имеющегося PDF - файла средствами 1С
+
5. Denis_CFO 48 26.09.16 14:58 Сейчас в теме
(2) SheremetevaValentina,
PDF формат это картинка
в корне не верно. Вот здесь: Вики подробно описано. Однако, сканировать изображения и сохранять их в документ с расширением PDF, тоже многие делают. А вот правильно собранный PDF документ парсится средствами 1С. Вот здесь обработка: Обработка распознает (читает) PDF- файл. И кто мешает распознать файл, потом выставить туда свои цены и экспортировать в pdf?
+
7. SheremetevaValentina 26.09.16 15:04 Сейчас в теме
(5) Denis_CFO, век живи, век учись. Не нужно было, так и не интересовалась никогда. На досуге изучу, вдруг юзеры тоже попросят цены из пдф достать :)
+
3. pentanom 25 26.09.16 14:20 Сейчас в теме
Но вроде бы PDF можно рассматривать как текстовый файл (https://habrahabr.ru/post/69568/)...
Или я что-то не так понял :(
+
4. SheremetevaValentina 26.09.16 14:44 Сейчас в теме
(3) pentanom, ну так то да, открыть файл формата PDF в текстовом редакторе получилось. На выходе - набор символов, по большей части кракозябр (см картинку). Будете делать анализ сих кракозябр? Итог - см. выше. Попытка программного распознавания с последующим редактированием дороже и проблематичней, нежели создание нового PDF. Кстати, после любого программного распознавания рекомендуется проверить на правильность распознавания. А в данном случае еще и редактирование - т.е. вероятность ошибки повышается
+
6. pentanom 25 26.09.16 14:58 Сейчас в теме
(4) SheremetevaValentina, Есть еще способ: попросить поставщика сделать файл с нашими ценами.
Это не шутка. Просто я не знаю какие отношения у руководства с поставщиком.
+
9. SheremetevaValentina 26.09.16 15:06 Сейчас в теме
(6) pentanom, вам выше прислали ссылочку на чтение пдф средствами 1с. Попробуйте, вдруг это как раз ваш вариант. Ну и дописать вставку своих данных.... А вообще не вариант попросить поставщика присылать в табличном формате? Вам проще будет
+
8. olegmedvedev 65 26.09.16 15:04 Сейчас в теме
(3) pentanom, разбирать PDF - можно, а вот как собрать обратно, да если он у вас с картинками((((
по теме ссылки:
http://forum.infostart.ru/forum26/topic102380/
файл="C:\Doc187.pdf";
Объект= новый ИзвлечениеТекста(файл);
ТекстФ=Объект.ПолучитьТекст();
Сообщить(ТекстФ);


Для работы нужно установить Adobe PDF IFilter v6.0 ( http://www.adobe.com/support/downloads/thankyou.jsp?ftpID=2611&fileID=2457 )

Вытягивает все одной строкой, но разобрать можно.
(с) ch-15

http://infostart.ru/public/138484/


использует xpdf
На практике использую ее так. Эту обработку включил в конфигурацию, процедуру из формы прописал в модуле, как экспортную функцию с параметром полное имя файла. И из любого места конфигурации вызываю ее для поиска серийного номера который спрятан в тексте pdf файла.
+
10. Denis_CFO 48 26.09.16 15:07 Сейчас в теме
(8) olgerd666,
а вот как собрать обратно
. Выводите свой прайс (отчёт) в табличный документ и печатаете на виртуальный принтер PDF. Посмотрите в БП 3.0 - это штатная возможность.
+
12. olegmedvedev 65 26.09.16 15:10 Сейчас в теме
(10) Denis_CFO, я не это имел ввиду))) можно же и типовыми средствами в пдф сохранить табличный документ.
Если у ТС документ содержит часть скана/либо сложно структурированный пдф типа прайс листа с шапкой, изображениями номенклатуры и деление на разные листы:
1) шапка
2) Наш замечательный магазин
3) первая часть прайса
4) блабла
4) заключительная часть прайса
то собирать его будет очень трудозатратно
+
13. Denis_CFO 48 26.09.16 15:12 Сейчас в теме
(12) olgerd666, Поставщик у ТС же собрал его...
+
15. olegmedvedev 65 26.09.16 15:15 Сейчас в теме
(13) Denis_CFO,
ладно видимо я чтото недопонял по теме((

просто как я понял смысл:
1) у поставщика пдф с картинками и текстом - он его сформировал из своих данных
2) мы получили пдф
3) распарсили его на текстовые строки
4) даже собрали в таблицу
5) даже макет можем собрать как у поставщика
6) как выдернуть из пдф картинки?
+
11. SheremetevaValentina 26.09.16 15:09 Сейчас в теме
(8) olgerd666, можно создать свой макет аналогичного формата и в него писать данные из прочтенного файла и пересчитанные цены. Это в том случае, если файл всегда одинаковый. В крайнем случае, если количество макетов ограниченное
+
14. olegmedvedev 65 26.09.16 15:13 Сейчас в теме
(11) SheremetevaValentina,
данные из прочтенного файла и пересчитанные цены

это текст.это понятно. а вот как ТС правильно смаштабировать там картинки из файла и добиться универсальности - ...(((
доп (10)
+
17. SheremetevaValentina 26.09.16 15:17 Сейчас в теме
(14) olgerd666, Так если вы собрали свой табличный документ, то его средствами платформы в PDF сохранить. Еще и по почте отправить, если требуется
+
18. olegmedvedev 65 26.09.16 15:20 Сейчас в теме
(17) SheremetevaValentina, (15) как выдернуть из пдф картинки, как у поставщика.
я пока нашел методы как вытащить из пдф строку. окей - мы её можем обработать.
картинки - если только наши из базы брать - а не поставщика.

(16) Pavel_nv,
это хорошо. а если надо обработать много таблицу много строк с пересчетом на "наши" цены. не сидеть же вручную заполнять.
либо из файнридера в промежуточный формат - потом в рассчеты - потом в файл
правда с картинками - все равно - непонятно как
+
19. Denis_CFO 48 26.09.16 15:26 Сейчас в теме
(18) olgerd666, а по-сути вопроса скажу так. Работать надо. Халявы не бывает. Взять прайс, автоматически заменить цены и продать по схеме: цена поставщика + мои проценты. Это называется работой? Наймите за половину процентов девочку и пусть сидит и набивает прайсы. Хоть кто-то работать будет... "Одна большая красная кнопка, которая решит все мои проблемы" - это миф.
+
22. olegmedvedev 65 26.09.16 15:31 Сейчас в теме
(19) Denis_CFO, кхм. вообще вопрос задал не я, а pentanom(1)
Работать надо. Халявы не бывает. Взять прайс, автоматически заменить цены и продать по схеме: цена поставщика + мои проценты.

это вы вообще к чему? к посту ТС - тогда, да. окей

меня лично интересовало, что ТС выдвинул тему, то что ему надо не просто распарсить файл (пусть будет без сканов), а с картинками.
как получить текстовую строку - я представляю. картинки - нет.
вот это меня интересовало, а не
"Одна большая красная кнопка, которая решит все мои проблемы"

[offtop]
ИС бесплатное решение получить

блин. увидел интересную тему - поделился своими ссылками по извлечению текста, спросил, что "а как с картинками сделать?"
а тут обвинения в халяве((( [/offtop]
+
23. Denis_CFO 48 26.09.16 15:34 Сейчас в теме
(22) olgerd666, лично к Вам вопросов нет. Вопрос больше к заказчикам топик-стартера. А вам огромное спасибо за Ваши комментарии.
+
24. olegmedvedev 65 26.09.16 15:35 Сейчас в теме
(23) Denis_CFO, тогда в свою очередь извиняюсь за недопонимание с моей стороны(
+
20. Denis_CFO 48 26.09.16 15:27 Сейчас в теме
(18) olgerd666, ещё и на ИС бесплатное решение получить... Топик-стартер - Вы (Ваши заказчики) из какого региона?
+
21. SheremetevaValentina 26.09.16 15:30 Сейчас в теме
(20) Denis_CFO, автор вопроса пользы не получил, зато для нас развивашка.
+
25. pentanom 25 27.09.16 11:17 Сейчас в теме
(20) Denis_CFO, Совок ! Это про халяву !
+
16. Pavel_nv 16 26.09.16 15:16 Сейчас в теме
FineReader умеет распознавать PDF, отредактировать, сохранить в PDF снова.
+
Внимание! Тема сдана в архив

Для получения уведомлений об ответах подключите телеграм бот:
Инфостарт бот