Редактирование PDF-файла по данным базы

1. pentanom 25 26.09.16 13:53 Сейчас в теме
Есть PDF-прайс-лист поставщика (с ценами и картинками). Хотелось бы в этом файле заменить цены на наши.
Если просто, то пересчитать цены поставщика по некой формуле.
Если сложнее, то брать цены из базы сопоставляя товар по артикулу.
Такое возможно ?
По теме из базы знаний
Ответы
В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
2. SheremetevaValentina 26.09.16 14:14 Сейчас в теме
(1) pentanom, PDF формат это картинка. Как вы ее собираетесь программно редактировать? В общем случае нужно делать распознавание текста, изымать нужную информацию, затем после некоторого расчета перерисовывать нужные места. Не слишком ли сложно? На мой взгляд, проще иметь в базе соответствующую номенклатуру с загруженными картинками и прочей необходимой информацией, формировать прайс и сохранять его в любом формате, в том числе PDF, благо платформа позволяет.
Во всяком случае я еще не встречала такого фокуса - редактирование имеющегося PDF - файла средствами 1С
5. Denis_CFO 48 26.09.16 14:58 Сейчас в теме
(2) SheremetevaValentina,
PDF формат это картинка
в корне не верно. Вот здесь: Вики подробно описано. Однако, сканировать изображения и сохранять их в документ с расширением PDF, тоже многие делают. А вот правильно собранный PDF документ парсится средствами 1С. Вот здесь обработка: Обработка распознает (читает) PDF- файл. И кто мешает распознать файл, потом выставить туда свои цены и экспортировать в pdf?
7. SheremetevaValentina 26.09.16 15:04 Сейчас в теме
(5) Denis_CFO, век живи, век учись. Не нужно было, так и не интересовалась никогда. На досуге изучу, вдруг юзеры тоже попросят цены из пдф достать :)
3. pentanom 25 26.09.16 14:20 Сейчас в теме
Но вроде бы PDF можно рассматривать как текстовый файл (https://habrahabr.ru/post/69568/)...
Или я что-то не так понял :(
4. SheremetevaValentina 26.09.16 14:44 Сейчас в теме
(3) pentanom, ну так то да, открыть файл формата PDF в текстовом редакторе получилось. На выходе - набор символов, по большей части кракозябр (см картинку). Будете делать анализ сих кракозябр? Итог - см. выше. Попытка программного распознавания с последующим редактированием дороже и проблематичней, нежели создание нового PDF. Кстати, после любого программного распознавания рекомендуется проверить на правильность распознавания. А в данном случае еще и редактирование - т.е. вероятность ошибки повышается
6. pentanom 25 26.09.16 14:58 Сейчас в теме
(4) SheremetevaValentina, Есть еще способ: попросить поставщика сделать файл с нашими ценами.
Это не шутка. Просто я не знаю какие отношения у руководства с поставщиком.
9. SheremetevaValentina 26.09.16 15:06 Сейчас в теме
(6) pentanom, вам выше прислали ссылочку на чтение пдф средствами 1с. Попробуйте, вдруг это как раз ваш вариант. Ну и дописать вставку своих данных.... А вообще не вариант попросить поставщика присылать в табличном формате? Вам проще будет
8. olegmedvedev 64 26.09.16 15:04 Сейчас в теме
(3) pentanom, разбирать PDF - можно, а вот как собрать обратно, да если он у вас с картинками((((
по теме ссылки:
http://forum.infostart.ru/forum26/topic102380/
файл="C:\Doc187.pdf";
Объект= новый ИзвлечениеТекста(файл);
ТекстФ=Объект.ПолучитьТекст();
Сообщить(ТекстФ);


Для работы нужно установить Adobe PDF IFilter v6.0 ( http://www.adobe.com/support/downloads/thankyou.jsp?ftpID=2611&fileID=2457 )

Вытягивает все одной строкой, но разобрать можно.
(с) ch-15

http://infostart.ru/public/138484/


использует xpdf
На практике использую ее так. Эту обработку включил в конфигурацию, процедуру из формы прописал в модуле, как экспортную функцию с параметром полное имя файла. И из любого места конфигурации вызываю ее для поиска серийного номера который спрятан в тексте pdf файла.
10. Denis_CFO 48 26.09.16 15:07 Сейчас в теме
(8) olgerd666,
а вот как собрать обратно
. Выводите свой прайс (отчёт) в табличный документ и печатаете на виртуальный принтер PDF. Посмотрите в БП 3.0 - это штатная возможность.
12. olegmedvedev 64 26.09.16 15:10 Сейчас в теме
(10) Denis_CFO, я не это имел ввиду))) можно же и типовыми средствами в пдф сохранить табличный документ.
Если у ТС документ содержит часть скана/либо сложно структурированный пдф типа прайс листа с шапкой, изображениями номенклатуры и деление на разные листы:
1) шапка
2) Наш замечательный магазин
3) первая часть прайса
4) блабла
4) заключительная часть прайса
то собирать его будет очень трудозатратно
13. Denis_CFO 48 26.09.16 15:12 Сейчас в теме
(12) olgerd666, Поставщик у ТС же собрал его...
15. olegmedvedev 64 26.09.16 15:15 Сейчас в теме
(13) Denis_CFO,
ладно видимо я чтото недопонял по теме((

просто как я понял смысл:
1) у поставщика пдф с картинками и текстом - он его сформировал из своих данных
2) мы получили пдф
3) распарсили его на текстовые строки
4) даже собрали в таблицу
5) даже макет можем собрать как у поставщика
6) как выдернуть из пдф картинки?
11. SheremetevaValentina 26.09.16 15:09 Сейчас в теме
(8) olgerd666, можно создать свой макет аналогичного формата и в него писать данные из прочтенного файла и пересчитанные цены. Это в том случае, если файл всегда одинаковый. В крайнем случае, если количество макетов ограниченное
14. olegmedvedev 64 26.09.16 15:13 Сейчас в теме
(11) SheremetevaValentina,
данные из прочтенного файла и пересчитанные цены

это текст.это понятно. а вот как ТС правильно смаштабировать там картинки из файла и добиться универсальности - ...(((
доп (10)
17. SheremetevaValentina 26.09.16 15:17 Сейчас в теме
(14) olgerd666, Так если вы собрали свой табличный документ, то его средствами платформы в PDF сохранить. Еще и по почте отправить, если требуется
18. olegmedvedev 64 26.09.16 15:20 Сейчас в теме
(17) SheremetevaValentina, (15) как выдернуть из пдф картинки, как у поставщика.
я пока нашел методы как вытащить из пдф строку. окей - мы её можем обработать.
картинки - если только наши из базы брать - а не поставщика.

(16) Pavel_nv,
это хорошо. а если надо обработать много таблицу много строк с пересчетом на "наши" цены. не сидеть же вручную заполнять.
либо из файнридера в промежуточный формат - потом в рассчеты - потом в файл
правда с картинками - все равно - непонятно как
19. Denis_CFO 48 26.09.16 15:26 Сейчас в теме
(18) olgerd666, а по-сути вопроса скажу так. Работать надо. Халявы не бывает. Взять прайс, автоматически заменить цены и продать по схеме: цена поставщика + мои проценты. Это называется работой? Наймите за половину процентов девочку и пусть сидит и набивает прайсы. Хоть кто-то работать будет... "Одна большая красная кнопка, которая решит все мои проблемы" - это миф.
22. olegmedvedev 64 26.09.16 15:31 Сейчас в теме
(19) Denis_CFO, кхм. вообще вопрос задал не я, а pentanom(1)
Работать надо. Халявы не бывает. Взять прайс, автоматически заменить цены и продать по схеме: цена поставщика + мои проценты.

это вы вообще к чему? к посту ТС - тогда, да. окей

меня лично интересовало, что ТС выдвинул тему, то что ему надо не просто распарсить файл (пусть будет без сканов), а с картинками.
как получить текстовую строку - я представляю. картинки - нет.
вот это меня интересовало, а не
"Одна большая красная кнопка, которая решит все мои проблемы"

[offtop]
ИС бесплатное решение получить

блин. увидел интересную тему - поделился своими ссылками по извлечению текста, спросил, что "а как с картинками сделать?"
а тут обвинения в халяве((( [/offtop]
23. Denis_CFO 48 26.09.16 15:34 Сейчас в теме
(22) olgerd666, лично к Вам вопросов нет. Вопрос больше к заказчикам топик-стартера. А вам огромное спасибо за Ваши комментарии.
24. olegmedvedev 64 26.09.16 15:35 Сейчас в теме
(23) Denis_CFO, тогда в свою очередь извиняюсь за недопонимание с моей стороны(
20. Denis_CFO 48 26.09.16 15:27 Сейчас в теме
(18) olgerd666, ещё и на ИС бесплатное решение получить... Топик-стартер - Вы (Ваши заказчики) из какого региона?
21. SheremetevaValentina 26.09.16 15:30 Сейчас в теме
(20) Denis_CFO, автор вопроса пользы не получил, зато для нас развивашка.
25. pentanom 25 27.09.16 11:17 Сейчас в теме
(20) Denis_CFO, Совок ! Это про халяву !
16. Pavel_nv 16 26.09.16 15:16 Сейчас в теме
FineReader умеет распознавать PDF, отредактировать, сохранить в PDF снова.
Оставьте свое сообщение
Вакансии
Программист 1С
Кемерово
зарплата от 200 000 руб.
Полный день

Программист 1С
Киров (Кировская обл.)
зарплата от 100 000 руб.
Полный день

Программист 1С
Санкт-Петербург
зарплата от 150 000 руб.
Полный день

Архитектор 1С
Москва
зарплата от 250 000 руб.
Полный день

1С-Программист (интегратор Битрикс24)
Санкт-Петербург
зарплата от 150 000 руб. до 250 000 руб.
Полный день