Кодирование строки из Unicode в UTF-8

25.02.19

Интеграция - WEB-интеграция

Мой вариант обработки не использует никаких внешних компонент, при этом кодирование учитывает полную спецификацию UTF-8. Таким образом, в отличие от представленных здесь аналогов, можно преобразовывать не только кириллицу, а любой текст в юникоде.

Скачать исходный код

Наименование Файл Версия Размер
Строка из Unicode в UTF-8 (быстрое Dec->Hex)
.epf 7,18Kb
145
.epf 7,18Kb 145 Скачать
Строка из Unicode в UTF-8
.epf 6,75Kb
47
.epf 6,75Kb 47 Скачать

В поисках решения проблемы передачи в POST/GET-запросы не-ASCII текста из 1С, так и не смог найти универсальной и алгоритмически красивой версии. Поэтому скромно представляю на ваш суд свой вариант.

upd: Изменил способ конвертации Dec->Hex, в результате прирост скорости около 60%.

См. также

Интеграция Альфа Авто 5 / Альфа Авто 6 и AUTOCRM / Инфотек

Сайты и интернет-магазины WEB-интеграция Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление торговлей 11 Автомобили, автосервисы Россия Управленческий учет Платные (руб)

Интеграционный модуль обмена между конфигурацией Альфа Авто 5 и Альфа Авто 6 и порталом AUTOCRM. Данный модуль универсален. Позволяет работать с несколькими обменами AUTOCRM разных брендов в одной информационной базе в ручном и автоматическом режиме.

36000 руб.

03.08.2020    15958    13    18    

13

SALE! 10%

Автоматическая загрузка файлов (например, прайс-листов) из электронной почты, FTP, HTTP, их обработка и выгрузка на FTP (на сайт) и для других целей

Прайсы WEB-интеграция Ценообразование, анализ цен Файловый обмен (TXT, XML, DBF), FTP Автомобили, автосервисы Оптовая торговля, дистрибуция, логистика Управленческий учет Платные (руб)

Программа с заданным интервалом времени (или по ручной команде) скачивает файлы (например, прайс-листы поставщиков) из различных источников: письма электронной почты, FTP или HTTP-адреса, и сохраняет их в каталог упорядоченной структуры. При этом извлекает файлы из архивов, может переименовывать файлы и менять их формат (csv, xls, txt). Можно настроить выгрузку обработанных файлов на сайт (через FTP-подключение). Программа будет полезна компаниям, у которых есть большое количество поставщиков и/или прайс-листы поставщиков обновляются часто (необязательно прайс-листы, файлы могут быть любого назначения). Собранные таким образом актуальные версии прайс-листов можно выгрузить с помощью программы себе на сайт (или на любой FTP-сервер) или выполнить другие необходимые задачи.

28000 25200 руб.

28.05.2015    84910    26    51    

50

Заполнение по ИНН или наименованию реквизитов контрагента по данным сайта ФНС

Обмен с ГосИС WEB-интеграция Платформа 1С v8.3 Управляемые формы 1С:Комплексная автоматизация 1.х 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Управление производственным предприятием 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия государственного учреждения 1С:Документооборот 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Платные (руб)

Обработка является альтернативой механизму, разработанному фирмой 1С и заполняющему реквизиты контрагента по ИНН или наименованию. Не требуется действующей подписки ИТС. Вызывается как внешняя дополнительная обработка, т.е. используется, непосредственно, из карточки контрагента. Заполнение по ИНН или наименованию реквизитов контрагента по данным сайта ФНС (egrul.nalog.ru) для БП 2.0, БП 3.0, БГУ 1.0, БГУ 2.0, УТ 10.3, УТ 11.x, КА 1.1, КА 2.x, УПП 1.x, ERP 2.x, УНФ 1.5, УНФ 1.6, УНФ 3.0, ДО 2.1

2400 руб.

28.04.2016    89042    163    216    

319

[Расширение] БОР-Навигатор.Культура

Зарплата Бюджетный учет WEB-интеграция Обмен с ГосИС Платформа 1С v8.3 Сложные периодические расчеты 1С:Зарплата и кадры государственного учреждения 3 Государственные, бюджетные структуры Россия Бюджетный учет Платные (руб)

Расширение конфигурации, включающее в себя объекты, необходимые для подготовки и сдачи отчета "Штатная численность" системы "БОР-Навигатор.Культура" в программе "1С:Зарплата и кадры государственного учреждения", редакция 3.1.

8400 руб.

01.02.2019    25894    9    0    

7

Интеграция с сервисом vetmanager

WEB-интеграция Платформа 1С v8.3 Бухгалтерский учет 1С:Бухгалтерия 3.0 Бытовые услуги, сервис Платные (руб)

Внешняя обработка разрабатывалась для загрузки документов из Ветменеджер в 1С: Бухгалтерия 3.0

12000 руб.

02.02.2021    16500    42    49    

23
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. pbazeliuk 1960 30.01.13 20:12 Сейчас в теме
Осталось только оптимизировать, подозреваю что не такая уж и быстрая конвертация.

А неразрывный пробел правильно отработается? Код символа - 160.
2. Windsor77 14 30.01.13 23:46 Сейчас в теме
Ну не знаю, конечно. Не успел ещё замер производительности сделать, в ближайшее время хочется сравнить.

Поскольку 1С-ка выдаёт настоящий код символа в Юникоде, а исключения из кодируемых составляют только указанные в спецификации символы (пробел, кстати, можно и исключить, но ведь стандарт подразумевает отображение в виде "+") - т.е. буквы латиницы, цифры и несколько знаков - остальные символы переводятся именно в соответствии с алгоритмом, суть которого примерно та же, что и Base64. Поэтому и неразрывный пробел должен совпасть. Вы не проверяли?
3. Windsor77 14 31.01.13 01:00 Сейчас в теме
Замер производительности показал, что 40-45% времени пожирает конвертер dec->hex...
4. ksb 31.01.13 07:26 Сейчас в теме
Подскажите несведущим чем Unicode отличается от UTF-8
поему у них обоих ведь 2 байта на символ, что позволяет закодировать все вариации
5. andrewks 1370 31.01.13 07:45 Сейчас в теме
(4) ksb, в юникод - 2 байта на символ. в utf-8 - от 1 и выше байт на символ (английские - 1, русские - 2, азиатские вообще по 3-4 занимают)
Windsor77; +1 Ответить
6. ksb 31.01.13 09:12 Сейчас в теме
(5) Пасиб. а ещё вопрос
а как проги разбирают, что в потоке символов utf-8 этот символ займет 1 байт а другой 4 байта, они разделены каким то маркером ?
7. andrewks 1370 31.01.13 09:17 Сейчас в теме
8. AlX0id 31.01.13 10:23 Сейчас в теме
А если в Base64 загнать - не вариант?
9. Windsor77 14 31.01.13 10:45 Сейчас в теме
Конечно не вариант, ведь Base64 - это поток бинарной информации, тупо "порубленный" по 6 бит; с UTF-8 другая история, там зависимость нелинейная.
10. Windsor77 14 31.01.13 11:47 Сейчас в теме
Изменил способ конвертации Dec->Hex (берётся прямо из строки, значение - как индекс нужной пары символов), в результате прирост скорости около 60%.
15. dctvghbdtn 28.07.21 18:18 Сейчас в теме
(10) Можете опубликовать свой вариант? Спасибо.
16. Windsor77 14 11.08.21 13:37 Сейчас в теме
(15) Процедура в этой обработке: "Строка из Unicode в UTF-8 (быстрое Dec->Hex)"
11. Gida 05.02.13 12:30 Сейчас в теме
А символы @#$%^&*() разве не являются безопасными? в статье из википедии пишут что сиволы 00-7F однозначно соответствуют ASCII
12. Windsor77 14 30.04.13 12:34 Сейчас в теме
(11) Gida, этот конвертер написан для использования в POST-запросах и URL, поэтому и диапазон "безопасных" символов сужен до разрешённого в URL-ах.
13. TUTSIC923 21.08.18 18:56 Сейчас в теме
русские символы я так понял , он не конвертирует ...
14. Windsor77 14 22.08.18 07:40 Сейчас в теме
(13) Наоборот, конвертирует НЕ ТОЛЬКО русские символы, но и все остальные.
Оставьте свое сообщение