Звуковое управление в 1С 8.3

16.03.21

Разработка - Разработка внешних компонент

В данной статье описано создание библиотеки для звукового управления (выполнение команд голосом) для платформы 1С 8.3. Задача была поставлена так, чтобы модуль функционировал непосредственно на клиенте 1С, осуществляя управление формами, и взаимодействовал с интерфейсом.

Звуковое управление в 1С 8.3

В данной статье описано создание библиотеки для звукового управления (выполнение команд голосом)  для платформы 1С 8.3. Задача была поставлена так, чтобы модуль функционировал непосредственно на клиенте 1С, осуществляя управление формами и взаимодействовал с интерфейсом.

Результат тестовых испытаний на примере нескольких команд:

 

 

Примененные технологии:

NAudio (open source .NET audio library) 

Google Cloud Speech-to-Text

ML.Net

 

Первая задача, которую нужно было решить - выбор API для распознавания речи. 

Вторая - разработать механизм работы с записью звука. 

Третья - как получить команду, которую потом можно будет превратить в функцию 1С и вызвать ее. 

Четвертая - как это импортировать в 1С и обеспечить работу модуля на клиенте.

 

Выбор Speech Recognition API

Казалось бы, первое решение возможно самое простое, ведь у нас есть Windows Speech Recognition, да и подавляющее количество пользователей 1С работают в клиентах под ОС от компании Майкрософт. Примеров работы довольно много, причем готовых приложений под Visual.Net - бери, пользуйся. Один минус - нет поддержки русского языка.

Альтернативы? Либо взять облачное решение или воспользоваться open source готовым решением, которое можно будет установить на клиентском компьютере. Я выбрал первый вариант, хотя у него есть и минусы - да, вам нужен доступ в Интернет для его работы. Но и у второго варианты они есть - увеличивается дистрибутив, вычислительные затраты (вычисления, связанные с распознаванием речи ложатся на клиентский компьютер), при обновлении модуля распознавания необходимо будет обновлять его, тогда как в облачных решениях эволюция библиотеки происходит без вашего участия.  Еще один минус облачных решений - они как правило платные. Но если мы возьмем модуль от Google, то плата скажем скорее символическая.

 

 

Конечно, при дальнейшей разработке этого модуля никто не мешает сделать выбор чем пользоваться предоставив выбор пользователю и сделав поддержку разных API: установить локально бесплатную библиотеку для работы с речью или пользоваться облачным сервисом за небольшую плату. 

Решение от Google требует регистрации в их сервисе, я не буду здесь описывать этот процесс, пройдя по ссылке вы  разберетесь что надо делать (вкратце - зарегистрироваться в Google, подключить Google Cloud, добавить Google Speech-To-Text API, получить ключ, прописать путь к нему в глобальных переменных системы). Да у пользователя это может вызвать легкий ступор. Но без ключа система работать не будет. Хотя это требуется сделать всего один раз.

Итак. После того как ключ установлен, мы можем работать с API. 

 

Запись и обработка звука

Здесь мы должны сделать примерно такой же механизм, которым пользуются многие владельцы Android-смартфонов, когда они  выполняют  голосовой поиск Google.

Вы нажимаете кнопку (горячую клавишу), говорите. Получаете результат. Ваша речь распознается и формируется запрос в поисковую систему. В нашем случае - выполняется команда в 1С.

Сам гугловский API не работает с записью, это API для работы с уже сформированным файлом/буфером а как вы его сформируете - ваша задача.

С решения этой задачи началась разработка библиотеки классов для 1С. То есть задача номер 4 (как это импортировать в 1С) была решена в пользу технологии COM. 

В качестве инструмента был выбран Visual.Net 2019. Язык программирования  - С#

Лучшим решением для обработки звука была признана библиотека NAudio - за простоту, понятность, наличие хорошо разобранных примеров.

 

 

В NAudio есть два ключевых класса, которые управляют записью. WaveFileWriter - класс, который собственно пишет звук, и WaveInEvent, класс, который определяет качество звука и работает с событиями. У него обработчик событий  DataAvailable - он вызывает определенную вами функцию, если получены записанные с микрофона данные. Именно здесь придется решить важную задачу: а что собственно писать для передачи в Google?

Во-первых, мы знаем старт записи - он вызывается по нажатию кнопки, но НЕ знаем когда запись нужно остановить. 

Во-вторых, следует ли писать паузы и тихую, едва разборчивую речь?

И первая и вторая проблема была решена через анализ громкости записи. Чтобы отсечь тихую речь, а также обозначить конец команды достаточно получить уровень громкости в дате, полученной по событию DataAvailable, чтобы брать из буфера, где лежит запись, только то, что нам нужно. То есть если пользователь сказал что-то, допустим “Открой оборотно-сальдовую ведомость” и замолчал, то мы отсчитаем от последнего события DataAvailable с нужным нам уровнем громкости 1 секунду и генерируем событие RecordingStopped, чтобы остановить запись.

А если пользователь говорит без остановки? Тогда введем ограничение на длину записываемой команды. Скажем, 4 секунды. И останавливаем запись по времени.

После остановки записи нам остается отправить наши данные в Google через его класс SpeechClient (метод Recognize) и ждать ответа.

 

Обработка полученной строки

Итак, мы получили распознанную строку, преобразованную в текст. Например “Открой оборотно-сальдовую ведомость”, или “ журнал документов реализаций покажи”. Как нам получить команду, то есть строковую команду “ОткрытьОСВ” или “ОткрытьЖурналРеализаций”? Ведь ту или иную команду можно сказать по разному, и порядок слов будет произвольный.  Например “открыть журнал реализаций”, “покажи расходные накладные”, или “открой список документов продаж” должно приводить к одной и той же команде: “ОткрытьЖурналРеализаций”.

Заставить пользователя выучить список регулярных выражений? Можно, а если подойти гибче и допустить множество вариантов одного и того же действия? Можно конечно сделать поиск по ключевым словам с кучей условий. Это не очень удобное решение, особенно если учесть что количество команд может быть велико. 

Здесь было принято решение воспользоваться технологиями машинного обучения, и дать возможность пользователям самими расширять варианты произношения команд.

В рамках этой статьи описать принципы работы текстового классификатора будет сложно, поэтому ограничимся очень простым объяснением. С помощью алгоритмов машинного обучения мы должны натренировать модель, которая знает наборы различных фраз и выражений, сопоставленные с определенной командой. То есть тренировочные данные будут выглядеть так, если мы говорим о команде “ЖурналРеализаций”, где слева - варианты (признаки) (X), а справа - ответы (Y).
 

журнал реализаций;ЖурналРеализаций

список реализаций;ЖурналРеализаций

журнал реализации;ЖурналРеализаций

журнал реализацией;ЖурналРеализаций

журнал расходных накладных;ЖурналРеализаций

журнал расходные накладные;ЖурналРеализаций

список продаж;ЖурналРеализаций

список документы продаж;ЖурналРеализаций

список документов продаж;ЖурналРеализаций

список расходных документов;ЖурналРеализаций

список расходных накладных;ЖурналРеализаций

расходные накладные;ЖурналРеализаций

 

А по ОСВ, скажем, так:

оборотно-сальдовая;ОборотноСальдоваяВедомость;

оборотно-сальдовую;ОборотноСальдоваяВедомость;

оборотку;ОборотноСальдоваяВедомость;

оборотка;ОборотноСальдоваяВедомость;

оборотно-сальдовая ведомость;ОборотноСальдоваяВедомость;

осв;ОборотноСальдоваяВедомость;

сальдовку;ОборотноСальдоваяВедомость;

сальдовка;ОборотноСальдоваяВедомость

бухгалтерский отчет по счетам;ОборотноСальдоваяВедомость

И т. д.

Принцип работы этой модели достаточно прост. Итак, мы получаем распознанную фразу от Google Cloud. Следующим шагом мы выбрасываем из этой фразы все ненужные нам слова, то есть те, которых нет в нашем словаре команд (список всех слов, используемых в модели). То есть из фразы “ А покажи мне, пожалуйста, ну. Ммм...эээ, ну, расходных накладных журнал, например” останется “расходных накладных журнал”.  И потом уже просим нашу модель найти наиболее подходящий ответ (команду).Так как порядок слов для нас не важен, то программа выдаст нам очевидный ответ - “ЖурналРасходныхНакладных”.

Чтобы добавить свой вариант команды или новую команду, достаточно внести в файл тренировки данных нужные строки и вызвать функцию звукового модуля для перестройки модели (с запуском 1С модель перестраивается при старте).

 

 

Сначала это было протестировано в Python,  в виду быстроты разработки, потом было переделано на ML.NET на С# и включено в библиотеку управления звуком. Это было сделано для того чтобы не перегружать библиотеку, написанную на C# питоном. (Я не поклонник IronPython).

Итак, после распознания речи наша звуковая библиотека готова передать в 1С и саму распознанную строку и команду (если она найдена).

Отдельно стоит упомянуть размышления о работе с периодами и отборами. Особенно с датами. Скажем, нам нужно сформировать ОСВ по определенному счету и за определенный период. Здесь простого решения не получится. Скажем можно сделать еще одну модель, которая будет распознавать регулярные выражения дат - “с ..по”. “ за текущий год, “ за год”,  “ за месяц” и т.д.  И уже далее осуществлять поиск периодов работая со строкой аналитически, зная какое выражение здесь указано.

Работа в 1С

После того как библиотека классов была создана в .NET и зарегистрирована в Windows,  мы можем использовать ее в 1С через технологию COM на уже клиенте. 

В 1С было реализовано исполнение несколько команд для демонстрации работы с формами и простыми отборами (по периоду, номер счета в ОСВ).

 

 

Для получения результата на клиенте запускается Обработчик Ожиданий, который проверяет результат выполнения команды.

 

 

Возвращаемое значение - строка текста и команда, если она распознана. Команде соответствовала функция в 1С. Например:

 

 

Сначала для теста была написана внешняя обработка и события обрабатывались по кнопке. Вот так это работало:

 

 

Но в реально работающей модели это неудобно. Не будем же мы заставлять пользователя каждый раз переключаться в окно голосового управления чтобы нажать кнопку.

Тогда было принято решение сделать глобальную команду через расширение и ее выполнение по комбинации горячей клавиши, что позволяет работать с модулем фоновом режиме. То есть для голосовой команды вы нажимаете комбинацию клавиш (например CTRL+W) и говорите что вы хотите от модуля:

Дальнейшая разработка

Планы по дальнейшей разработке следующие: 

Доработка механизма регулярных выражений для работы с отборами по датам.

В расширении 1С для этого модуля создать справочник шаблонов команд, что позволит разработчику добавлять новые исполнение команд без помощи конфигуратора.

Реализация многоуровневых команд со сложным отбором (запуск отчетов с отбором по полям, создание и заполнение документов).

speech recognition звуковое управление com объекты machine learning voice control. машинное обучение

См. также

SALE! 50%

Потоковая предметная фотосъемка c удалением фона (Canon & Nikon)

Нейросети 8.3.6 1С:Управление торговлей 11 Управленческий учет Платные (руб)

Обработка подключения фотокамер Canon и Nikon к Управление торговлей 11.4 для потоковой загрузки фотографий в карточки товаров с автоматическим удалением фона

22800 11400 руб.

24.06.2021    9194    2    3    

11

Заполнение описания номенклатуры с помощью ChatGPT

Мастера заполнения Нейросети Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление торговлей 11 Платные (руб)

Расширение для заполнения описания номенклатуры с помощью модели ИИ ChatGPT. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ. Прошло аудит на 1cfresh.com. Версия для автоматического заполнения

5000 руб.

13.03.2023    15938    42    49    

74

Медиадисплей. Рекламный информационный монитор для покупателя.

Разработка внешних компонент POS терминал Рабочее место Розничная торговля Платформа 1С v8.3 1С:Комплексная автоматизация 1.х 1С:Управление торговлей 10 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Розничная и сетевая торговля (FMCG) Рестораны, кафе и фаст-фуд Реклама, PR и маркетинг Управленческий учет Платные (руб)

Монитор покупателя может отображать текущую покупку на кассовом месте, показывать видеорекламу, баннеры, во время простоя разворачивать рекламу на весь экран. Можно использовать в качестве графического меню-борда в кафе и видеовывески. Управление выводом на телевизор через hdmi-приставку на базе Windows или Android. В качестве устройства отображения можно использовать Android-планшеты, фоторамки с Android, монитор любого Windows-компьютера, доступного по сети. Настраивается ЛЮБОЙ ДИЗАЙН экрана!

16800 руб.

30.05.2017    52099    34    69    

43

Заполнение описания номенклатуры с помощью GigaChat

Нейросети Мастера заполнения Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Платные (руб)

Расширение для заполнения описания номенклатуры с помощью модели ИИ GigaChat от Сбера. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ.

5000 руб.

08.11.2023    1410    5    0    

13

Внешняя компонента для сканирования (замена TWAIN-компоненты БСП) (Native Win 32/64)

Разработка внешних компонент Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Внешняя компонента позволяет работать c TWAIN-совместимым оборудованием (сканерами, камерами) . Полностью совместима со стандартной TWAIN-компонентой из БСП и может применяться как ее замена без изменения вызовов, при этом может работать с 64-разрядной платформой, а так же имеет расширенную функциональность, например, сохранение результата непосредственно в PDF без использования сторонних утилит. Прекрасно работает на сервере, тонком клиенте и веб-клиенте (проверена работа в браузерах Google Chrome, Mozilla Firefox и Microsoft Internet Explorer).

2400 руб.

12.05.2020    26242    131    99    

83

Внешняя компонента для подключения 1С к телефонии Asterisk

Разработка внешних компонент Телефония, SIP Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Внешняя компонента выполнена по технологии Native API для 1С 8.х, обеспечивает доступ к программным АТС Asterisk (FreePBX, Elastix) через AMI интерфейс. Через него можно управлять многими функциями Asterisk (определение номеров, перевод звонков, набор телефона и т. д.)

2400 руб.

04.05.2018    44974    117    64    

60

Внешняя компонента печати PDF (Native Win 32/64)

Разработка внешних компонент Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Внешняя компонента позволяет печатать PDF файлы непосредственно из 1С, не используя при этом сторонних программ. Прекрасно работает на сервере, тонком клиенте и веб-клиенте. Основана на проекте PDFium из состава проекта Chromium/Chrome

1500 руб.

17.09.2018    35076    104    123    

111

Мастер создания внешних компонент 1С (технология COM) для DELPHI 6/7/8/2005/2006/2007/2008/2010/XE/XE2/XE3

Разработка внешних компонент Платформа 1С v8.3 Платные (руб)

Средство для сверхбыстрой разработки внешних компонент 1С:Предприятия 7.7 и 8 по технологии COM на всех версиях DELPHI, начиная с 6.

2000 руб.

28.03.2013    53997    35    14    

68
Комментарии
В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
1. Aleksandr_prof 191 17.03.21 05:31 Сейчас в теме
А я долго не мог понять логотип и его связь с темой. Я изначально увидел силуэт человека (плечо - острый нос - ирокез). Оказалось, что нужно было смотреть не на жёлтое, а на красное.
dadel; olya1990; DrAku1a; velemir; +4 Ответить
3. velemir 82 17.03.21 07:36 Сейчас в теме
(1) Да, логотип не очень удачный.)
2. Aleksandr_prof 191 17.03.21 05:31 Сейчас в теме
Тематика - интересная, необычная. Много работы проделано как при разработке, так и при создании статьи! Автору плюс.
4. D_e_X_T_e_R 572 17.03.21 08:09 Сейчас в теме
Прикольно, спасибо.
5. informa1555 2646 17.03.21 08:21 Сейчас в теме
Приветствую! А тут нет команды активации получается? Ну типа "Ок, Google", "Алиса", "Привет BMW" и т.д. То что кнопкой запускается это ладно, а как понять что команду уже можно диктовать? У меня например говоришь фразу "Привет 1С" или что подобное, она отвечает, потом говоришь команду "Привет, 1С": простейший голосовой ассистент для 1С. UPD: с исходниками Тут понятно что программа готова прослушать команду, а у вас я по видео не понял когда этот момент наступает...

PS. "писи-софт" - это что такое?
check2; olya1990; velemir; +3 Ответить
6. velemir 82 17.03.21 08:38 Сейчас в теме
(5) Я видел вашу работу, отлично! И по comp vision ваши разработки очень вдохновляют (есть тоже идеи проектов).

Нажимаешь на кнопку (сейчас это cntr+w на клавиатуре) и говоришь, пока клавиша (хот кей) удерживается (там появляется иконка "Запись команды", то запись идет. Как на телефоне. Запись останавливается после паузы или по времени. Ключевых слов не надо.

Да можно и в режиме "Алисы" сделать со стартом помощника по кодовому слову. Для этого есть заготовки в библиотеке классов. Но это не всегда удобно (пользователь может просто говорить, например по телефону или с коллегой, а активированный голосовой помощник будет пытаться что-то делать если будет встречать фразы команд). То есть режима должно быть два. По "хот кею" и в режиме "нон стоп" пока активирован помощник.

"PS. "писи-софт" - это что такое?"

РС СОФТ - это начало нашей новой компании), которая работает на стыке 1С и других технологий, в том числе и машинного обучения.
7. informa1555 2646 17.03.21 08:41 Сейчас в теме
(6) А т.е. пока держишь нажатым - говоришь, отпустил - команда обрабатывается? Тогда да, удобно в принципе!
8. velemir 82 17.03.21 08:43 Сейчас в теме
(7) нажал - говоришь, да. отпускать не обязательно, конец записи сам определится по паузе в речи. это и будет команда.
19. papami 55 17.03.21 10:44 Сейчас в теме
(8)
Это правильная логика. Держать микрофон не всегда оптимально. Особенно, если используется беспроводная гарнитура. Та же Алиса постоянно слушает и сажает батарею.
9. salexdv 2327 17.03.21 08:44 Сейчас в теме
speechkit от Яндекс не пробовали? Это, конечно, субъективно, но мне показалось, что с распознаванием русского у него чуть лучше дела обстоят. Правда и задача у меня была специфическая, нужно было целые и дробные числа распознавать.
11. informa1555 2646 17.03.21 08:47 Сейчас в теме
13. salexdv 2327 17.03.21 08:49 Сейчас в теме
(11) Всё так, но стоит он не сильно много, если не диктовать 24/7. Я за время тестирования потратил целых 70 рублей за 1,5 месяца. В итоге, правда, пришлось от него отказаться, но не из-за денег, а из-за специфики задачи.
14. velemir 82 17.03.21 08:50 Сейчас в теме
(11) Гугл тоже платный). Там лимит есть по времени. Но копейки стоит.
12. velemir 82 17.03.21 08:49 Сейчас в теме
(9) видел. но гугл отлично на русском отрабатывает, по крайне мере особых проблем не наблюдалось.

яндекс тоже можно попробовать, просто опыт работы с гугл апи у меня есть (хотя тут вообще все элементарно).

И вот еще есть open source

https://cmusphinx.github.io/
15. velemir 82 17.03.21 08:51 Сейчас в теме
(9) Яндекс не пробовал, но знаю. Еще есть cmusphinx. Он бесплатный и открытый код.
10. nestokay 62 17.03.21 08:46 Сейчас в теме
Интересная идея, спасибо.
16. salexdv 2327 17.03.21 08:59 Сейчас в теме
Если стоит задача распознавания ограниченного количества команд, можно использовать фейсбуковскую платформу wit.ai. Она бесплатная, но в настройке довольно замороченная. Плюсом её является то, что на выходе для разных команд можно получить один результат. Например, можно настроить так, что для фраз "оборотно-сальдовая ведомость" и "оборотка" на выходе будет "ОСВ". С распознаванием русского у неё, правда, встречаются косяки, но для определенных задач вполне может подойти.
17. velemir 82 17.03.21 09:02 Сейчас в теме
(16) ну у меня так и сделано, что вы можете говорить как угодно , и по натренированной модели программа подыщет то, что лучше всего подходит. хоть "сальдовка", хоть "осв", хоть "бухгалтерский отчет по счетам". причем порядок слов не имеет значение.

это может пригодится еще и в расшифровке более сложных команд в комплексе. скажем " создай документ реализцию с отбором ко контрагенту вася пупкин".
18. salexdv 2327 17.03.21 09:09 Сейчас в теме
(17) Это я понял. Просто написал, как вариант решения подобной задачи, не используя ML.NET. В wit.ai настраиваются и сами фразы и дообучение модели можно выполнить, но мне думаются, что ваше решение лучше распознает фразу "оборотно-сальдовая", всё таки фейсбуковская балалайка немного для другого, типа "Включи свет", "Сделай тише" и т.п. Кроме того она больше ориентирована на английский язык.
21. velemir 82 17.03.21 12:27 Сейчас в теме
(18) Интереснее самому обучить модель, поднять немного свои скилы по ML. Вообще думаю мы скоро увидим время когда ML придет в 1С, и вместо тем о том как "раскрасить колоночки в отчете" мы будем обсуждать программирование 1с-ботов)
25. Yashazz 4709 17.03.21 22:51 Сейчас в теме
(21) Знаете, лет 10-15 назад я мечтал примерно о том же. Но и по сей день самые горящие задачи с востребованными решениями - это "почему себестоимость кривая", "опять на остатках краснота" и, конечно, "у меня все крыжики пропали!!!"
26. velemir 82 18.03.21 09:12 Сейчас в теме
(25)В наших силах приблизить будущее и сделать работу интереснее. Тем более что AI технологии развиваются и безусловно за ними будущее.
20. user621724_Dimav1979 401 17.03.21 10:56 Сейчас в теме
22. hiduk 124 17.03.21 14:06 Сейчас в теме
Это новое слово в науке и технике!
А команда "Сделать всё" поддерживается?:)
23. velemir 82 17.03.21 14:47 Сейчас в теме
(22) если хорошо вложиться в ИИ то можно сделать очень многое... но это пока размышления.
24. Yashazz 4709 17.03.21 22:49 Сейчас в теме
Забавная, но, имхо, бесполезная игрушка. Так, попробовать свои силы да поиграть в обучение ИИ. Ещё понимаю, озвучка исходящей из 1С информации, но вот автоматизировать входящий поток, тем более не данные, а управление... Крайне сомнительно.

Как мне однажды сказал шеф склада и логистики одной крупной конторы, "да мне проще пятерых тупых практикантов нанять, чем эти ваши голосовые команды делать".
27. strelec13 20 18.03.21 11:51 Сейчас в теме
(24)
"да мне проще пятерых тупых практикантов нанять, чем эти ваши голосовые команды делать"


Это сколько нужно времени, чтобы каждому из пятерых тупых практикантов каждый раз устные команды давать и при том,
после выполнения очередной устной ПРОСТОЙ команды (на сложные команды, а тем более задачи они тупо не способны),
они тупо будут ждать следующей простой устной или письменной команды :)
28. RealEscander 496 22.03.21 14:45 Сейчас в теме
Кабинет... все что-то бубнят в микрофоны... Забегает чел и на весь кабинет:
Shoutdown... Yes!
29. lunjio 66 16.04.21 14:05 Сейчас в теме
Команды - "Закрой все окна", "Закрыть все окна", "Закрой окна" будут одинаково интерпретироваться ? что-то мне подсказывает, что нет, а посему особой ценности кроме как Just for fun не вижу.
30. velemir 82 17.04.21 17:21 Сейчас в теме
(29) "Что-то" вам подсказывает неверно, потому что в данной разработке использованы и технологии машинного обучения, где на каждую команду есть много интерпретаций , которые можно пополнять. Причем в произвольном порядке слов. Так что не только "закрой окна" но и "окна закрой" - будет интерпретироваться одинаково.
31. vec435 15 29.04.21 21:42 Сейчас в теме
в принципе сказать фразу "Эска, создай документ "Отпуск" с движениями по регистру "как я провел" и по регистру "этим летом" с реквизитами "шашлыки,девочки,пиво,море" и услышать в ответ фразу "какой тип у реквизита пиво?" - не так и сложно наверно
32. DeniNikitin 36 22.10.21 16:04 Сейчас в теме
Здравствуйте!
А есть ли готовая библиотека naudio или надо самому что-то делать?
33. DeniNikitin 36 22.10.21 16:06 Сейчас в теме
Плохо что нету в виде готовой разработки с dll и примером в 1с и.т.д.
34. Global__IT 264 30.03.23 13:46 Сейчас в теме
Крутанская вещь, пробовал такую штуку сделать, но не смог.
Применение в моем случае - быстрый поиск по каталогу для менеджеров по продажам. Т.е. пока разговариваю с клиентом, осущ поиск и возможно накидывается номенклатура в счет ил коммерческое предложение
35. Global__IT 264 30.03.23 13:47 Сейчас в теме
(34) Причем можно будет добавить обучение, на предмет того, если не нашла по фразе, то манагер подсказал что это и сразу записалось в правильные ответы.
36. check2 354 15.04.23 10:04 Сейчас в теме
За идею и реализацию 5, но немного дёгтя в бочку мёда: такой сервис нативный уже есть в 23й платформе - https://speech.1c.ai/apps/#demoapp , причём преимущество 23й платформы это умение распознавать речь даже при отсутствии интернета.
UPD: Хотя нужно быть честным: Автор публиковал это в 21м году, тогда про 23ю платформу и про поддержку речевых функций в ней ничего ещё не было слышно.. Первое упоминание было в инф письме №30109 от 23.12.2022
Оставьте свое сообщение