ABBYY опубликовала исходный код своей библиотеки машинного обучения

23.06.2020      36049

Компания ABBYY выложила на GitHub исходники своей нейросети, используемой для распознания текста. Программный код открыт под свободной лицензией Apache 2.0.

Нейросеть для бизнеса

Библиотека машинного обучения NeoML выложена на GitHub для того, чтобы ускорить развитие облачных, десктопных и мобильных решений, применяющих нейросети. Она позволяет разработчикам дополнять свои приложения новыми возможностями. В ABBYY библиотека используется для продуктов, нуждающихся в компьютерном зрении, обработке естественных языков в структурированных и неструктурированных документах. 

NeoML поддерживает инструменты ONNX, благодаря чему может быть легко интегрирована в сторонние фреймворки. Стандарт поддерживается Microsoft, Facebook и другими компаниями и поэтому полностью совместим с другими решениями организаций. 

Константин Гольдштейн, ведущий эксперт по стратегическим технологиям Microsoft в России, отмечает, что NeoML позволяет программистам получить доступ к ряду возможностей, в которых нуждаются современные бизнес-приложения. Интеграция с ONNX открывает перспективы создания обширной экосистемы разработчиков вокруг проекта ABBYY.

Особенности библиотеки

NeoML поддерживает и классический метод машинного обучения, и глубокий. Библиотека может быть использована в облачной или мобильной средах. Ее нейросети применяют до 100 слоев, а для классического машинного обучения доступно более 20 алгоритмов.

Модели, создаваемые при помощи решения, пригодятся в задачах идентификации, классификации, семантической сегментации, прогнозирования. Например, банковские приложения на основе NeoML могут поддерживать функцию прогнозирования спроса на финансовые услуги. 

Еще одна отличительная черта библиотеки ABBYY – кроссплатформенность. NeoML совместима с устройствами на базе Windows, Linux, macOS, iOS и Android. Расчеты могут производиться и на центральных процессорах, и на графических. При работе с GPU в ОС от Microsoft необходима видеокарта, поддерживающая архитектуру параллельных вычислений CUDA версии 10.2. Для iOS нужен процессор модели A7 или старше. Android-устройства для применения NeoML нуждаются в поддержке API Vulkan 1.0. На macOS и Linux использовать GPU для машинного обучения пока что нельзя. 

Для работы с NeoML необходимо знание С++, Java, Objective C или Swift. Разработчики обещают в скором времени добавить поддержку Python. Внутренние тесты ABBYY продемонстрировали, что скорость библиотеки на задачах обработки изображений превышает аналоги на 15-20%.


Купить продукты ABBYY на Инфостарте


Автор:
Аналитик


Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. Darklight 32 29.06.20 14:06 Сейчас в теме
И можно это теперь как-то прикрутить к 1С? Да ещё и бесплатно?
rbdaurov; +1
3. s22 19 07.07.20 19:22 Сейчас в теме
(1)
И можно это теперь как-то прикрутить к 1С? Да ещё и бесплатно?

Есть TENSORFLOW и отлаженее и есть стыковки со всем и библиотек куча.
Есть Torch по факту он стандарт.

Смысл в этой библиотеке?
+
4. Darklight 32 08.07.20 09:32 Сейчас в теме
(3)Возможно, я не совсем понял для чего применяется данная библиотека. Я себе сразу представил нейросети для распознавания текста :-(

Честно, когда-то давно, интересовался этой темой, на тот момент (около 7-10 лет назад) - отсканированный русский текст (в т.ч. в печатных документах) распознавал относительно сносно только aBBY - у них есть API для программного подключения (на том момент это было OLE-automation, и стоило баснословных денег - намного дороже любой пользовательской интерактивной лицензии), вот я и подумал, что теперь это можно было бы прикрутить к 1С бесплатно.... условно бесплатно - сразу понял, что тут сырой (в смысле RAW) алгоритм - и все рюшечки по его практическому применению для распознавания сложных документов придётся всё-равно прикручивать самостоятельно "сверху" - и это не так уж просто - что в очередной раз задумаешься о покупке готового бизнес-API.

С другой стороны - даже если это всего лишь абстрактное машинное обучение - это тоже хорошо - ибо "своё" "родное" "отечественное" мне вот больше греет душу... чем западное - главное, чтобы не государственное было.... так что будут ждать появления встроенной поддержке нейростетей и машинного обучения в возможно будущей платформе 1С Предприятие 9.5 - лет так через 50 :-] главное дожить и дождаться =/
+
5. s22 19 08.07.20 09:54 Сейчас в теме
(4)
С другой стороны - даже если это всего лишь абстрактное машинное обучение - это тоже хорошо - ибо "своё" "родное" "отечественное" мне вот больше греет душу... чем западное - главное, чтобы не государственное было.... так что будут ждать появления встроенной поддержке нейростетей и машинного обучения в возможно будущей платформе 1С Предприятие 9.5 - лет так через 50 :-] главное дожить и дождаться =/


Удивительно, но ядро библиотеки пишется за неделю и оно будет сравнимо по качеству с имеющимися.
Библиотеки распознавания дофига. Тот же Tesseract. Я использовал его для распознавания в 1с. Сейчас с нейросетями это не проблема.
+
2. frkbvfnjh 787 30.06.20 07:00 Сейчас в теме
Когда встроят в документооборот?
+
Оставьте свое сообщение

См. также

«Сколково» объявил отбор перспективных ИИ-проектов для получения грантов

Новость Искусственный интеллект ИТ-Новость

В 2024 году «Сколково» выделит пилотным проектам в сфере искусственного интеллекта гранты на общую сумму 554 млн рублей. В результате отбора финансирование получат проекты с применением ИИ в областях производства, операционной деятельности и в работе предоставляемых сервисов.

12.04.2024    462    AnastasiaKl    3       

3

В программу подготовки спортивных программистов вошли бег и скорость печати

Новость ИТ-Новость

Пятничное: в России вступил в силу стандарт подготовки по дисциплине «спортивное программирование». В стандарт вошли требования к физическим показателям спортсменов и скорости набора текста.

16.02.2024    696    VKuser24342747    2       

1

Росстандарт утвердил протокол LoRaWAN для интернета вещей

Новость ИТ-Новость

Федеральное агентство по техническому регулированию и метрологии (Росстандарт) утвердило национальный стандарт протокола LoRaWAN RU, таким образом он получил официальный статус. Технология используется для беспроводной передачи данных между устройствами интернета вещей.

19.01.2024    489    VKuser24342747    0       

2

Новый закон откладывает на год вступление в силу изменений в порядок регистрации на сайтах

Новость Законодательство ИТ-Новость

12 декабря вступил в силу Федеральный закон, меняющий срок, к которому все владельцы сайтов должны внести изменения в порядок авторизации пользователей на сайте. Закон вводит переходный период до 1 января 2025 года.

20.12.2023    661    VKuser24342747    2       

1

Вышло крупное обновление для Android Studio

Новость Мобильные приложения ИТ-Новость

Новая версия Android Studio под номером 2023.1 получила имя Hedgehog. Появились возможности контролировать производительность приложений и управлять подключенными устройствами.

07.12.2023    807    VKuser24342747    2       

3

GitHub опубликовал результаты ежегодного исследования проектов с открытым исходным кодом

Новость GitHub ИТ-Новость

GitHub собрал данные об Open Source проектах в рамках ежегодного исследования Octoverse. Компания изучила географию репозиториев, используемые языки программирования и нейросети, а также активность сообщества.

15.11.2023    528    VKuser24342747    1       

2

Некоммерческие проекты смогут получить бесплатный доступ к GigaChat API

Новость ИТ-компания ИТ-Новость

Компания «Сбер» заявила, что будет бесплатно предоставлять доступ к API нейросети для генерации текста GigaChat для некоммерческих проектов. Однако для них будет ограничено число доступных токенов.

01.11.2023    660    VKuser24342747    2       

3

Состоялся релиз свободной среды разработки Geany 2.0

Новость ИТ-Новость Программист

Вышла новая версия Geany 2.0. Обновление затронуло внешний вид программы, расширило поддержку файлов и сторонних проектов, добавило новые способы работы с кодом.

25.10.2023    712    VKuser24342747    0       

1

Минцифры подготовило критерии по выбору оператора реестра провайдеров хостинга

Новость Минцифры ИТ-Новость Роскомнадзор

Минцифры подготовило проект постановления, которое утверждает требования к организации, претендующей на статус оператора реестра провайдеров хостинга.

25.10.2023    385    VKuser24342747    0       

1

Минцифры составило алгоритм действий для компаний, у которых не работает VPN

Новость Минцифры ИТ-Новость

Минцифры подготовило разъяснения для российских организаций, у которых возникли перебои в работе VPN-сервисов для клиентов и сотрудников из-за блокировки запрещенных ресурсов Роскомнадзором.

24.10.2023    636    VKuser24342747    0       

0

«Сбер» объявила о доступности SberLinux OS Server для российских компаний

Новость Импортозамещение ИТ-Новость

«СберТех», дочерняя компания «Сбера», объявила о предоставлении доступа к собственной серверной операционной системе SberLinux OS Server российским компаниям. ОС включена в реестр отечественного ПО.

20.10.2023    895    VKuser24342747    0       

2

Минцифры внесло изменения в проект правил идентификации клиентов веб-хостингов

Новость Минцифры ИТ-Новость Роскомнадзор

Минцифры подготовило изменения в пакет документов, которые устанавливают новые требования для провайдеров хостинга. Ведомство расширило перечень допустимых методов идентификации клиентов.

18.10.2023    472    VKuser24342747    0       

1

Google выпустила финальную версию Android 14

Новость Android Google ИТ-Новость

Google выпустила новую версию мобильной ОС Android 14. Изменения затронули настройки внешнего вида и безопасности. Были расширены возможности камеры и инструментов для хранения данных.

12.10.2023    699    VKuser24342747    0       

1

Яндекс объявил об открытии исходного кода DataLens

Новость Аналитика ИТ-Новость Яндекс

BI-система Yandex DataLens теперь развивается в опенсорс. Код продукта выложен для всех на GitHub. Любой желающий сможет развернуть DataLens на своем железе и доработать его под свои сценарии применения.

03.10.2023    1429    ЕленаЧерепнева    1       

6

Роскомнадзор создаст реестр хостинг-провайдеров

Новость Минцифры ИТ-Новость Роскомнадзор

Минцифры подготовило несколько проектов постановлений, которые утверждают правила ведения реестра поставщиков хостинг-услуг, а также новые требования к провайдерам.

02.10.2023    607    VKuser24342747    0       

1

«СберТех» представил репозиторий GitVerse с ИИ-помощником для написания кода

Новость Импортозамещение ИТ-Новость Программист

«СберТех» начал прием заявок на тестирование веб-сервиса для публикации ИТ-проектов GitVerse. Платформа подходит для разработки программ с открытым и закрытым кодом.

26.09.2023    832    VKuser24342747    2       

1

ИП и юрлица смогут использовать смартфон для создания и замены электронной подписи

Новость ИТ-Новость ФНС Цифровая подпись

ФНС внесла изменения в правила оформления электронной подписи руководителя организации и ИП. Станет возможным продлевать ее и записывать при помощи мобильного устройства.

18.09.2023    438    VKuser24342747    1       

1

Журнал IEEE Spectrum опубликовал рейтинг популярности языков программирования

Новость ИТ-Новость Языки программирования

Журнал Института инженеров электротехники и электроники IEEE Spectrum подготовил рейтинг самых популярных языков программирования в 2023 году. Статистика разделена на три категории.

01.09.2023    1315    VKuser24342747    4       

2

В бета-версии Microsoft 365 появилась поддержка языка Python для Excel

Новость ИТ-Новость Языки программирования

С помощью библиотек и средств визуализации Python можно будет манипулировать данными Excel, а затем использовать полученные результаты в формулах, диаграммах и сводных таблицах.

28.08.2023    667    VKuser24342747    0       

2

Специалисты Калифорнийского университета установили, что боты справляются с CAPTCHA лучше, чем люди

Новость ИТ-Новость

Международная группа исследователей изучила эффективность тестов CAPTCHA. Ученые пришли к выводу, что технология больше мешает людям, потому что боты научились с ней справляться.

24.08.2023    1169    VKuser24342747    23       

2

Google Chrome начнет поддерживать квантово-устойчивые алгоритмы шифрования

Новость Google Безопасность ИТ-Новость

В версии Google Chrome 116 появится поддержка алгоритмов шифрования, устойчивых к попыткам дешифрации при помощи квантовых вычислений. Технология объединяет преимущества классической и инновационной криптографии.

24.08.2023    485    VKuser24342747    0       

1

В реестр российского ПО включен первый комплекс обработки больших данных

Новость Импортозамещение Минцифры ИТ-Новость Реестр ПО

Минцифры внесло в реестр отечественного ПО программно-аппаратный комплекс «Скала-Р», предназначенный для обработки больших данных. Это первый комплекс с таким функционалом, включенный в перечень.

22.08.2023    475    VKuser24342747    0       

1

Microsoft внедрила новые функции в GitHub Copilot и анонсировала Windows Copilot

Новость GitHub Искусственный интеллект

ИИ-помощник для разработчиков GitHub Copilot теперь не только в реальном времени анализирует код, предлагает варианты для его улучшения и помогает найти решение проблем в разработке, но и  показывает ссылки на репозитории, из которых взят код. 

17.08.2023    1170    VKuser24342747    0       

1

В JetBrains разработали ИИ-помощника для аналитиков данных

Новость Аналитика Искусственный интеллект

JetBrains представила нейросеть Ask AI для онлайн-блокнота Datalore. Виртуальный ассистент способен генерировать код на нескольких языках, предлагать доработки и упрощать процесс аналитики данных. 

16.08.2023    672    VKuser24342747    0       

1

Исследование: ChatGPT дает неправильный ответ на половину вопросов о программировании

Новость Искусственный интеллект ИТ-Новость

Чат-бот OpenAI ошибается в 52% случаев, когда отвечает на вопросы по программированию. Однако делает это так убедительно, что пользователи не замечают ошибки. 

14.08.2023    1052    VKuser24342747    5       

3