«Сбербанк» проводит соревнование в области ИИ с главным призом в 1 млн рублей

0. Infostart 19754 14.09.17 17:36 Сейчас в теме
Крупнейший коммерческий банк запустил конкурс проектов в области машинного обучения и искусственного интеллекта Sberbank Data Science Journey, общий призовой фонд которого составит 2 млн рублей.




Перейти к новости

Комментарии
В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
1. panvartan 14.09.17 20:00 Сейчас в теме
Практика решения серьезных задач за еду плавно перекочевала из 1с на различные хакатоны и конкурсы.
shard; alxarz; papami; wonderboy; +4 Ответить
2. nickperel 5 14.09.17 23:32 Сейчас в теме
"Должен понимать человеческий язык". Язык зверей видно уже заборот сбербанком ранее. 1.5 месяца и 2 лимона.
Завезили бы им уже галоперидол на все деньги. Для всей комиссии.
3. protexprotex 120 15.09.17 07:58 Сейчас в теме
В общем, самим лень или не могут написать такого бота. Отдают на аутсортинг :-) - дешевле банку два лимона отдать чем от своих программеров мучить прогу :-)
4. TODD22 18 15.09.17 08:00 Сейчас в теме
На хабре похожий конкурс от сбера обсуждался. Там приводили выдержку из правил участия. Все исходные коды и права на разработки обязаны передать банку.
5. PerlAmutor 129 15.09.17 08:35 Сейчас в теме
(4) Когда начал читать новость сразу об этом подумал. Похоже на развод лохов или аукцион на сайте госзакупок. У меня знакомые в сбере работали лет 7, сам часто имел дело с продуктами сбера и тех.поддержкой. Доверия, а тем более уважения, к ним у меня нет никакого. Репутация у банка ниже плинтуса. Единственный его плюс - 50% и 1 акция принадлежат государству.
6. protexprotex 120 15.09.17 08:42 Сейчас в теме
Была бы сумма - лимонов 5, и времени полгода - можно было бы на рекуррентной нейронной сети построить бота. Ну и обучающую выборку надо поболее - хотя - бы миллиард записей типа вопрос - ответ. На 100000 - слишком мала выборка. Ну или аугментацию выборки надо делать - но с этим сложнее - аугментацию графики намного легче делать чем предложения. Можно было бы взяться.
7. monkbest 115 15.09.17 09:08 Сейчас в теме
Нормальная тема, т.к. лям в руки это неплохой годовой доход многих специалистов. Нельзя на это смотреть, как на лям за проект по разработке чего-либо. В ляме за проект спецу дойдет на руки 100к в лучшем случае, остальное налоги, прибыль владельца, аренда офиса, зарплата менеджеров....

К тому же конкурс - риск, победитель будет, а результат победителя, хоть и лучший, не факт, что полностью удовлетворит потребность банка

Правда с этого приза придется заплатить НДФЛ:)
8. TODD22 18 15.09.17 09:21 Сейчас в теме
(7)
Нормальная тема, т.к. лям в руки это неплохой годовой доход многих специалистов.

Это если задачу сделает один специалист. Но там скорее всего рассчитывают на команду. При чём команду людей имеющих опыт в решении подобных задача, а это довольно дорогие специалисты. И тогда миллион не выглядит уже таким хорошим вознаграждением.
shard; KSy; Muzik92; +3 Ответить
9. trntv 25 15.09.17 09:53 Сейчас в теме
(8) Важнее, что победившая команда сразу будет обеспечена хорошей работой в своей сфере
10. TODD22 18 15.09.17 09:57 Сейчас в теме
(9) А что это гарантируется условиями конкурса?
11. Glebis 13 15.09.17 10:01 Сейчас в теме
Ещё один аналог Сири хитрый Греф решил создать всего за 2млн деревянных, собрав все наработки отечественных программистов. Хитро...
15. monkbest 115 18.09.17 07:30 Сейчас в теме
(11) ничего хитрого, все нейронные сети уже придуманы как несколько десятков лет назад. Их давно уже разжёвывают в университетах (нормальных). Написано море фреймворков.

Самое сложное это выбрать удачные параметры для нейронной сети и написать удачный алгоритм (функцию) преобразования большого текста в небольшие числа. Дальше огромные бюджеты подобных проектов вырастают из обучения сети, ей надо скормить кучу эталонных текстов. Яндекс например для этого запустил проект, где можно заработать анализируя тексты своей головой, а потом результаты твоих анализов отдаются сети как образец для обучения. Человеку 50копеек за текст, системе 1 эталон.
За 2 месяца собрать нормальную выборку образцов - нереально и видимо это не входит в задачу, а значит это не система под ключ, а заготовка, которую надо докручивать, настраивать и упорно тестирвать
12. lefthander 15.09.17 10:01 Сейчас в теме
Мне кажется за создание подобных алгоритмов в сумме призовых должно быть на три нуля больше. Нет?
13. protexprotex 120 15.09.17 10:04 Сейчас в теме
(12) Ну хотя бы на один - и то гуд будет :-)
16. monkbest 115 18.09.17 07:34 Сейчас в теме
(12) если бы им еще понадобилось собрать самим выборку для обучения, обучить, протестировать и так несколько раз подряд, пока не получат результат, потом долго тестировать и допиливать, то да. Тут же надо только алгоритм, одну попытку, обучил на готовой выборке и сдал работу, за тебя проверят и поставят оценку :) это даже не запуск в опытную эксплуатацию, не альфа и не бета тестирование, а проверка работоспособности
17. protexprotex 120 18.09.17 12:31 Сейчас в теме
(16)"Тут же надо только алгоритм, одну попытку"
- при обучении нейронной сети - нет алгоритма как такового - есть просто алгоритм обучения - подстройка весовых коэффициентов сети - например, методом обратного распространения ошибки - если данные один и те же, и все будут использовать реку рентные сети (а так и будет скорее всего у всех) - то и результат будет примерно один и тот же - (+- проценты) а это они и сами могут - фреймворков для нс. сетей - куча. У них задача, скорее всего, в том, чтобы к этой сетке прикрутить еще алгоритм коррекции ошибок сети - а вот тут уже и думать надо :-)
18. monkbest 115 19.09.17 08:53 Сейчас в теме
(17) алгоритм самой сети - да, их уже полно готовых. Задание параметров сети, установка начального состояния это не алгоритм, согласен. Обучение сети тоже не создание алгоритма, т.к. обратная связь это тоже всего лишь подбор коэффициентов влияния.
А вот как сунуть текст на вход - это и есть та часть, которую надо не настроить готовую, а придумать и спрограммировать, ведь на вход сети можно подавать вектор или матрицу чисел, а текст произвольной длины таковым не является.
19. TODD22 18 19.09.17 09:00 Сейчас в теме
(18)
А вот как сунуть текст на вход - это и есть та часть, которую надо не настроить готовую, а придумать и спрограммировать, ведь на вход сети можно подавать вектор или матрицу чисел, а текст произвольной длины таковым не является.

Для этого есть библиотеки обработки естественных языков и тд. Там то же ничего придумывать не надо.

Основная как мне кажется проблема, это научить понимать контекст.
21. protexprotex 120 19.09.17 15:44 Сейчас в теме
(19) Да, точно - с контекстом у всех сетей основная проблема сейчас.
25. monkbest 115 20.09.17 08:49 Сейчас в теме
(21) у яндекса нет проблем, их поиск "Королев" работает на ура
20. protexprotex 120 19.09.17 15:44 Сейчас в теме
(18) "А вот как сунуть текст на вход - это и есть та часть, которую надо не настроить готовую, а придумать и спрограммировать, ведь на вход сети можно подавать вектор или матрицу чисел, а текст произвольной длины таковым не является" - ну, на самом деле текст как раз и можно сунуть на вход сети - для этого рекурентная сеть и существует. LSTM - сеть - как раз для этого.
24. monkbest 115 20.09.17 08:47 Сейчас в теме
(20)LSTM - там в вектор чисел превращается слово и слова последовательно суются на вход. После каждого слова функция меняется. Получается, в зависимости от положения слова в тексте получим разное его влияние на результат, а на самом деле это не так. Фразы:
"я хучу пиво"
"пива я хочу"
идентичны, но для LSTM это разная последовательность входов с огромной вероятностью даст разный результат

в LSTM слишком много комбинаций при которых она выдает не то, поэтому и обучить её гораздо сложней. Для точного результат нужно больше нейронов, больше слоев и больше обучающих примеров.

Прежде чем совать текст на вход сети, надо провести его анализ, выделить подлежащие сказуемые, ключевые слова их взаимосвязь. Уменьшить словарь текста заменив все синонимами, отсортировать в едином синтаксическом формате, а потом уже совать это на вход в сеть.
Если мы хотим, чтобы функция сети сделала предварительный анализ за нас, то в этой функции должно быть больше многочленов и дольше будем искать коэффициенты этих многочленов. Если мы знаем часть реальной функции, то надо ей воспользоваться, чтобы уменьшить черный ящик, который мы моделируем нашей сетью.
27. protexprotex 120 20.09.17 11:55 Сейчас в теме
(24)"я хучу пиво"
"пива я хочу" - дайте на вход сети эти два одинаковые по смыслу предложения - и на выходе сети установите в 1 (я очень упрощенно пишу) - а для "не хочу я пива" и "пива я не хочу" - установите на выходе 0. Обучайте сеть. И удивитесь что будет, я Вас уверяю. А если таких "синонимов" будет порядка миллиард, то Вы еще больше удивитесь способности сети. :-)
22. protexprotex 120 19.09.17 15:47 Сейчас в теме
(18)
т.к. обратная связь это тоже всего лишь подбор коэффициентов влияния
- это не так - обратная связь это не подбор коэффициентов влияния (точнее это не совсем так) - это передача выходного состояния нейрона на себя или на нейрон с предыдущего слоя (для нейронов послойной сети).
23. monkbest 115 20.09.17 08:26 Сейчас в теме
(22) из нейрона выходят не состояния, а числа. Это число умножается на весовой коэффициент и идет куда угодно: на следующий слой, на слой ниже, в самого себя.
Нейроны/шмейроны - все термины.
Дали числа на вход, применили математическую функцию, получили числа ответа. Любая функция может быть приближенно описана комбинацией умножений и сложений, чем больше членов в приблизительной функции тем ближе она к реальной. Нейрон - член этой функции, который складывает входы и умножает на свой коэффициент. нейронная сеть - огромный многочлен.

Почему-то я никогда не смотрел на сети, как на сети, а просто как на очуметь какую большую но очень простую функцию ВеторЧиселОтвета = f(ВекторЧиселНаВходе). А обратная связь - та же функция вычисления коэффициентов первой в зависимости от отклонений результата от правильного ответа.

Дальше начинается магия с тыканьем пальцем в небо, т.к. реальная функция неизвестна по определению. Сколько надо членов (нейронов) в приблизтельной функции чтобы она была максимально точна? Какая степень каждого члена (количество слоев)? Как подрать функцию обратной связи? Какие задать коэффициенты членам (начальное состояние сети)?
KapasMordorov; +1 Ответить
14. capitan 2305 17.09.17 12:32 Сейчас в теме
Алгоритм простой как два байта об асфальт:
Условие: Посетитель присутствует.
Тогда произнести фразу :
Вариант 1: В каком отделении карту получали -туда и обращайтесь
Вариант 2: Ваше заявление на рассмотрении - зайдите через две недели
Выбор ответа можно производить случайным образом
Профит!
shard; torbeev; protexprotex; +3 Ответить
26. dnikolaev 174 20.09.17 11:07 Сейчас в теме
Оставьте свое сообщение
Вакансии
Ведущий Инженер - программист 1С
Новокузнецк
зарплата от 100 000 руб.
Полный день

Программист 1C
Москва
Полный день

Главный специалист (Программист 1с)
Подольск
зарплата от 100 000 руб. до 110 000 руб.
Полный день

Программист
Москва
зарплата от 200 000 руб. до 230 000 руб.
Полный день

Программист 1С
Ростов-на-Дону
зарплата от 140 000 руб. до 180 000 руб.
Полный день