Новости

Специалисты Банка ВТБ смогут использовать новый инструмент для работы с большими данными

15 января 2019

Департамент информационных технологий представил вторую версию инструментария анализа данных на базе JupyterHub, а значит, теперь специалисты ВТБ смогут использовать все самые современные библиотеки для анализа данных и машинного обучения, в том числе с помощью нейросетей. В первую очередь инструмент поможет коллегам из центра больших данных и моделирования, департамента розничных кредитных рисков и департамента розничного CRM и продвижения. 

Инструментарий на базе JupyterHub позволит повысить точность прогнозов и аналитики за счет применения нового класса моделей на базе нейросетей. Сам анализ также должен выйти на качественно новый уровень: специалисты Банка смогут сами писать алгоритмы для создания более сложных и эффективных моделей, в том числе для распознавания лиц и голоса.

Предыдущий релиз системы в сентябре 2018 года фокусировался на создании платформы для тестирования различных подходов к анализу данных, а новый предлагает более удобные для работы версии:

— языка программирования Python;

— движка Spark для подключения к Hadoop-кластеру Банка;

— библиотеки машинного обучения из пакета Anaconda и ряд других библиотек для работы с нейросетями (Tensorflow, Keras, Torch).

«Хотел поблагодарить наших коллег из управления цифровой трансформации и управления администрирования баз данных департамента информационных технологий за хорошо и вовремя сделанную работу. Давно ждали этот инструмент именно с таким наполнением функций, и теперь в Банке появилась возможность быстро работать с действительно большими данными, — прокомментировал член Правления Банка ВТБ Максим Кондратенко. — Раньше были инциденты, связанные с работой с контейнерами аналитических функций, иногда было физически невозможно произвести некоторые расчеты. Команды центра больших данных и моделирования, департамента розничных кредитных рисков, департамента розничного CRM и продвижения (первые пользователи JupyterHub) получили возможность создавать более качественные решения, в том числе анализировать голос, фото и др.».

Напомним, что интерактивная среда разработки JupyterHub, Python, Spark и Anaconda — это стандартный рабочий набор для Data Science-специалистов при работе с данными и моделями.