Студенты Университета науки и технологий МИСИС заняли второе место в хакатоне Avanpost Challenge, организованном предприятием Avanpost, российским разработчиком систем аутентификации и управления доступом к информационным ресурсам и акселератором возможностей при ИНТЦ МГУ «Воробьевы горы». Участники команды MISIS AI Lab разработали инструмент для автоматизированного дообучения нейронной сети, целью которого является применение знаний, полученных в ходе решения одной задачи, к другой целевой проблеме.
Технологию, предложенную студентами Университета МИСИС можно использовать в разных областях, например, для решения задачи классификации медицинских текстов или продуктов в магазине. Во втором случае пользователь может получить всю подробную информацию о товаре, просто сфотографировав его.
Для обучения сети использовались модели трансферного обучения — подраздела машинного обучения, позволяющего использовать накопленный при решении одной задачи опыт для решения другой, аналогичной проблемы. Для решения поставленной задачи был выбран метод fine tuning — дообучения, суть которого заключается в «замораживании» и обучении только последних слоев нейронной сети. Такой подход позволяет не обучать заново всю модель для добавления нового класса, а также не терять важную информацию уже предобученной модели.
«За основу была взята модель resnet50, предобученная на датасете imagenet. У модели resnet50 мы „срезали“ последний слой, потом добавили блок, состоящий из dropout и linear-слоев на n классов, в зависимости от того, сколько нам нужно, заморозили 10 слоев и обучили ее. Бекенд состоит из нескольких асинхронных микросервисов, в котором используется паттерн publisher-subscriber. Благодаря этому нам не нужно сохранять постоянное соединение между пользователем и сервисом. Взаимодействие между микросервисами осуществляется с помощью очереди сообщений RabbitMQ. Фронтенд написан на JavaScript с использованием библиотеки JQuery. Благодаря использованию контейнеризации, наше решение масштабируемо и может быть запущено одной командой на любом сервере», — рассказал о разработке капитан команды Арсений Иванов.
Также участниками была реализована функция поиска изображений по строковому запросу — парсер изображений — для мгновенного получения большого датасета, на котором будет обучаться модель. Демонстрационная версия веб-приложения позволяет добавить новый класс изображений, дообучить на нем модель, а также протестировать ее, сделав прогноз на выбранном изображении.
В состав команды вошли студенты ИТКН НИТУ МИСИС: Арсений Иванов, Анна Плохотнюк, Даниил Волков, Данила Комлев, Даниил Стрижаков, Ярослав Савельев.
Хакатон был направлен на решение задачи в сфере машинного обучения, в частности — в области Computer Vision. Для всех студентов, интересующихся, этой темой, студенческий клуб MISIS AI Lab проводит открытый бесплатный курс по машинному обучению. Слушатели проводят исследования и создают модели нейросетей, обсуждают вопросы машинного обучения, обмениваются интересными наборами данных и участвуют в соревнованиях. Доступ к урокам будет открыт для всех желающих даже после окончания курса.