Команда Алтайского государственного университета «ASU_TEAM» стала обладателем диплома лауреата (4 место из 16 команд) и отмечена жюри за интересное решение и нахождение новых признаков для решения предложенной задачи.
Первое место заняла команда Высшей школы экономики «MegaQuant», второе — команда Финансового университета при Правительстве РФ «Data Wizards» и третье — команда Московского городского университета «Парсики».
«Мы решили, что надо участвовать в DATA-хакатоне, поскольку он организовывался в партнерстве с Университетским консорциумом исследователей больших данных, членом которого наш университет является уже несколько лет. Сначала был предварительный отбор: из более чем 30 заявок эксперты отобрали к участию в основном этапе 16 команд университетов РФ. А затем с 16 по 19 февраля команда Алтайского государственного университета «ASU_TEAM» приняла участие в основной части Московского студенческого DATA-хакатона, проходившего на базе Московского городского педагогического университета».
Заведующий кафедрой информатики Алтайского государственного университета Денис Козлов рассказывает
В состав команды классического вуза вошли:
- Александр Болгов, студент магистратуры института математики и информационных технологий и руководитель команды
- Валентин Карев, студент бакалавриата института цифровых технологий, электроники и физики
- Шахзод Нуридинов, студент бакалавриата института математики и информационных технологий
- Александр Пикуль, студент бакалавриата института цифровых технологий, электроники и физики
В жюри конкурса вошли:
- Дмитрий Звонарев, заместитель директора многофункционального студенческого центра МГПУ;
- Роман Куприянов, начальник управления информационных технологий и сервисов МГПУ;
- Борис Ярмахов, доцент департамента информатизации образования Института цифрового образования МГПУ;
- Павел Винар, руководитель отдела научных исследований и развития систем распределенного хранения данных компании MAXIMUM EDUCATION;
- Ольга Проневич, старший ученый отдела научных исследований и развития распределенных систем БД компании MAXIMUM EDUCATION;
- Александр Хвостов, директор по связям с образовательным сообществом компании MAXIMUM EDUCATION;
- Александра Данилова, руководитель спецпроектов компании ГлобалЛаб;
- Андрей Чертихин, преподаватель учебного центра ARENADATA.
В ходе соревнований командам на выбор предлагались 3 задачи от компании MAXIMUM EDUCATION:
- 1) анализ визуальных особенностей преподавателей на онлайн-уроках и их связь с образовательными метриками.
- 2) оценка влияния активности пользователя на образовательные метрики.
- 3) прогноз вероятности расторжения договора клиентом – задача оттока пользователей образовательного портала.
«Команда нашего университета остановилась на третьей задаче. Были получены данные от организаторов, выполнены их фильтрация, очистка и заполнение пропусков. Самое сложное в этой задаче, на наш взгляд, заключалось в объединении нескольких баз данных с совершенно разной информацией. Так, например, ученик анализируемой онлайн-школы мог заключать договор на обучение в разных учебных группах, но при этом расторгать договор на обучение только с одной-двумя группами и продолжать учиться в других, некоторые выгруженные базы данных имели сведения только о пользователях, а информацию о группе было возможно получить, только анализируя другие две таблицы. И большую часть времени соревнования мы занимались подготовкой данных для дальнейшей работы модели машинного обучения. Затем была построена и обучена модель машинного обучения для прогнозирования вероятности оттока учащихся онлайн-школы».
Валентин Карев рассказывает
После обучения модели, которая имела достаточно высокую точность предсказания риска расторжения договора, студенты АлтГУ добавили новый признак – «среднее время неактивности» пользователя, которое возможно было рассчитать, имея в базе данных время записи результата прохождения теста или посещения занятия. И добавление этого признака увеличило точность модели на несколько процентов.
18 февраля результаты участников презентовались жюри. Во время защит и презентаций решений было очень интересно смотреть решения других команд, делится Валентин Карев, некоторые были совершенно не похожи на наше, но по-своему тоже хорошие, что помогло нам увидеть другие стороны и подходы к решению подобных задач.