Многим знакома ситуация: новогодние обещания ходить в спортзал сходят на нет уже к февралю. Команда исследователей из Университета Миссисипи решила подойти к этой проблеме с неожиданной стороны — используя машинное обучение.
Их цель: выяснить, какие именно факторы помогают людям придерживаться режима тренировок, а не бросать занятия спортом.
Возглавили проект двое докторантов — Сонбак Ли и Джу-Пиль Чо (специальность "физическое воспитание") — вместе с профессором Минсу Каном, экспертом в области спортивной аналитики. Команда решила не гадать на пальцах, а опереться на огромный массив данных — около 30 000 опросов из Национального исследования здоровья и питания США (2009-2018 гг.). Но как "переварить" такой объём информации? Тут на помощь и пришло машинное обучение — технология, позволяющая компьютерам самостоятельно находить закономерности и делать прогнозы.
Управлением по профилактике заболеваний США давно установлены чёткие рекомендации: взрослым необходимо не менее 150 минут умеренных нагрузок (быстрая ходьба, лёгкий бег) или 75 минут интенсивных (бег, силовые тренировки) в неделю. Проблема в том, что среднестатистический американец "набирает" лишь два часа спорта в неделю — вдвое меньше нормы. Почему так происходит?
Ли, Чо и Канг решили построить прогностическую модель: на основе анкетных данных они хотели понять, кто с большей вероятностью "дотянет" до спортивных нормативов, а кто "сдуется" через месяц. В анализ включили три блока факторов:
Образ жизни: курение, алкоголь, режим сна, сидячая работа, общее время "сидения" в течение дня.
Компьютер "перелопатил" все эти переменные, выявляя самые значимые. И вот что выяснилось.
Три ключевых фактора
Оказалось, что ровно три показателя всплывали во всех наиболее точных моделях, как бы алгоритм ни "перетасовывал" данные:
При этом Джу-Пиль Чо, ведущий автор работы, признаёт: он ожидал увидеть в топе возраст, ИМТ или расовую принадлежность, но образовательный статус удивил своей силой. Почему? Потому что это управляемый фактор: в отличие от пола или возраста, образование можно повысить, а значит, теоретически — "подтянуть" и физическую активность.
Как учёные добились таких результатов?
Традиционные методы статистики тут не годились — они работают линейно ("если А, то Б"), а в жизни всё сложнее. Машинное обучение, напротив, гибко "ловит" неочевидные связи даже в зашумлённых данных. Из 30 000 опросов исследователи отобрали 11 683 чистых кейса (исключив людей с тяжёлыми заболеваниями и тех, кто плохо заполнил анкеты).
Однако авторы честно указывают на слабое место: данные о спорте брались из самоотчётов. Люди часто приукрашивают реальное положение дел ("занимаюсь спортом каждый день" вместо "хожу в зал три раза в месяц"). Отсюда просьба учёных к будущим проектам: больше объективных замеров (например, через фитнес-трекеры).
Что дальше?
Теперь команда Канга намерена пойти ещё дальше:
Практический выход — Фактический выход работы — помощь фитнес-тренерам и врачам. Теперь они смогут строить тренировки с учётом реального человеческого фактора:
Минсу Канг ещё раз подчёркивает: борьба за здоровый образ жизни — глобальная задача здравоохранения. Если мы научимся предсказывать, кто "сломается" через месяц, а кто пробежит марафон, — медицина станет точнее, а люди — здоровее.
Миссисипский университет или Университет Миссисипи — государственный исследовательский университет в г. Оксфорд, Миссисипи, США. Крупнейший университет штата Миссисипи.