Возможности искусственного интеллекта: опыт Ивана Исаева в медицине и e-commerce

Доля внедрения ИИ в компаниях по всему миру с начала 2024 года выросла до 73%, сообщили аналитики McKinsey. Искусственный интеллект сегодня обрабатывает данные, создает и распознает изображения, тексты и видео.

Ведущий инженер по машинному обучению компании BrainShells Иван Исаев участвует в разработке решений, которые позволяют ИИ работать быстрее и точнее, а также выполнять задачи, действительно востребованные пользователями. Продукты, созданные с участием Ивана Исаева используют компании Iponweb (Criteo), "Уралхим", МТС и ERG. Кроме того, он реализовал ряд сложнейших проектов для медицинских организаций, направленных на помощь врачам в диагностике травм и опасных заболеваний.

О том, как создаются уникальные решения и почему разработчики по всему миру устраивают соревнования по эффективности своих моделей, Иван Исаев рассказал Pravda.Ru.

— Иван, вы участвуете в разработке уникальных решений для самых разных отраслей — от e-commerce до медицины. Как такие проекты попадают к вам?

— Значительная часть разработок создана через платформу Kaggle — это глобальное сообщество специалистов по анализу данных. На Kaggle компании проводят соревнования: выкладывают задачу, а пользователи по всему миру пытаются найти решение.

Например, я участвовал в соревновании, где требовалось создать ИИ-модель, способную выявлять на МРТ травмы и оценивать их серьезность. Другое соревнование проводила компания Google: ей было нужно решение, которое сократит время тренировки ИИ-модели. Это очень актуальная задача, ведь модель из семейства ChatGPT обучается месяцами, а один час тренировки обходится в несколько тысяч долларов. Соответственно, если сократить время обучения хотя бы на 10%, экономия составит десятки миллионов долларов. За это соревнование я получил золотую медаль на Kaggle. Еще одно "золото" было за модель, которая умеет определять, какой текст написал человек, а какой — сгенерировал ИИ. В обоих случаях за победу были получены денежные призы, а созданный код передан организаторам соревнований для внедрения в производственную среду и использования при решении реальных задач.

— На Kaggle зарегистрированы более 15 млн пользователей. Каким образом при такой конкуренции можно создать решение, которое получит "золото"?

— Чтобы заявиться на турнир, нужно предложить свое решение — то есть написать код. Соревнования длятся несколько месяцев, и работа над проектом идет параллельно с основной деятельностью, поэтому занимает очень много времени.

Например, в проектах, связанных с медициной, химией или биологией, сначала необходимо глубоко погрузиться в специфику — изучить тему с профессиональной точки зрения. Как правило, я обращаюсь к научным публикациям, смотрю, какие методы используют врачи, изучаю принципы работы диагностического оборудования. Так, у меня была задача по диагностике рака на МРТ. Чтобы ее выполнить, мне в принципе нужно было понимать, как на МРТ определить, где находится печень, и как отличить патологию от нормы. Также важно было разобраться, какие открытые ИИ-модели уже существуют в этой области и насколько эффективно они решают поставленную задачу. Только имея личное понимание ситуации, можно разработать модель, которая будет реально выполнять поставленные задачи.

В соревнованиях свои решения представляют две-три тысячи участников. В некоторых случаях участников оказывается меньше, но это обычно связано с тем, что задача более сложная и отпугивающая: порой трудно даже просто написать работающий код. Победителей определяют по результатам тестов: 10 самых эффективных решений получают золотые медали, еще 100 — серебряные. Конкуренция действительно очень высокая. Главный залог успеха — тренировки и регулярное участие в соревнованиях. Чтобы заработать, например, пять золотых медалей, обычно нужно до этого получить около двадцати серебряных. Сейчас в моем активе две золотые медали, пять серебряных и одна бронзовая. Кроме того, на платформе у меня есть статусы "Мастер соревнований" и "Мастер по коду".

— Что это за статусы и для чего они нужны?

— Поскольку Kaggle — это сообщество профессионалов, статусы определяют уровень специалиста. "Мастер" — более высокий статус, чем "Эксперт", но оба считаются престижными. Для меня это в первую очередь важно лично — как показатель того, что я развиваюсь и расту профессионально. Кроме того, для HR-подразделений ИТ-компаний активность специалиста на Kaggle — один из ключевых маркеров. Иногда уровень участия просят указать в резюме, а нередко бывает и так, что рекрутеры сами пишут обладателям медалей в личные сообщения и приглашают на работу. Так что всё довольно серьёзно.

— Вы руководили реализацией прорывных решений Iponweb (Criteo) в e-commerce и рекламе. Как они создавались и в чем их особенности?

— В Iponweb я пришёл в 2021 году как руководитель дивизиона машинного обучения. Он является в компании ключевым, поскольку машинное обучение — фундамент услуг, предоставляемых компанией своим клиентам. Я выполнял роль технического лидера пяти команд, работающих над сервисами и продуктами компании в направлениях, связанных с оптимизацией продажи рекламы. На Iponweb сайты, как продавцы, предоставляют свои площадки, а покупатели — компании, заинтересованные в продвижении информации о себе, приобретают возможность размещать баннеры. Сама торговля происходит очень быстро: сделки заключаются за доли секунды, а точнее — за микросекунды. Наиболее крупные клиенты совершают через сервисы компании десятки тысяч сделок в секунду. Наша задача заключалась в том, чтобы сотрудничество рекламодателей и площадок было максимально взаимовыгодным.

Первая команда занималась движком, вторая — прогнозами (какой трафик стоит покупать под задачи клиента), третья выстраивала стратегии наиболее эффективного расходования рекламного бюджета, четвёртая проводила математические эксперименты, а пятая формировала облачную инфраструктуру. Я руководил всеми командами, принимал основные архитектурные решения и писал некоторые ключевые части кода. Спустя год после начала моей работы в Iponweb компанию приобрёл другой мировой лидер в сфере e-commerce — Criteo. Но для нас с командами принципиально ничего не изменилось: мы продолжили работать по тем же направлениям.

— Вы входите международную ассоциацию ECDMA (E-Commerce & Digital Marketing association), объединяющую ведущих мировых экспертов в области e-commerce. Какие задачи вам позволяет решать членство в этом профессиональном сообществе?

— В ECDMA я вступил, через год с момента начала работы в IponWeb. К этому моменту я накопил практический опыт с машинным обучением в этой области, а год назад получил престижную награду — CDO Award, благодаря этому меня пригласили стать старшим членом в ECDMA. В первую очередь для меня было важно общение с профессионалами в этой области, возможность участвовать и выступать на профильных конференциях, а также понимать, чем живёт e-commerce и как он развивается.

— Над какими проектами вы сейчас работаете?

— Недавно я перешёл в компанию BrainShells, которая работает в подсетях экосистемы Bittenzor — глобальной компании, специализирующейся на блокчейне. Среди новых проектов, в которых я участвую, - создание системы генерации описаний видео, которая позволит ИИ не просто анализировать каждый кадр и выдавать по сути объединение покадровых описаний, а использовать мультимодальный подход. То есть, учитывать не только визуальную, но и аудиальную модальность, а также ряд дополнительных второстепенных модальностей — текстовую (теги, подписи к исходному видео), глубину (карты глубины, расстояния до объектов), тепловые данные (инфракрасные/температурные характеристики), IMU-данные (инерциальные измерения: акселерометр, гироскоп).

Как ведущий инженер я участвую параллельно во всех ключевых проектах машинного обучения. Наша компания очень быстро растёт, и я был первым специалистом по глубокому машинному обучению, которого наняла компания. Благодаря этому мне выпала возможность заниматься формированием фундамента продуктов, которые сейчас стремительно развиваются. Также в BrainShells я участвую в проектах по классификации текстов, генерации ответов на вопросы и созданию прогнозных моделей для торговли и электронной коммерции. Несмотря на то что направления очень разные, цель одна — превратить ИИ в надёжного помощника, освободив людей от скучных и рутинных операций и оставив им больше времени для творчества и настоящей жизни.

Автор Александр Приходько
Александр Приходько — журналист, корреспондент Правды.Ру