Привычки превращаются в код: мобильные системы создают цифровой двойник без нашего участия

GNN анализируют данные как сеть связанных узлов — данные Шэньчжэньского универа
6:57

В мире мобильных технологий давно живёт популярная легенда: будто смартфон "слушает" разговоры и показывает рекламу на основе подслушанных фраз. На деле всё куда проще и одновременно куда сложнее. Рекламные системы, рекомендательные ленты и персонализированные подборки работают не через микрофон, а через модели искусственного интеллекта, называемые Graph Neural Networks — графовые нейросети. Их цель — не понять наш разговор, а разобрать, как взаимосвязаны все действия, которые мы оставляем в цифровой среде.

Что делает GNN и как она воспринимает данные

Графовые нейросети обрабатывают информацию не как набор разрозненных записей, а как карту. Каждый фрагмент наших действий — запрос, слово, геолокация, открытая страница — становится узлом. А связи между узлами показывают, какие элементы встречаются вместе, следуют друг за другом или образуют повторяющуюся привычку.

Вместо хранения содержания сообщения GNN фиксирует отношения. Она не запоминает, что человек написал в чате, но фиксирует сочетание слов и контекст их появления. Именно такие карты связей позволяют моделям предсказывать, какой ролик, новость или товар может быть актуален в следующий момент.

Какие данные используются

Системы персонализации собирают четыре ключевые группы данных, если пользователь дал разрешения на обработку информации.

1. Текстовые элементы

Это поисковые запросы, описания, сообщения в сервисах, где разрешён доступ к данным, комментарии и ключевые слова в социальных сетях. GNN выделяет токены и связи между ними. Например, если в запросе встречаются слова "шторы", "дом" и "покупка", модель фиксирует именно отношения, а не полный смысл предложения.

2. История поиска и посещений

Самый богатый источник паттернов. Переходы от новостей к спортивному сайту, затем к расписанию матча и поиску обуви — для GNN это последовательность узлов, формирующая привычный маршрут.

3. Геолокация

Если включена, она создаёт дополнительные связи: где человек бывает утром, где работает, в каких районах открывает приложения. Реклама и рекомендации используют эти сигналы без прямой привязки к личности.

4. Поведенческие ритмы

Частота использования приложений, время просмотра, активности до и после входа — эти ритмы помогают модели уточнять, к какой группе пользователей относится владелец устройства.

Сравнение: традиционные алгоритмы vs GNN

Характеристика Традиционные модели Graph Neural Networks
Анализ данных Последовательный Сетевой, многосвязный
Основная единица Событие Узел и связь
Понимание контекста Ограниченное Глубокое благодаря структуре графа
Адаптация Медленная Быстрая при появлении новых узлов
Предсказания Обобщённые Персонализированные

Советы шаг за шагом: как формируются рекомендации

  1. Модель получает поток действий — запросы, открытия приложений, переходы.

  2. Каждый элемент превращается в узел, который связывается с соседними событиями.

  3. GNN создаёт граф и начинает искать паттерны — устойчивые маршруты поведения.

  4. На основе этих паттернов формируется эмбеддинг — числовое описание профиля пользователя.

  5. Платформа сравнивает его с другими профилями, находя похожие интересы.

  6. Рекомендации формируются не по словам, а по структуре связей.

Ошибка → Последствие → Альтернатива

  1. Ошибка: считать, что модель анализирует личные разговоры.
    Последствие: неправильное понимание работы алгоритмов.
    Альтернатива: учитывать, что анализируются только связи действий.

  2. Ошибка: отключать все данные, не понимая последствий.
    Последствие: менее точные рекомендации.
    Альтернатива: управлять разрешениями и отключать лишь лишнее.

  3. Ошибка: думать, что геолокация используется всегда.
    Последствие: риск неверных выводов о приватности.
    Альтернатива: помнить, что данные применяются только при включённом GPS.

А что если алгоритм ошибается

Периодически GNN неверно интерпретирует связи и формирует рекомендации, которые кажутся случайными. Это связано не с "подслушиванием", а с отсутствием контекста — модель опирается только на статистику и соседство данных. Несколько новых действий способны полностью изменить профиль пользователя.

Плюсы и минусы GNN

Плюсы Минусы
Точность рекомендаций Усиление "информационных пузырей"
Быстрая адаптация Сложность понимания работы модели
Минимум личных данных Зависимость от большого количества сигналов
Улучшение потоков контента Возможные ошибки в определении интересов
Гибкость для разных сервисов Ограниченная прозрачность алгоритмов

FAQ

Слушает ли смартфон разговоры?
Нет. Современным моделям это не нужно, и это запрещено правилами платформ.

Почему реклама появляется сразу после обсуждения темы?
Потому что GNN анализирует связи между действиями, и многие события происходят одновременно — обсуждение только совпадает с интересом.

Может ли пользователь отключить сбор данных?
Да, но это влияет на точность рекомендаций и персонализацию.

Мифы и правда

Миф: реклама появляется, потому что телефон слушает микрофон.
Правда: модели используют граф связей, не содержимое разговоров.

Миф: алгоритмы оценивают личность пользователя.
Правда: оцениваются только связи между действиями, а не личные качества.

Миф: истории поиска недостаточно для рекомендаций.
Правда: именно последовательности действий дают наиболее точные паттерны.

3 интересных факта

  • GNN-модели используются не только в рекламе, но и в биоинформатике, навигации и анализе социальных сетей.
  • Узлы в графах могут представлять что угодно: слова, места, покупки, ритмы активности.
  • Один новый узел — например, редкий поисковый запрос — способен изменить структуру графа сильнее, чем десятки обычных действий.

Исторический контекст

  1. Первые простые графовые алгоритмы появились в середине XX века.

  2. Концепция нейросетей на графах начала развиваться в 2010-е годы.

  3. В 2020-х GNN стали основой рекомендательных систем соцсетей и маркетинговых платформ.

Автор Ольга Сакиулова
Ольга Сакиулова — внештатный корреспондент новостной службы Правда.Ру