Привычки превращаются в код: мобильные системы создают цифровой двойник без нашего участия

GNN анализируют данные как сеть связанных узлов — данные Шэньчжэньского универа

6:57

20.11.2025 09:29

В мире мобильных технологий давно живёт популярная легенда: будто смартфон "слушает" разговоры и показывает рекламу на основе подслушанных фраз. На деле всё куда проще и одновременно куда сложнее. Рекламные системы, рекомендательные ленты и персонализированные подборки работают не через микрофон, а через модели искусственного интеллекта, называемые Graph Neural Networks — графовые нейросети. Их цель — не понять наш разговор, а разобрать, как взаимосвязаны все действия, которые мы оставляем в цифровой среде.

Что делает GNN и как она воспринимает данные

Графовые нейросети обрабатывают информацию не как набор разрозненных записей, а как карту. Каждый фрагмент наших действий — запрос, слово, геолокация, открытая страница — становится узлом. А связи между узлами показывают, какие элементы встречаются вместе, следуют друг за другом или образуют повторяющуюся привычку.

Вместо хранения содержания сообщения GNN фиксирует отношения. Она не запоминает, что человек написал в чате, но фиксирует сочетание слов и контекст их появления. Именно такие карты связей позволяют моделям предсказывать, какой ролик, новость или товар может быть актуален в следующий момент.

Какие данные используются

Системы персонализации собирают четыре ключевые группы данных, если пользователь дал разрешения на обработку информации.

1. Текстовые элементы

Это поисковые запросы, описания, сообщения в сервисах, где разрешён доступ к данным, комментарии и ключевые слова в социальных сетях. GNN выделяет токены и связи между ними. Например, если в запросе встречаются слова "шторы", "дом" и "покупка", модель фиксирует именно отношения, а не полный смысл предложения.

2. История поиска и посещений

Самый богатый источник паттернов. Переходы от новостей к спортивному сайту, затем к расписанию матча и поиску обуви — для GNN это последовательность узлов, формирующая привычный маршрут.

3. Геолокация

Если включена, она создаёт дополнительные связи: где человек бывает утром, где работает, в каких районах открывает приложения. Реклама и рекомендации используют эти сигналы без прямой привязки к личности.

4. Поведенческие ритмы

Частота использования приложений, время просмотра, активности до и после входа — эти ритмы помогают модели уточнять, к какой группе пользователей относится владелец устройства.

Сравнение: традиционные алгоритмы vs GNN

Характеристика	Традиционные модели	Graph Neural Networks
Анализ данных	Последовательный	Сетевой, многосвязный
Основная единица	Событие	Узел и связь
Понимание контекста	Ограниченное	Глубокое благодаря структуре графа
Адаптация	Медленная	Быстрая при появлении новых узлов
Предсказания	Обобщённые	Персонализированные

Советы шаг за шагом: как формируются рекомендации

Модель получает поток действий — запросы, открытия приложений, переходы.
Каждый элемент превращается в узел, который связывается с соседними событиями.
GNN создаёт граф и начинает искать паттерны — устойчивые маршруты поведения.
На основе этих паттернов формируется эмбеддинг — числовое описание профиля пользователя.
Платформа сравнивает его с другими профилями, находя похожие интересы.
Рекомендации формируются не по словам, а по структуре связей.

Ошибка → Последствие → Альтернатива

Ошибка: считать, что модель анализирует личные разговоры.
Последствие: неправильное понимание работы алгоритмов.
Альтернатива: учитывать, что анализируются только связи действий.
Ошибка: отключать все данные, не понимая последствий.
Последствие: менее точные рекомендации.
Альтернатива: управлять разрешениями и отключать лишь лишнее.
Ошибка: думать, что геолокация используется всегда.
Последствие: риск неверных выводов о приватности.
Альтернатива: помнить, что данные применяются только при включённом GPS.

А что если алгоритм ошибается

Периодически GNN неверно интерпретирует связи и формирует рекомендации, которые кажутся случайными. Это связано не с "подслушиванием", а с отсутствием контекста — модель опирается только на статистику и соседство данных. Несколько новых действий способны полностью изменить профиль пользователя.

Плюсы и минусы GNN

Плюсы	Минусы
Точность рекомендаций	Усиление "информационных пузырей"
Быстрая адаптация	Сложность понимания работы модели
Минимум личных данных	Зависимость от большого количества сигналов
Улучшение потоков контента	Возможные ошибки в определении интересов
Гибкость для разных сервисов	Ограниченная прозрачность алгоритмов

FAQ

Слушает ли смартфон разговоры?
Нет. Современным моделям это не нужно, и это запрещено правилами платформ.

Почему реклама появляется сразу после обсуждения темы?
Потому что GNN анализирует связи между действиями, и многие события происходят одновременно — обсуждение только совпадает с интересом.

Может ли пользователь отключить сбор данных?
Да, но это влияет на точность рекомендаций и персонализацию.

Мифы и правда

Миф: реклама появляется, потому что телефон слушает микрофон.
Правда: модели используют граф связей, не содержимое разговоров.

Миф: алгоритмы оценивают личность пользователя.
Правда: оцениваются только связи между действиями, а не личные качества.

Миф: истории поиска недостаточно для рекомендаций.
Правда: именно последовательности действий дают наиболее точные паттерны.

3 интересных факта

GNN-модели используются не только в рекламе, но и в биоинформатике, навигации и анализе социальных сетей.
Узлы в графах могут представлять что угодно: слова, места, покупки, ритмы активности.
Один новый узел — например, редкий поисковый запрос — способен изменить структуру графа сильнее, чем десятки обычных действий.

Исторический контекст

Первые простые графовые алгоритмы появились в середине XX века.
Концепция нейросетей на графах начала развиваться в 2010-е годы.
В 2020-х GNN стали основой рекомендательных систем соцсетей и маркетинговых платформ.