04/07/2026 | News release | Distributed by Public on 04/06/2026 21:33
Согласно исследованиям, практически все физическое время в интернете люди проводят в социальных сетях. Здесь алгоритмы персонально подбирают под каждого человека свой контент. Вместе с доцентом отделения информационных технологий Томского политеха Алексеем Савельевым разбираемся, как работает алгоритмическая лента и можно ли «обучить» соцсети показывать только интересный контент.
За подбор контента отвечают рекомендательные системы, умные ленты и способы подбора. Работа таких алгоритмов сводится к механикам сбора и анализа данных об активности пользователя. Их главная задача состоит в том, чтобы удержать внимание пользователя, сохранить или увеличить степень его лояльности к ресурсу.
«Такая рекомендательная система сложилась по нескольким причинам. Во-первых, массового притока новых пользователей, как это было раньше, уже нет. Ежегодно прирост составляет около 3 % от общего населения планеты - это немного. Во-вторых, количество контента растет опережающими темпами. Имеющиеся пользователи не могут потреблять еще больше контента, чем они потребляют уже. Это создало ситуацию жесткой конкуренции за внимание потребителей. Сегодня каждый интернет-ресурс конкурирует с каждым. В том числе поэтому мы видим большое количество укрупнений и поглощений производителями контента друг друга», - отмечает эксперт.
Такая борьба за пользователей, по словам Алексея Савельева, повлияла на сам контент и способы его подачи. Современные модели потребления поощряют создание короткого, яркого и эмоционально заряженного контента, который легко способен стать вирусным. Это создает перманентный информационный фон, в котором эмоционально провокационный контент получает преимущество.
Все системы подбора контента в социальных сетях работают на нескольких схожих принципах.
Каждое наше действие в сети - это фиксируемое событие. Обычная пользовательская сессия состоит из сотен и тысяч таких событий: мы ставим реакции, замедляем скорость скроллинга ленты на фотографии друга, смотрим ролики и многое другое. Все эти данные агрегируются в распределенных системах. Такая телеметрия помогает отследить пользовательские предпочтения,
- отмечает преподаватель.Еще один способ - так называемая инженерия признаков. Это процесс преобразования массива сырых данных в фичи, то есть понятные для модели числовые характеристики. В качестве исходных данных может выступать информация, например, о CTR (Click-Through Rate), векторном представлении интересов пользователей, времени и длительности последней сетевой активности, типе устройства, скорости интернета в этот момент и многом другом.
«Исходные данные в любой системе рекомендаций преобразуются в так называемые one-hot векторы, где только один элемент равен 1, а остальные 0. Например, у нас есть категориальное значение - наименование города проживания конкретного пользователя (Томск). Остальные пользователи проживают в Москве, Новосибирске и Екатеринбурге. Использовать эти данные как есть нельзя, для модели это просто набор символов. Просто дать городам номера тоже нельзя, ведь модель неверно их поймет. Поэтому данные преобразовывают в вектор, например, "0,0,0,1" для Томска, что позволит обнаружить в дальнейшем полезные зависимости. Встречаются и исключения, ряд моделей (CatBoost) могут понять значения как они есть», - отмечает Алексей Савельев.
Множество one-hot векторов, описывающих один из признаков пользователя, преобразовываются в плотный вектор фиксированной размерности - эмбеддинг. Множество таких векторов объединяются, что позволяет модели автоматически обнаруживать значимые признаки.
Перед тем, как попасть в ленту, весь контент проходит две стадии ранжирования. Сначала идет подбор кандидатов контента для рекомендации, который может выполняться на основе коллаборативной фильтрации. Задача этой стадии - подбор множества наиболее вероятно интересных пользователю тем. Следующая стадия - итоговое ранжирование. В ней каждой единице контента присваивается точная оценка вероятности интереса. В результате этой сложной работы составляется ранг контента, отражающий, насколько он подойдет именно конкретному пользователю.
«Контент из области ваших интересов или интересный вашему близкому социальному окружению, как правило, будет предложен в первую очередь. Однако важно понимать, что главная функция любой системы подбора заключается именно в увеличении внимания.
Алгоритм не оптимизирует ленту под то, чтобы она нам нравилась, он оптимизирует ее под то, чтобы вы не могли оторваться. Если ваше внимание лучше обеспечивается негативным и провокационным контентом, то именно он будет предложен вне зависимости от его влияния на ваше эмоциональное состояние.
Такова экономическая модель современного рынка контента», - отмечает эксперт.Если коротко - нет. По словам эксперта, бездумное кликание на все подряд и проставление случайных реакций принципиально не поможет, так как будет распознано алгоритмами, как аномальное поведение. К таким сбоям современные модели анализа устойчивы за счет систем фильтрации и присвоения больших весов неявным сигналам.
Единственный способ влиять на алгоритмы - отправлять им явные поведенческие сигналы (рекомендовать, продвигать и оставлять позитивные реакции на интересующий контент) и прямо указывать на неподходящий контент (блокировать конкретные теги, оставлять негативные реакции). Так можно добиться фокусировки рекомендаций на узкой, интересующей пользователя теме, если алгоритм решит, что это обеспечит его удержание.
Обратной стороной такого цифрового поведения, по мнению политехника, становится риск попадания в «фильтр-пузырь» и определенная информационная изоляция.
Действительно повлиять на алгоритмическую ленту можно только изменив свою модель и привычки потребления контента. Не обманывайтесь: если вы поставите дизлайк или негативную реакцию под видео, которое просмотрели до конца, то это скорее спровоцирует появление подобного контента в вашей ленте, а не исключит его. Да, сегодня существуют инициативы по этичному формированию пользовательских рекомендаций, в которых приоритет интересов отдан пользователю, а не платформе-держателю. Однако полагаться на них целиком не следует,
- отмечает Алексей Савельев.Эксперт советует самостоятельно формировать привычки здорового потребления: стремиться осознанно управлять своим вниманием, заставлять себя «уходить» от нежелательного контента, даже если он затягивает, и регулярно проводить ревизию подписок, чтобы обозначить потерю интереса к определенному виду контента.