В третьей части нашей серии статей об исследовании последовательных рекомендаций мы рассмотрим роль машинного обучения (МО) в текущей и будущей парадигме последовательных рекомендаций. Мы обсудим последние достижения в области обучения с подкреплением (RL), генеративных состязательных сетей (GAN) и больших языковых моделей (LLM) и их применение к задачам последовательных рекомендаций. Кроме того, мы рассмотрим ключевые тенденции и проблемы в области МО для последовательных рекомендаций и дадим прогноз того, как МО будет формировать эту область в 2024 году и далее.
Обучение с подкреплением (RL) - это область МО, которая позволяет агентам учиться оптимальным стратегиям в сложных средах путем взаимодействия с ними и получения вознаграждения или наказания за свои действия. В контексте последовательных рекомендаций RL можно использовать для обучения агента генерированию релевантных последовательностей элементов для пользователей с учетом их исторических взаимодействий и целей.
В последние годы было разработано несколько методов RL для последовательных рекомендаций. Одним из наиболее успешных является модель обучения с подкреплением на графиках (Graph Convolutional Reinforcement Learning, GCRL) , которая использует сверточные нейронные сети на графах для обучения агента навигации по графику элементов и действий. Другим выдающимся методом является модель временных разностных разностей с ценностями (Recurrent Neural Network with Value Iteration, RNN-VI), которая использует рекуррентные нейронные сети для моделирования динамики последовательности и оценки ценности различных действий.
Генеративные состязательные сети (GAN) - это тип МО, который использует две нейронные сети: генератор и дискриминатор. Генератор учится создавать новые данные, похожие на заданный набор данных, в то время как дискриминатор учится отличать сгенерированные данные от реальных. GAN можно использовать для генерации реалистичных последовательностей элементов для последовательных рекомендаций.
Недавние исследования показали, что GAN можно эффективно использовать для последовательных рекомендаций. Например, модель последовательных рекомендаций на основе генеративно-состязательных сетей (Sequential Recommendation Generative Adversarial Networks, SRGAN) использует GAN для обучения генератора генерировать реалистичные последовательности элементов, которые максимально похожи на исторические последовательности пользователей. Другая многообещающая модель, рекомендующая система на основе генеративно-состязательных сетей с сиамской архитектурой (Siamese Generative Adversarial Network Recommender System, SiGARS), использует архитектуру с двумя сетями GAN для совместного обучения генератора рекомендаций и дискриминатора, который определяет, являются ли сгенерированные последовательности релевантными для пользователей.
Крупные языковые модели (LLM), такие как GPT-3 и BERT, продемонстрировали выдающиеся возможности понимания и генерации естественного языка. Их можно использовать для улучшения последовательных рекомендаций, предоставляя более естественные и привлекательные взаимодействия.
Некоторые недавние модели используют LLM для понимания и генерации элементов рекомендаций. Например, модель последовательных рекомендаций на основе предобученных языковых моделей (Sequential Recommendation Pre-trained Language Models, SRPLM) использует GPT-3 для понимания исторических взаимодействий пользователей и генерации релевантных последовательностей элементов. Другая модель, гибридная модель последовательных рекомендаций на основе крупных языковых моделей и сверточных нейронных сетей (Hybrid Sequential Recommendation with Large Language Models and Convolutional Neural Networks, HSRLM-CNN), объединяет LLM с CNN для обучения модели рекомендаций, которая может генерировать последовательности элементов, учитывая как текстовые данные об элементах, так и исторические взаимодействия пользователей.
По мере развития области последовательных рекомендаций появляются следующие ключевые тенденции и проблемы:
Мы ожидаем, что в 2024 году и далее МО продолжит играть решающую роль в области последовательных рекомендаций. Вот некоторые прогнозы на будущие тенденции:
Машинное обучение является движущей силой инноваций в области последовательных рекомендаций, открывая новые возможности для понимания и генерации последовательностей элементов. По мере развития МО мы ожидаем, что последовательные рекомендательные системы станут более персонализированными, актуальными и этичными. Эти системы будут играть важную роль в предоставлении пользователям привлекательного и увлекательного опыта, направляя их через постоянно растущий ландшафт контента.