Прогнозирование продаж является важной задачей для предприятий, поскольку оно позволяет им планировать свою деятельность, управлять запасами и принимать обоснованные решения. В этой статье мы рассмотрим задачу прогнозирования продаж для магазинов Rossmann, крупной сети аптек в Европе. Мы будем использовать набор данных, доступный на Kaggle, для обучения и оценки моделей машинного обучения для прогнозирования ежедневных продаж для каждого магазина.
Набор данных Rossmann содержит данные о ежедневных продажах для 1115 магазинов Rossmann в Германии за период с января 2013 года по март 2015 года. Набор данных включает 1,2 миллиона точек данных, и для каждого дня имеются следующие атрибуты:
Мы будем оценивать следующие модели машинного обучения для задачи прогнозирования продаж:
Мы будем оценивать производительность моделей по следующим метрикам:
Результаты наших экспериментов показали, что случайный лес превзошел другие модели с точки зрения всех трех метрик производительности. Вот сводная таблица результатов:
Модель | MAE | RMSE | R2 |
---|---|---|---|
Линейная регрессия | 164,2 | 224,3 | 0,41 |
Дерево решений | 142,5 | 193,2 | 0,52 |
Случайный лес | 131,2 | 178,9 | 0,59 |
Градиентный бустинг | 130,8 | 178,5 | 0,60 |
Случайный лес оказался наиболее эффективной моделью для прогнозирования продаж в магазинах Rossmann. Эта модель смогла захватить сложные взаимодействия между различными факторами, влияющими на продажи, и с высокой точностью предсказать ежедневные продажи. Результаты этого исследования могут быть использованы предприятиями для улучшения своих прогнозов продаж и повышения общей эффективности.