Использование машинного обучения для прогнозирования продаж в магазинах Rossmann

Машинное обучение для прогнозирования продаж: прогнозирование продаж в магазинах Rossmann

Машинное обучение для прогнозирования продаж: прогнозирование продаж в магазинах Rossmann

Введение

Прогнозирование продаж имеет решающее значение для бизнеса, позволяя им оптимизировать цепочки поставок, планировать персонал и принимать обоснованные решения. Машинное обучение (МО) предоставляет мощные инструменты для прогнозирования продаж, используя исторические данные для выявления закономерностей и прогнозирования будущих результатов.

В этом проекте мы применили машинное обучение для прогнозирования продаж в магазинах Rossmann, используя набор данных о продажах и сопутствующей информации. Мы использовали различные модели машинного обучения, включая линейную регрессию, деревья решений и случайные леса, для поиска наилучшей модели для прогнозирования.

Данные

Набор данных Rossmann Store Sales содержит информацию о ежедневных продажах и сопутствующей информации в 1115 магазинах в Германии с января 2013 года по март 2017 года. Набор данных включает в себя следующие характеристики:

  • Дата: Дата продажи
  • Штор: Идентификатор магазина
  • Товары: Идентификатор товара
  • Проданные: Количество проданных единиц
  • Цена: Цена за единицу
  • Промоции: Индикатор наличия специальных акций
  • Школьные каникулы: Индикатор школьных каникул
  • Государственные праздники: Индикатор государственного праздника
  • День недели: День недели
  • Неделя года: Неделя года

Методология

Мы применили следующий процесс для прогнозирования продаж:

  1. Предобработка данных: Мы очистили данные, удалив выбросы и дубликаты. Мы также закодировали категориальные признаки, такие как Школа и Каникулы, с помощью фиктивных переменных.
  2. Разделение данных: Мы разделили набор данных на обучающий и тестовый наборы в соотношении 80/20. Обучающий набор использовался для обучения моделей машинного обучения, а тестовый набор использовался для оценки их производительности.
  3. Моделирование: Мы обучили несколько моделей машинного обучения, включая линейную регрессию, деревья решений и случайные леса. Мы настроили параметры каждой модели для повышения производительности.
  4. Оценивание: Мы оценили производительность каждой модели с помощью следующих метрик:
    • Средняя абсолютная ошибка (MAE)
    • Средняя квадратичная ошибка (MSE)
    • Корреляция Пирсона
  5. Выбор лучшей модели: Мы выбрали модель, которая обеспечила наилучшие показатели на тестовом наборе.

Результаты

Мы обнаружили, что модель случайного леса показала наилучшие результаты при прогнозировании продаж. Она достигла следующих метрик:

  • MAE: 952
  • MSE: 1,4 млн.
  • Корреляция Пирсона: 0,95

Вывод

Машинное обучение оказалось мощным инструментом для прогнозирования продаж в магазинах Rossmann. Мы успешно обучили модель случайного леса, которая смогла точно прогнозировать будущие продажи. Полученную модель можно использовать для оптимизации цепочек поставок, планирования персонала и принятия обоснованных решений.

Наше исследование подчеркивает потенциал машинного обучения в улучшении прогнозирования продаж и поддержки компаний в принятии более эффективных решений.

To leave a comment you need to Login / Create account