Дискретное распределение вероятностей: Распределение Бернулли в машинном обучении

"Dень 20 серии о машинном обучении: Дискретное распределение вероятностей. Распределение Бернулли и его свойства"

День 20 серии о машинном обучении: Дискретное распределение вероятностей. Распределение Бернулли

Введение

В предыдущей статье мы обсуждали непрерывные распределения вероятностей, такие как нормальное и экспоненциальное. Однако в некоторых ситуациях данные являются дискретными, а не непрерывными. В этом случае мы используем дискретное распределение вероятностей.

Одно из наиболее распространенных дискретных распределений - распределение Бернулли.

Распределение Бернулли

Распределение Бернулли используется для моделирования успехов и неудач в одном эксперименте. Например, подброс монеты, где успех - появление орла, а неудача - появление решки.

Математически распределение Бернулли определяется следующим образом:

P(X = k) = p^k * (1 - p)^(1-k)

где:

X - случайная величина, принимающая значения 0 или 1 (неудача или успех)
p - вероятность успеха

Свойства

Дискретное
Двузначное (принимает только два значения)
Математическое ожидание: E(X) = p
Дисперсия: Var(X) = p * (1 - p)

Примеры

Подброшенная монета с вероятностью орла p = 0,5
Игра в рулетку с вероятностью выигрышного номера 1/38
Измерение успеха в клиническом испытании (успех - выздоровление пациента)

Связанные распределения

Распределение Бернулли тесно связано с биномиальным распределением. Биномиальное распределение используется для моделирования числа успехов в серии независимых экспериментов Бернулли.

Связь между распределением Бернулли и биномиальным распределением:

Bin(n, p) = Ber(p) ** n

где:

Bin(n, p) - биномиальное распределение с n испытаниями и вероятностью успеха p
Ber(p) - распределение Бернулли с вероятностью успеха p

Приложения

Распределение Бернулли широко используется в различных областях:

Статистика: Моделирование успехов и неудач в различных сценариях.
Машинное обучение: Характеристика дискретных данных, таких как категориальные переменные.
Биология: Моделирование поведения организмов, таких как рост бактерий или распространение болезней.

Вывод

Распределение Бернулли является важным дискретным распределением вероятностей, которое используется для моделирования успехов и неудач в одном эксперименте. Оно обладает простыми математическими свойствами и приложениями в различных областях.