Ответ 1
В словах...
Вероятность, что node x_i
принадлежит классу c
, равна:
- Вероятность окрестности
x_i
(называемаяN_i
), еслиx
действительно принадлежал классуc
; Умножается на... - Вероятность самого класса
c
; Разделено на... - Вероятность самой окрестности
N_i
(из nodex_i
).
Что касается вероятности окрестности N_i
(of x_i
), если x
должен принадлежать классу c
, то он равен:
- A продукт с некоторой вероятностью; (какая вероятность?)
- Вероятность того, что некоторая node (
v_j
) окрестности (N_i
) принадлежит классуc
, еслиx
действительно принадлежит классуc
- (поднят до веса края, соединяющего проверяемый node и node, который классифицируется... но вас это не интересует... пока). (Обозначения немного отсюда, я думаю, почему они определяют
v_j
, а затем никогда не используют его?... Каким бы ни было).
- (поднят до веса края, соединяющего проверяемый node и node, который классифицируется... но вас это не интересует... пока). (Обозначения немного отсюда, я думаю, почему они определяют
-
Наконец, умножьте
product of some probability
на некоторый1/Z
. Зачем? Поскольку всеp
являются вероятностями и поэтому лежат в диапазоне от 0 до 1, но весаw
могут быть любыми, что означает, что в конец, расчетная вероятность может быть вне диапазона. -
Вероятность того, что некоторый
x_i
принадлежит классуc
GIVEN THE ДОКАЗАТЕЛЬСТВО ОТ ЕГО СОСЕДСТВА - это задняя вероятность. (ПОСЛЕ что-то... Что это такое?... см. Ниже) -
Вероятность появления окрестности
N_i
, еслиx_i
принадлежащий классуc
, является вероятностью. -
Вероятность самого класса
c
является предварительной вероятностью. ПЕРЕД чем-то... Что это такое? Доказательство. Предварительная говорит о вероятности класса без каких-либо доказательств но апостериор говорит вам о вероятности событие (чтоx_i
относится кc
). ДАЛЕЕ ДОКАЗАТЕЛЬСТВО ОТ ЕГО СОСЕДИ.
Предварительное, может быть субъективным. То есть, полученное с помощью ограниченных наблюдений или быть информированным мнением. Другими словами, это не должно быть распределение населения. Он должен быть достаточно точным, не совсем известным.
Вероятность немного сложнее. Хотя здесь есть формула, вероятность должна оцениваться из достаточно большой популяции или столько же "физических" знаний о наблюдаемом явлении, насколько это возможно.
Внутри продукта (заглавная буква Pi во втором уравнении, которое выражает вероятность) у вас есть условное. Условным является вероятность того, что окрестность node принадлежит некоторому классу, если x
принадлежит классу c
.
В типичном применении Наивный байесовский классификатор, то есть document классификация (например, спам-почта), условие, что an email is spam GIVEN THE APPEARANCE OF SPECIFIC WORDS IN ITS BODY
является производным огромной базой данных наблюдений или огромной базой данных электронных писем, которые мы действительно знаем, /strong > , к какому классу они принадлежат. Другими словами, я должен иметь представление о том, как выглядит спам-электронное письмо и, в конечном итоге, большинство спам-писем сходится к какой-то общей теме (я - официальный представитель банка, и у меня есть денежная возможность для вас, дайте мне ваши банковские реквизиты для перевода денег вам и сделайте вас богатыми...).
Без этого знания мы не можем использовать правило Байеса.
Итак, чтобы вернуться к вашей конкретной проблеме. В вашем PDF-документе у вас есть вопросительный знак при выводе продукта.
Совершенно верно.
Итак, реальный вопрос: какова вероятность вашего графика/данных?
(... или. Откуда вы собираетесь его извлечь? (очевидно, либо большое количество известных наблюдений ИЛИ), но и некоторые знания об этом явлении., какова вероятность того, что node заражен, учитывая, что часть его окрестности тоже заражена)).
Надеюсь, это поможет.