В чем разница между байесовской сетью и наивным байесовским классификатором?
В чем разница между байесовской сетью и наивным байесовским классификатором? Я заметил, что один только что реализован в Matlab, так как classify
другого имеет целый набор инструментов для сети.
Если бы вы могли объяснить в своем ответе, какой из них с большей вероятностью обеспечит более высокую точность, я был бы признателен (не является обязательным условием).
Ответы
Ответ 1
Короткий ответ, если вы заинтересованы только в решении задачи прогнозирования: используйте Наивный Байес.
Байесовская сеть (имеет хорошую страницу википедии) моделирует отношения между функциями в очень общем виде. Если вы знаете, каковы эти отношения, или имеете достаточно данных для их получения, тогда может быть целесообразно использовать байесовскую сеть.
Наивный байесовский классификатор - это простая модель, которая описывает конкретный класс байесовской сети, где все функции являются независимыми от класса. Из-за этого существуют определенные проблемы, которые наивный Байес не может решить (пример ниже). Однако его простота также облегчает его применение, и для получения хорошего результата во многих случаях требуется меньше данных.
Пример: XOR
У вас есть проблема с бинарными функциями x1
и x2
и целевой переменной y = x1 XOR x2
.
В наивном байесовском классификаторе x1
и x2
должны рассматриваться независимо друг от друга - поэтому вы бы вычислили такие вещи, как "Вероятность того, что y = 1
условии, что x1 = 1
", - надеюсь, вы увидите, что это бесполезно, поскольку x1 = 1
не не делайте y = 1
более или менее вероятно. Поскольку байесовская сеть не предполагает независимости, она сможет решить такую проблему.
Ответ 2
Наивный Байес - это ограниченная/ограниченная форма общей байесовской сети, где вы применяете ограничение, которое класс node не должен иметь родителей, и что узлы, соответствующие переменным атрибута, не должны иметь никаких границ между ними. Таким образом, нет ничего, что предотвращало бы использование общей байесовской сети для классификации - предсказанный класс является тем, у которого максимальная вероятность, когда (обусловлено) все остальные переменные установлены на значения экземпляра предсказания в обычном байесовском методе вывода, Хорошей статьей для этого является "Байесовские классификаторы сетей, машинное обучение, 29, 131-163 (1997)". Особый интерес представляет раздел 3. Хотя Naive Bayes является ограниченной формой более общей байесовской сети, в этой статье также говорится о том, почему Naive Bayes может и превосходит общую байесовскую сеть в задачах классификации.