Разница между параметрами, функциями и классом в Machine Learning

Я новичок в обучении машинам и обработке на естественном языке.

Меня всегда путают между тремя этими терминами?

Из моего понимания:

class: Различные категории нашей модели. Учитывая имя человека, укажите, является ли он мужчиной или женщиной?

Допустим, я использую классификатор Naive Bayes.

Каковы будут мои особенности и параметры?

Кроме того, каковы некоторые из псевдонимов вышеуказанных слов, которые используются взаимозаменяемо.

спасибо

Ответы

Ответ 1

Позвольте использовать пример классификации пола человека. Ваше понимание о классе правильное! Учитывая входное наблюдение, наш классификатор Naive Bayes должен выводить категорию. Класс - это категория.

Особенности: Особенности в Naive Bayes Classifier, или любой общий алгоритм классификации ML, являются точками данных, которые мы выбираем для определения нашего ввода. На примере человека мы не можем вводить все данные о человеке; вместо этого мы выбираем несколько функций, чтобы определить человека (например, "Высота", "Вес" и "Размер ножки"). В частности, в классификаторе Naive Bayes ключевое допущение, которое мы делаем, состоит в том, что эти функции независимы (они не влияют друг на друга): высота человека не влияет на вес, не влияет на размер ноги. Это предположение может быть или не быть истинным, но для Наивного Байеса мы предполагаем, что это правда. В частном случае вашего примера, где вход - это просто имя, функции могут быть частотой букв, количеством гласных, длиной имени или суффиксами/префиксами.

Параметры: Параметры в Naive Bayes - это оценки истинного распределения того, что мы пытаемся классифицировать. Например, можно сказать, что примерно 50% людей составляют мужчины, а распределение мужской высоты - это распределение Гаусса со средним 5 7 и стандартное отклонение 3 ". Параметры были бы оценкой 50%, средней оценкой 5 '7 и оценкой стандартного отклонения 3 ".

Псевдонимы: функции также называются атрибутами. Я не знаю общих замен для "параметров".

Надеюсь, это было полезно!

Ответ 2

@txizzle хорошо объяснил случай с Наивным Байесом. В более общем смысле:

Класс: категория вывода ваших данных. Вы можете также назвать эти категории. Ярлыки ваших данных указывают на один из классов (если это проблема классификации, конечно).

Особенности: Характеристики, которые определяют вашу проблему. Они также называются атрибутами.

Параметры: переменные, которые ваш алгоритм пытается настроить для создания точной модели.

Например, скажем, вы пытаетесь решить, допускать ли студент к школе или нет, основываясь на различных факторах, таких как его/ее базовый уровень GPA, баллы тестов, оценки рекомендаций, проектов и т.д. В этом случае указанные факторы выше - ваши функции/атрибуты, независимо от того, предоставляется ли учащемуся или не станет вашим 2 классами, а числа, которые определяют, как эти функции объединяются вместе, чтобы получить ваш результат, станут вашими параметрами. Фактические значения параметров зависят от вашего алгоритма. Для нейронной сети это вес на синаптических связях. Аналогичным образом, для проблемы регрессии параметры являются коэффициентами ваших функций, когда они объединены.

Ответ 3

взять простую линейную классификацию problem-

y = {0, если 5x-3> = 0 else 1}

здесь y - класс, x - функция, 5,3 - параметры.