Нормализовать функцию в этой таблице
Это стало довольно неприятным вопросом, но я спросил в обсуждениях в Coursera, и они не помогут. Ниже приведен вопрос:
![enter image description here]()
Я ошибся 6 раз. Как нормализовать функцию? Подсказки - все, о чем я прошу.
Я предполагаю, что x_2 ^ (2) - это значение 5184, если я не добавляю столбец x_0 из 1, о котором они не упоминают, но он, конечно, упоминает в лекциях, когда говорит о создании проектной матрицы X. В в каком случае x_2 ^ (2) будет значением 72. Предполагая, что один или другой правильный (я играю в игру гадания), что я должен использовать для его нормализации? Он говорит о 3 разных способах нормализации в лекциях: один использует максимальное значение, другое с диапазоном/разностью между макс и минутами, а другое стандартное отклонение - они хотят, чтобы ответ был правильным для сотых. Какой из них я должен использовать? Это настолько запутанно.
Ответы
Ответ 1
... используйте масштабирование функции (разделение на "max-min" , или диапазон, функции) и средняя нормализация.
Итак, для любой индивидуальной функции f:
f_norm = (f - f_mean) / (f_max - f_min)
например. для x2, (средний экзамен) ^ 2 = {7921, 5184, 8836, 4761}
> x2 <- c(7921, 5184, 8836, 4761)
> mean(x2)
6676
> max(x2) - min(x2)
4075
> (x2 - mean(x2)) / (max(x2) - min(x2))
0.306 -0.366 0.530 -0.470
Следовательно, норма (5184) = 0.366
(используя R-язык, который отлично подходит для векторизации таких выражений)
Я согласен с тем, что они не поняли, что они использовали обозначение x2 (2) как означающее x2 (норма) или x2
EDIT: на практике каждый вызывает встроенную функцию scale(...)
, которая делает то же самое.
Ответ 2
Он просит нормализовать вторую функцию во втором столбце, используя как масштабирование функции, так и среднюю нормировку. Следовательно,
(5184 - 6675.5) / 4075 = -0.366
Ответ 3
Обычно мы нормализуем все из них, чтобы иметь нулевое среднее значение и идти между [-1, 1].
Вы можете сделать это легко, разделив максимум на абсолютное значение, а затем удалите среднее из образцов.
Ответ 4
"Я предполагаю, что x_2 ^ (2) - это значение 5184", это потому, что это второй элемент в списке и с использованием индекса _2? x_2 - это просто идентификатор переменной в математике, он применяется ко всем строкам в списке. Обратите внимание, что самый высокий результат среднесрочного экзамена (т.е. Не в квадрате) опускается на заключительный тест, а самый низкий результат в среднесрочной перспективе увеличивает наибольшее значение для итогового результата экзамена. Theta - фиксированное значение, коэффициент, поэтому где-то ваша нормализация значений x_1 и x_2 должна стать (EDIT: не отрицательная, меньше 1), чтобы это допускалось. Это, надо надеяться, дает вам исходную основу, определяя, где находится точка опоры.
Ответ 5
У меня была та же проблема: в моем случае я использовал среднее значение x2 (8836) минус минимальное значение x2 (4761), деленное на два, вместо суммы каждого значения x2, деленного на количество примеров.
Ответ 6
В том же учебном наборе у меня возник вопрос:
В. Что такое нормализованная функция x ^ (3) _1?
Таким образом, 3-й тренинг ex и 1-я особенность составляет 94 в таблице выше.
Теперь нормализованная форма
x = (x - mean(x's)) / range(x)
Значения:
x = 94
mean(89+72+94+69) / 4 = 81
range = 94 - 69 = 25
Normalized x = (94 - 81) / 25 = 0.52