Уравнение аппроксимации свободной энергии в реляционных системах Больцмана

Я не очень хорошо разбираюсь в python, в основном он получает эксперт по продукту каждого видимого блока как вектор wx_b, вычисляет exp и плюс 1, вычисляет log и суммирует его для скрытого термина.

Я считаю, что это немного отличается от уравнения свободной энергии в Learning Deep Architectures:

Он вычисляет exp и sum, вычисляет log с учетом суммы. после чего суммирует весь эксперт продукта на основе количества видимого блока.

Ниже мой проект java-реализации vis_v - это образец видимого слоя, hid_v - образец элемента скрытого слоя.

Это какое-то приближение? Я пытаюсь реализовать одно и то же в java, но я запутался в этом. Заранее благодарим за помощь!

Ответы

Ответ 1

Я понимаю, что ваше замешательство связано с определением функции свободной энергии в ссылочном коде python. Если это не то, о чем вы просите, я извиняюсь.

Во-первых, это не приближение. Похоже, они предполагают, что скрытые единицы двоично оценены. Помните, что свободная энергия - это всего лишь (log of) энергия со скрытыми переменными, маргинализированная. Итак, внутренняя сумма в уравнении свободной энергии, указанная выше, является просто суммой по значениям, которые может взять i-й скрытый элемент, в этом случае {0,1}. Так как exp (0) = 1, то внутренняя сумма просто становится 1 + exp (...). См. Раздел "RBMs with Binary Units" в ссылка, которую вы предоставили.

Я не знаком с математической библиотекой apache commons в java, поэтому я не могу получить огромную помощь там, но реализация должна быть прямым переводом с этой функции python.