Как найти глобальный минимум в оптимизации python с ограничениями?
У меня есть функция Python с 64 переменными, и я попытался оптимизировать ее с использованием метода L-BFGS-B в функции минимизации, однако этот метод довольно сильно зависит от первоначальной догадки и не смог найти глобальный минимум,
Но мне понравилась его способность устанавливать границы для переменных. Есть ли способ/функция, чтобы найти глобальный минимум, имея границы для переменных?
Ответы
Ответ 1
Это можно сделать с помощью scipy.optimize.basinhopping
. Basinhopping - это функция, предназначенная для определения глобального минимума целевой функции. Он выполняет повторные минимизации с помощью функции scipy.optimize.minimize
и выполняет случайный шаг в пространстве координат после каждой минимизации. Basinhopping все еще может уважать границы, используя один из минимизаторов, которые реализуют границы (например, L-BFGS-B). Вот какой код, который показывает, как это сделать
# an example function with multiple minima
def f(x): return x.dot(x) + sin(np.linalg.norm(x) * np.pi)
# the starting point
x0 = [10., 10.]
# the bounds
xmin = [1., 1.]
xmax = [11., 11.]
# rewrite the bounds in the way required by L-BFGS-B
bounds = [(low, high) for low, high in zip(xmin, xmax)]
# use method L-BFGS-B because the problem is smooth and bounded
minimizer_kwargs = dict(method="L-BFGS-B", bounds=bounds)
res = basinhopping(f, x0, minimizer_kwargs=minimizer_kwargs)
print res
Вышеприведенный код будет работать в простейшем случае, но вы все равно можете оказаться в запрещенном регионе, если вам понадобится процедура случайного перемещения базы данных. К счастью, это можно переопределить путем передачи пользовательского шага с использованием ключевого слова take_step
class RandomDisplacementBounds(object):
"""random displacement with bounds"""
def __init__(self, xmin, xmax, stepsize=0.5):
self.xmin = xmin
self.xmax = xmax
self.stepsize = stepsize
def __call__(self, x):
"""take a random step but ensure the new position is within the bounds"""
while True:
# this could be done in a much more clever way, but it will work for example purposes
xnew = x + np.random.uniform(-self.stepsize, self.stepsize, np.shape(x))
if np.all(xnew < self.xmax) and np.all(xnew > self.xmin):
break
return xnew
# define the new step taking routine and pass it to basinhopping
take_step = RandomDisplacementBounds(xmin, xmax)
result = basinhopping(f, x0, niter=100, minimizer_kwargs=minimizer_kwargs,
take_step=take_step)
print result
Ответ 2
Некоторые предложения здравого смысла для отладки и визуализации любого оптимизатора
по вашей функции:
Являются ли ваши целевые функции и ваши ограничения разумными?
Если целевой функцией является сумма, скажем f() + g()
,
напечатайте их отдельно для всех x
в "fx-opt.nptxt"
(см. ниже);
если f()
составляет 99% от суммы и g()
1%, исследуйте.
Ограничения: сколько компонентов x_i
в xfinal
застревает в границах,
x_i <= lo_i
или >= hi_i
?
Насколько ухабистой является ваша функция в глобальном масштабе?
Запустите с несколькими случайными начальными точками и сохраните результаты для анализа/построения графика:
title = "%s n %d ntermhess %d nsample %d seed %d" % ( # all params!
__file__, n, ntermhess, nsample, seed )
print title
...
np.random.seed(seed) # for reproducible runs
np.set_printoptions( threshold=100, edgeitems=10, linewidth=100,
formatter = dict( float = lambda x: "%.3g" % x )) # float arrays %.3g
lo, hi = bounds.T # vecs of numbers or +- np.inf
print "lo:", lo
print "hi:", hi
fx = [] # accumulate all the final f, x
for jsample in range(nsample):
# x0 uniformly random in box lo .. hi --
x0 = lo + np.random.uniform( size=n ) * (hi - lo)
x, f, d = fmin_l_bfgs_b( func, x0, approx_grad=1,
m=ntermhess, factr=factr, pgtol=pgtol )
print "f: %g x: %s x0: %s" % (f, x, x0)
fx.append( np.r_[ f, x ])
fx = np.array(fx) # nsample rows, 1 + dim cols
np.savetxt( "fx-opt.nptxt", fx, fmt="%8.3g", header=title ) # to analyze / plot
ffinal = fx[:,0]
xfinal = fx[:,1:]
print "final f values, sorted:", np.sort(ffinal)
jbest = ffinal.argmin()
print "best x:", xfinal[jbest]
Если некоторые из значений ffinal
выглядят достаточно хорошо,
попробуйте более случайные стартовые точки рядом с ними -
что, безусловно, лучше, чем чисто случайное.
Если x
- кривые или что-то реальное, нарисуйте лучшие несколько x0
и xfinal
.
(Эмпирическое правило имеет размер nsample ~ 5 * d или 10 * d в d
.
Слишком медленно, слишком много? Уменьшите maxiter
/maxeval
, уменьшите ftol
-
вам не нужно ftol
1e-6 для исследования, подобного этому.)
Если вы хотите воспроизводимые результаты,
то вы должны перечислить ВСЕ соответствующие параметры в title
и в производных файлах и графиках.
В противном случае вы спросите "откуда это взялось?"
Как ухабистая ваша функция на шкале эпсилон ~ 10 ^ -6?
Методы, приближающие градиент, иногда возвращают их последнюю оценку,
но если нет:
from scipy.optimize import approx_fprime
for eps in [1e-3, 1e-6]:
grad = approx_fprime( x, func, epsilon=eps )
print "approx_fprime eps %g: %s" % (eps, grad)
Если, однако, оценка градиента плохая/неустойчивая перед выключением оптимизатора,
вы этого не увидите.
Затем вам нужно сохранить все промежуточные [f, x, approx_fprime]
смотреть их тоже; легко в python - спросите, не ясно ли это.
В некоторых проблемных областях обычно используется резервное копирование и перезапуск из предполагаемого xmin
.
Например, если вы потерялись на проселочной дороге,
сначала найдите главную дорогу, затем перезапустите оттуда.
Поместите вызов exect и информацию о версии также в вопросах, например.
x, f, d = fmin_l_bfgs_b( func, x0, approx_grad=1,
m=ntermhess, factr=factr, pgtol=pgtol, epsilon=eps )
# give values for these -- explicit is better than implicit
versions: numpy 1.8.0 scipy 0.13.2 python 2.7.6 mac 10.8.3
Резюме:
не ожидайте, что оптимизатор черного ящика будет работать над функцией, которая
крупномасштабные ухабистые или эпсилон-масштабные ухабистые, или и то, и другое.
Инвестируйте в тестовые леса и в см., что делает оптимизатор.
Ответ 3
Большое спасибо вашему подробному ответу, но поскольку я довольно новичок в python, я не знал, как реализовать код для моей программы, но вот моя попытка оптимизации:
x0=np.array((10, 13, f*2.5, 0.08, 10, f*1.5, 0.06, 20,
10, 14, f*2.5, 0.08, 10, f*1.75, 0.07, 20,
10, 15, f*2.5, 0.08, 10, f*2, 0.08, 20,
10, 16, f*2.5, 0.08, 10, f*2.25, 0.09, 20,
10, 17, f*2.5, -0.08, 10, f*2.5, -0.06, 20,
10, 18, f*2.5, -0.08, 10, f*2.75,-0.07, 20,
10, 19, f*2.5, -0.08, 10, f*3, -0.08, 20,
10, 20, f*2.5, -0.08, 10, f*3.25,-0.09, 20))
# boundary for each variable, each element in this restricts the corresponding element above
bnds=((1,12), (1,35), (0,f*6.75), (-0.1, 0.1),(1,35), (0,f*6.75), (-0.1, 0.1),(13, 35),
(1,12), (1,35), (0,f*6.75), (-0.1, 0.1),(1,35), (0,f*6.75), (-0.1, 0.1),(13, 35),
(1,12), (1,35), (0,f*6.75), (-0.1, 0.1),(1,35), (0,f*6.75), (-0.1, 0.1),(13, 35),
(1,12), (1,35), (0,f*6.75), (-0.1, 0.1),(1,35), (0,f*6.75), (-0.1, 0.1),(13, 35),
(1,12), (1,35), (0,f*6.75), (-0.1, 0.1),(1,35), (0,f*6.75), (-0.1, 0.1),(13, 35),
(1,12), (1,35), (0,f*6.75), (-0.1, 0.1),(1,35), (0,f*6.75), (-0.1, 0.1),(13, 35),
(1,12), (1,35), (0,f*6.75), (-0.1, 0.1),(1,35), (0,f*6.75), (-0.1, 0.1),(13, 35),
(1,12), (1,35), (0,f*6.75), (-0.1, 0.1),(1,35), (0,f*6.75), (-0.1, 0.1),(13, 35), )
from scipy.optimize import basinhopping
from scipy.optimize import minimize
merit=a*meritoflength + b*meritofROC + c*meritofproximity +d*(distancetoceiling+distancetofloor)+e*heightorder
minimizer_kwargs = {"method": "L-BFGS-B", "bounds": bnds, "tol":1e0}
ret = basinhopping(merit_function, x0, minimizer_kwargs=minimizer_kwargs, niter=10, T=0.01)
zoom = ret['x']
res = minimize(merit_function, zoom, method = 'L-BFGS-B', bounds=bnds, tol=1e-5)
print res
функция достоинства объединяет x0 с некоторыми другими значениями для формирования 6 контрольных точек для 8 кривых, затем вычисляет их длины, радиусы кривизны и т.д. Она возвращает окончательное достоинство в виде линейных комбинаций этих параметров с некоторыми весами.
i использовал basinhopping
с низкими значениями, чтобы найти некоторые минимумы, а затем использовал minimize
для повышения точности наименьшего munimum.
p.s. платформа, на которой я запущена, - это Enthoght canopy 1.3.0, numpy 1.8.0 scipy 0.13.2 mac 10.8.3