Как применить numpy.linalg.norm к каждой строке матрицы?
У меня есть 2D-матрица, и я хочу взять норму каждой строки. Но когда я использую numpy.linalg.norm(X)
напрямую, он принимает норму всей матрицы.
Я могу взять норму каждой строки, используя цикл for, а затем беря норму каждого X[i]
, но это занимает огромное время, так как у меня 30k строк.
Любые предложения по поиску более быстрого пути? Или можно применить np.linalg.norm
к каждой строке матрицы?
Ответы
Ответ 1
Обратите внимание, что, как показано perimosocordiae, с версии NumPy 1.9 np.linalg.norm(x, axis=1)
- это самый быстрый способ вычисления L2-нормы.
Если вы вычисляете L2-норму, вы можете вычислить ее напрямую (используя аргумент axis=-1
для суммирования по строкам):
np.sum(np.abs(x)**2,axis=-1)**(1./2)
Lp-нормы могут быть вычислены аналогично, конечно.
Это значительно быстрее, чем np.apply_along_axis
, хотя, возможно, и не так удобно:
In [48]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
1000 loops, best of 3: 208 us per loop
In [49]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100000 loops, best of 3: 18.3 us per loop
Другие формы ord
norm
могут быть вычислены непосредственно (с аналогичными ускорениями):
In [55]: %timeit np.apply_along_axis(lambda row:np.linalg.norm(row,ord=1), 1, x)
1000 loops, best of 3: 203 us per loop
In [54]: %timeit np.sum(abs(x), axis=-1)
100000 loops, best of 3: 10.9 us per loop
Ответ 2
Воскрешение старого вопроса из-за обновления numpy. Начиная с версии 1.9, numpy.linalg.norm
теперь принимает аргумент axis
. [код, документация]
Это самый быстрый способ в городе:
In [10]: x = np.random.random((500,500))
In [11]: %timeit np.apply_along_axis(np.linalg.norm, 1, x)
10 loops, best of 3: 21 ms per loop
In [12]: %timeit np.sum(np.abs(x)**2,axis=-1)**(1./2)
100 loops, best of 3: 2.6 ms per loop
In [13]: %timeit np.linalg.norm(x, axis=1)
1000 loops, best of 3: 1.4 ms per loop
И чтобы доказать, что он вычисляет одно и то же:
In [14]: np.allclose(np.linalg.norm(x, axis=1), np.sum(np.abs(x)**2,axis=-1)**(1./2))
Out[14]: True
Ответ 3
Гораздо быстрее, чем принятый ответ
numpy.sqrt(numpy.einsum('ij,ij->i', a, a))
Обратите внимание на масштаб журнала:
![enter image description here]()
Код для воспроизведения сюжета:
import numpy
import perfplot
def sum_sqrt(a):
return numpy.sqrt(numpy.sum(numpy.abs(a)**2, axis=-1))
def apply_norm_along_axis(a):
return numpy.apply_along_axis(numpy.linalg.norm, 1, a)
def norm_axis(a):
return numpy.linalg.norm(a, axis=1)
def einsum_sqrt(a):
return numpy.sqrt(numpy.einsum('ij,ij->i', a, a))
perfplot.show(
setup=lambda n: numpy.random.rand(n, 3),
kernels=[sum_sqrt, apply_norm_along_axis, norm_axis, einsum_sqrt],
n_range=[2**k for k in range(20)],
logx=True,
logy=True,
xlabel='len(a)'
)
Ответ 4
Попробуйте следующее:
In [16]: numpy.apply_along_axis(numpy.linalg.norm, 1, a)
Out[16]: array([ 5.38516481, 1.41421356, 5.38516481])
где a
- ваш 2D-массив.
Вышеописанная норма L2. Для другой нормы вы можете использовать что-то вроде:
In [22]: numpy.apply_along_axis(lambda row:numpy.linalg.norm(row,ord=1), 1, a)
Out[22]: array([9, 2, 9])