Факел суммирует тензор вдоль оси

ipdb> outputs.size()
torch.Size([10, 100])
ipdb> print sum(outputs,0).size(),sum(outputs,1).size(),sum(outputs,2).size()
(100L,) (100L,) (100L,)

Как я могу суммировать по столбцам?

Ответы

Ответ 1

Самое простое и лучшее решение - использовать torch.sum().

Суммировать все элементы тензора:

torch.sum(outputs) # gives back a scalar

Суммировать по всем строкам (т.е. Для каждого столбца):

torch.sum(outputs, dim=0) # size = [1, ncol]

Суммирование по всем столбцам (т.е. Для каждой строки):

torch.sum(outputs, dim=1) # size = [nrow, 1]

Ответ 2

В качестве альтернативы вы можете использовать tensor.sum(axis) где axis показывает 0 и 1 для суммирования по строкам и столбцам соответственно, для 2D-тензора.

In [210]: X
Out[210]: 
tensor([[  1,  -3,   0,  10],
        [  9,   3,   2,  10],
        [  0,   3, -12,  32]])

In [211]: X.sum(1)
Out[211]: tensor([ 8, 24, 23])

In [212]: X.sum(0)
Out[212]: tensor([ 10,   3, -10,  52])

Как видно из приведенных выше выходов, в обоих случаях выход представляет собой одномерный тензор. Если, с другой стороны, вы также хотите сохранить размер исходного тензора в выходных данных, тогда вы установили для логического значения kwarg keepdim значение True как в:

In [217]: X.sum(0, keepdim=True)
Out[217]: tensor([[ 10,   3, -10,  52]])

In [218]: X.sum(1, keepdim=True)
Out[218]: 
tensor([[ 8],
        [24],
        [23]])

Ответ 3

Если у вас есть тензор my_tensor, и вы хотите суммировать по второму измерению массива (то есть, с индексом 1, который является размерностью столбца, если тензор двумерный, как у вас), используйте torch.sum(my_tensor,1) или эквивалентно my_tensor.sum(1) см. документацию здесь.

Одна вещь, которая явно не упоминается в документации: вы можете суммировать по последнему измерению массива с помощью -1 (или второго по последнему измерению с -2 и т.д.)

Итак, в вашем примере вы можете использовать: outputs.sum(1) или torch.sum(outputs,1) или, что эквивалентно, outputs.sum(-1) или torch.sum(outputs,-1). Все это даст один и тот же результат - выходной тензор размера torch.Size([10]), где каждая запись является суммой по всем строкам в данном столбце outputs тензора.

Для иллюстрации с трехмерным тензором:

In [1]: my_tensor = torch.arange(24).view(2, 3, 4) 
Out[1]: 
tensor([[[ 0,  1,  2,  3],
         [ 4,  5,  6,  7],
         [ 8,  9, 10, 11]],

        [[12, 13, 14, 15],
         [16, 17, 18, 19],
         [20, 21, 22, 23]]])

In [2]: my_tensor.sum(2)
Out[2]:
tensor([[ 6, 22, 38],
        [54, 70, 86]])

In [3]: my_tensor.sum(-1)
Out[3]:
tensor([[ 6, 22, 38],
        [54, 70, 86]])