Принудительное поведение numpy.sum при добавлении нулей

Я понимаю, как математически эквивалентные арифметические операции могут приводить к разным результатам из-за числовых ошибок (например, суммируя поплавки в разных порядках).

Однако меня удивляет, что добавление нулей в sum может изменить результат. Я думал, что это всегда относится к поплавкам, независимо от того, что: x + 0. == x.

Вот пример. Я ожидал, что все линии будут равны нулю. Может кто-нибудь объяснить, почему это происходит?

Кажется, что это не происходит при меньших значениях M и Z.

Вот еще один пример, который также демонстрирует, что встроенный python sum ведет себя как ожидалось:

Ответы

Ответ 1

Короткий ответ: Вы видите разницу между

a + b + c + d

(a + b) + (c + d)

который из-за неточностей с плавающей запятой не является тем же.

Длинный ответ: Numpy реализует парное суммирование как оптимизацию как скорости (это позволяет упростить векторизации), так и ошибки округления.

Здесь вы можете найти сумму-реализацию numpy здесь (функция [email protected]@). Он по существу делает следующее:

Если длина массива меньше 8, выполняется регулярное суммирование по петле. Вот почему странный результат не наблюдается, если W < 4 в вашем случае - в обоих случаях будет использоваться одно и то же суммирование по циклу.
Если длина составляет от 8 до 128, она накапливает суммы в 8 бит r[0]-r[7], а затем суммирует их на ((r[0] + r[1]) + (r[2] + r[3])) + ((r[4] + r[5]) + (r[6] + r[7])).
В противном случае он рекурсивно суммирует две половины массива.

Следовательно, в первом случае вы получаете a.sum() = a[0] + a[1] + a[2] + a[3], а во втором случае b.sum() = (a[0] + a[1]) + (a[2] + a[3]), что приводит к a.sum() - b.sum() != 0.