Неисправности скорости подсчета списка Haskell

Я пытаюсь оптимизировать скорость выполнения своей программы, и я натолкнулся на некоторые интересные результаты, и я надеюсь, что кто-то сможет ответить. Кажется, что внесение небольших изменений в одно из моих понятий списка резко меняет скорость выполнения, но я не знаю почему.

Сейчас программа работает на моем компьютере ~ 350 мс (скомпилирована с GHC 7.8.2-O2) с matrix.txt, предоставленным Проект Эйлера.

время выполнения увеличивается до более 1сек.
Другие незначительные изменения, такие как перемещение фильтра на следующей строке в понимание списка, дают тот же результат: ~ 1 с.
Может ли кто-нибудь объяснить, почему это происходит?

EDIT: похоже, этого не происходит в более ранних версиях GHC. Я пробовал GHC 7.6.3, и каждый из них выполнял примерно то же самое.

Я включил дампы из ghc -O2 -ddump-simpl -dsuppress-all, как это было предложено cdk. Я действительно не знаю, на что я смотрю, поэтому, если кто-то сможет интерпретировать, это будет большой помощью, спасибо.

EDIT2 (Ответ на Прийатам): Я не думаю, что дело. Я изменил

с помощью BangPatterns, и это все еще работает чуть больше секунды. Фактически, изменение neigbs из

увеличивает время выполнения до более чем 1сек.

Ответы

Ответ 1

Здесь можно догадаться, что произошло с let ts = vs. let !ts =. я получил его от просмотра вывода -ddump-stranal (который выгружает аннотации анализа строгости) и чтение Анализатор спроса в GHC.

Разница между let !ts = и let ts = заключается в том, что если ts равно внизу (т.е. undefined), то n не будет оцениваться вообще потому что ts будет оценен первым, и оценка остановится. Это что разница между двумя программами заключается в том, что пара целые числа n строгие и распакованные в одной версии, но не в другой (см. вывод -ddump-stranal и -ddump-simpl; ссылка выше описывает выход).

Как !ts или не !ts влияет на строгость n? Я думаю, что если ts является нижней, тогда программа должна завершиться с ошибкой перед оценкой n или любой из его элементов (я не уверен, что он сам n :: (Int, Int) или его элементы). Поэтому ghc, похоже, делает правильные вещи, чтобы сохранить n нестрогий, когда ts требуется быть строгим, поскольку оценка n первая и, возможно, неудача в другом месте может быть ошибкой.

Далее, как вы вынуждаете !ts не влиять на n? Обратите внимание, что ts не может быть дном без n, являющимся нижним, если либо gs, current, или m, как известно, не являются дном (это все элементы выражения, кроме n) и уже были оценены (я думаю, что M.! и ! могут никогда не дно, не оценивая их аргументы в первую очередь). Поэтому нам нужно наложить условие "ts - это дно n является нижней и уже оценен ", так что ghc знает, что сначала можно оценить n.

Мое решение: добавьте шаблоны ударов в current, gs и m. С моим ghc 7.8.2, это, похоже, решает проблему. Также кажется, что нужно принудительно выполнить только current.

Я не слишком уверен в первоначальном вопросе о перемещении выражения ts в кортеж, но похожее решение работает.

P.S. Обратите внимание, что

filter (\x -> x > 5) [x | x <- [1..10]] == [x | x <- [1..10], x > 5]

поэтому в ваших списках neighbs и actionable было бы проще привнести предикат фильтра в представление самого списка так:

[(n, ts)
| n <- neighbors current
, S.notMember n closed
, let ts = gs M.! current + m ! n
, S.notMember n open' || ts < (gs M.! n)
]

Ответ 2

Это не полный ответ, так как мне не хватает информации о том, как let и контексты списка реализуются внутри.

Каждый элемент в neighbs является кортежем, а в WHNF сумма не оценивается строго. Это оставляет необоснованные громы, которые могут увеличить время выполнения.

Я предлагаю переписать второе определение с помощью seq без использования let, если возможно, посмотреть, падает ли время выполнения (в этом случае этот ответ, вероятно, будет правильным).

Прочитайте этот, чтобы понять, что такое WHNF.