Лень и хвост рекурсии в Haskell, почему это грохот?
У меня есть эта довольно простая функция для вычисления среднего числа элементов большого списка, используя два аккумулятора для хранения суммы до сих пор и подсчета до сих пор:
mean = go 0 0
where
go s l [] = s / fromIntegral l
go s l (x:xs) = go (s+x) (l+1) xs
main = do
putStrLn (show (mean [0..10000000]))
Теперь, на строгом языке, это будет хвост-рекурсивным, и проблем не будет. Однако, поскольку Haskell ленив, мой поисковик привел меня к пониманию того, что (s + x) и (l + 1) будут переданы по рекурсии в виде thunks. Таким образом, все это сбой и ожоги:
Stack space overflow: current size 8388608 bytes.
После дальнейшего поиска в Google я нашел seq
и $!
. Кажется, что я не понимаю, потому что все мои попытки использовать их в этом контексте оказались бесполезными, а сообщения об ошибках говорили о бесконечных типах.
Наконец, я нашел -XBangPatterns
, который решает все это путем изменения рекурсивного вызова:
go !s !l (x:xs) = go (s+x) (l+1) xs
Но я не доволен этим, так как -XBangPatterns
в настоящее время является расширением. Я хотел бы знать, как сделать оценку строгой без использования -XBangPatterns
. (И, может быть, тоже научитесь!)
Просто, чтобы вы поняли мое отсутствие понимания, вот что я пробовал (единственная попытка скомпилировать, то есть):
go s l (x:xs) = go (seq s (s+x)) (seq l (l+1)) xs
Из того, что я мог понять, seq должен здесь заставить оценивать аргументы s и l, тем самым избегая проблемы, вызванной thunks. Но я все равно получаю переполнение стека.
Ответы
Ответ 1
Я подробно писал об этом:
Во-первых, да, если вы хотите потребовать строгой оценки аккумуляторов, используйте seq
и оставайтесь в Haskell 98:
mean = go 0 0
where
go s l [] = s / fromIntegral l
go s l (x:xs) = s `seq` l `seq`
go (s+x) (l+1) xs
main = print $ mean [0..10000000]
*Main> main
5000000.0
Во-вторых: анализ строгости начнется, если вы дадите аннотации некоторого типа и скомпилируйте с помощью -O2:
mean :: [Double] -> Double
mean = go 0 0
where
go :: Double -> Int -> [Double] -> Double
go s l [] = s / fromIntegral l
go s l (x:xs) = go (s+x) (l+1) xs
main = print $ mean [0..10000000]
$ ghc -O2 --make A.hs
[1 of 1] Compiling Main ( A.hs, A.o )
Linking A ...
$ time ./A
5000000.0
./A 0.46s user 0.01s system 99% cpu 0.470 total
Потому что "Двойной" является оболочкой над строгим атомным типом Double #, с оптимизацией и точным типом, GHC проводит анализ строгости и сообщает, что строгая версия будет в порядке.
import Data.Array.Vector
main = print (mean (enumFromToFracU 1 10000000))
data Pair = Pair !Int !Double
mean :: UArr Double -> Double
mean xs = s / fromIntegral n
where
Pair n s = foldlU k (Pair 0 0) xs
k (Pair n s) x = Pair (n+1) (s+x)
$ ghc -O2 --make A.hs -funbox-strict-fields
[1 of 1] Compiling Main ( A.hs, A.o )
Linking A ...
$ time ./A
5000000.5
./A 0.03s user 0.00s system 96% cpu 0.038 total
Как описано в главе RWH выше.
Ответ 2
Функция seq
принудительно оценивает первый параметр после вызова функции. Когда вы передаете seq s (s+x)
в качестве параметра, функция seq
не вызывается немедленно, потому что нет необходимости оценивать значение этого параметра. Вы хотите, чтобы вызов seq
оценивался до рекурсивного вызова, так что это, в свою очередь, может заставить его параметр быть оцененным.
Обычно это делается ссылкой:
go s l (x:xs) = s `seq` l `seq` go (s+x) (l+1) xs
Это синтаксическая вариация seq s (seq l (go (s+x) (l+1) xs))
. Здесь вызовы seq
являются внешними вызовами функций в выражении. Из-за лени Haskell это заставляет их сначала оценивать: seq
вызывается с еще невыплаченными параметрами s
и seq l (go (s+x) (l+1) xs)
, оценка параметров откладывается до точки, где кто-то действительно пытается получить доступ к своим значениям.
Теперь seq
может заставить свой первый параметр быть оценен перед возвратом остальной части выражения. Тогда следующим шагом в оценке будет второй seq
. Если вызовы на seq
где-то захоронены каким-то параметром, они могут не выполняться в течение длительного времени, превзойдя их цель.
С измененными позициями seq
программа выполняет штраф, не используя чрезмерные объемы памяти.
Другим решением проблемы было бы просто включить оптимизацию в GHC при компиляции программы (-O
или -O2
). Оптимизатор распознает неприемлемую лень и создает код, который не выделяет ненужную память.
Ответ 3
Вы правы в своем понимании, что seq s (s+x)
заставляет оценивать s
. Но он не заставляет s+x
, поэтому вы все еще создаете громкие трюки.
Используя $!
, вы можете принудительно выполнить оценку добавления (два раза для обоих аргументов). Это обеспечивает тот же эффект, что и при использовании шаблонов взлома:
mean = go 0 0
where
go s l [] = s / fromIntegral l
go s l (x:xs) = ((go $! s+x) $! l+1) xs
Использование функции $!
приведет к переводу go $! (s+x)
в эквивалент:
let y = s+x
in seq y (go y)
Таким образом, y
сначала принудительно переходит в слабую гласную нормальную форму, что означает, что применяется внешняя функция. В случае y
самая внешняя функция +
, поэтому y
полностью вычисляется до числа перед передачей в go
.
О, и вы, вероятно, получили сообщение об ошибке бесконечного типа, потому что у вас не было круглых скобок в нужном месте. У меня такая же ошибка, когда я впервые написал вашу программу: -)
Поскольку оператор $!
является правильным ассоциативным, без круглой скобки go $! (s+x) $! (l+1)
означает то же самое, что: go $! ((s+x) $! (l+1))
, что, очевидно, неверно.