Почему этот код Haskell работает медленнее с -O?

Этот фрагмент кода Haskell выполняется гораздо медленнее с -O, но -O должен не опасен. Может ли кто-нибудь сказать мне, что случилось? Если это имеет значение, это попытка решить эту проблему и использует двоичный поиск и постоянное дерево сегментов:

(Это точно такой же код с обзором кода, но этот вопрос касается другой проблемы.)

Это результат выполнения на моем компьютере:

Ответы

Ответ 1

Думаю, пришло время ответить на этот вопрос.

Что случилось с вашим кодом с помощью `-O`

Позвольте мне увеличить вашу основную функцию и немного переписать ее:

main :: IO ()
main = do
    [n, m] <- fmap (map read . words) getLine
    line <- getLine
    let nodes = listArray (0, n) . tonodes n . map (subtract 1) . map read . words $ line
    replicateM_ m $ query n nodes

Очевидно, что намерение здесь состоит в том, что NodeArray создается один раз, а затем используется в каждой из m invocations query.

К сожалению, GHC эффективно преобразует этот код,

main = do
    [n, m] <- fmap (map read . words) getLine
    line <- getLine
    replicateM_ m $ do
        let nodes = listArray (0, n) . tonodes n . map (subtract 1) . map read . words $ line
        query n nodes

и вы можете сразу увидеть проблему здесь.

Что такое взлом состояния и почему он разрушает производительность моих программ

Причиной является взлом состояния, в котором говорится (примерно): "Когда что-то имеет тип IO a, предположим, что он вызывается только один раз". Официальная документация не намного сложнее:

-fno-state-hack

Отключить "взлом состояния", при котором любая лямбда с маркером состояния # в качестве аргумента считается однократной, поэтому считается, что внутри внутри нее есть встроенные элементы. Это может повысить производительность кодов ввода-вывода и ST, но это снижает риск совместного использования.

Грубо говоря, идея такова: если вы определяете функцию с типом IO и предложением where, например

foo x = do
    putStrLn y
    putStrLn y
  where y = ...x...

Что-то типа IO a можно рассматривать как нечто вроде RealWord -> (a, RealWorld). В этом отношении вышеприведенное становится (примерно)

foo x = 
   let y = ...x... in 
   \world1 ->
     let (world2, ()) = putStrLn y world1
     let (world3, ()) = putStrLn y world2
     in  (world3, ())

Вызов foo будет (обычно) выглядеть так: foo argument world. Но определение foo принимает только один аргумент, а второй - только локальным лямбда-выражением! Это будет очень медленный вызов foo. Было бы намного быстрее, если бы код выглядел так:

foo x world1 = 
   let y = ...x... in 
   let (world2, ()) = putStrLn y world1
   let (world3, ()) = putStrLn y world2
   in  (world3, ())

Это называется eta-расширением и выполняется по разным причинам (например, анализ определения функций, проверка того, как он называется, и - в этом случае - тип направленной эвристики).

К сожалению, это необоснованно, если вызов foo фактически имеет вид let fooArgument = foo argument, то есть с аргументом, но no world прошел (пока). В исходном коде, если fooArgument используется несколько раз, y будет вычисляться только один раз и совместно использовать. В модифицированном коде y будет перерасчитываться каждый раз - точно, что произошло с вашим nodes.

Можно ли зафиксировать вещи?