Почему hGetBuf, hPutBuf и т.д. Выделяют память?

В процессе выполнения простого бенчмаркинга я наткнулся на то, что меня удивило. Возьмите этот фрагмент из Network.Socket.Splice:

Можно было бы ожидать, что здесь hGetBufSome и hPutBuf не потребуется выделять память, поскольку они записывают и считывают из предварительно выделенного буфера. docs, похоже, поддерживает эту интуицию... Но, увы:

Я должен предположить, что это специально... но я понятия не имею, что это за цель. Еще хуже: я просто достаточно умен, чтобы получить этот профиль, но не достаточно умный, чтобы точно определить, что выделяется.

ОБНОВЛЕНИЕ: Я сделал еще несколько профилирования с двумя сильно упрощенными тестовыми окнами. Первый тестовый файл напрямую использует операции чтения/записи из System.Posix.Internals:

Как вы могли бы надеяться, каждый раз через цикл он не выделяет память в куче. Второй тест использует операции чтения/записи из GHC.IO.FD:

ОБНОВЛЕНИЕ # 2: Мне было предложено записать это как ошибку в GHC Trac... Я все еще не уверен, что на самом деле это ошибка (в отличие от преднамеренного поведения, известного ограничения, или что-то еще), но вот он: https://ghc.haskell.org/trac/ghc/ticket/9696

Ответы

Ответ 1

Похоже, что вывод: это ошибка.

Ответ 2

Я попытаюсь угадать, основываясь на code

Время выполнения пытается оптимизировать небольшие чтения и записи, поэтому он поддерживает внутренний буфер. Если ваш буфер длится 1 байт, он будет неэффективным, чтобы использовать его по-разному. Таким образом, внутренний буфер используется для чтения большего количества данных. Это, вероятно, ~ 32 КБ. Плюс что-то подобное для написания. Плюс ваш собственный буфер.

В коде есть оптимизация - если вы указываете буфер больше, чем внутренний, а затем пуст, он будет использовать ваш буфер правильно. Но внутренний буфер уже выделен, поэтому он будет не меньше использования памяти. Я не знаю, как распустить внутренний буфер, но вы можете открыть запрос функции, если это важно для вас.

(Я понимаю, что моя догадка может быть абсолютно неправильной.)

ADD:

Этот, кажется, выделяет, но я до сих пор не знаю почему.

В чем вы нуждаетесь, максимальное использование памяти или количество выделенных байтов?

c_read - это функция C, она не выделяется на кучу haskell (но может выделяться на кучу C).

readRawBufferPtr является функцией Haskell, и обычно для функций haskell выделяется много памяти, что быстро становится мусором. Просто из-за неизменности. Обычно программа haskell выделяет, например, 100 ГБ, в то время как использование памяти составляет менее 1 МБ.