Ответ 1
Для (1) логически максимум parallelism будет ограничен наименее параллельной частью конвейера, который является 10 LFB, и это, вероятно, строго верно для нагрузки спроса parallelism, когда предварительная выборка отключена или может Помогите. На практике все сложнее, когда ваш груз, по крайней мере, частично помогает путем предварительной выборки, так как тогда могут использоваться более широкие очереди между L2 и ОЗУ, которые могли бы сделать наблюдаемый parallelism больше 10. Наиболее практичным подходом является, вероятно, непосредственное измерение: учитывая измеренную задержку в ОЗУ и наблюдаемую пропускную способность, вы можете рассчитать эффективный parallelism для любой конкретной нагрузки.
Для (2) я понимаю, что это наоборот: все промашки спроса в L1 сначала выделяются в LFB (если, конечно, они не попадают в существующий LFB) и могут позже включать "суперэкспорту" (или что-то еще называется в эти дни), если они также пропущены выше в иерархии кеша. Включенная диаграмма, похоже, подтверждает, что: единственный путь от L1 находится через очередь LFB.