Самый эффективный способ проверить, начинается ли $string с $needle в perl

Учитывая две строковые переменные $string и $needle в perl, какой наиболее эффективный способ проверить, начинается ли $string с $needle.

Есть ли канонический способ сделать это в perl, о котором я не мог бы знать или каким-либо образом оптимизировать любое из вышеперечисленных решений?

(в моем конкретном случае использования $string и $needle в каждом прогоне будут отличаться друг от друга, поэтому предварительная компиляция регулярного выражения не является вариантом).

Пример того, как измерять производительность данного решения (здесь из POSIX sh):

С этими значениями index() работает лучше, чем substr()+eq с этой системой с perl 5.14.2, но с:

Ответы

Ответ 1

Насколько это важно, действительно? Я сделал ряд тестов, а метод index усреднил 0,68 микросекунды на итерацию; метод регулярного выражения 1.14 мкс; метод substr 0,16 мкс. Даже самые худшие сценарии (2250- char, равные), index заняли 2,4 мкс, регулярное выражение заняло 5,7 мкс, а substr заняло 0,5 мкс.

Мой совет - написать библиотечную процедуру:

sub begins_with
{
    return substr($_[0], 0, length($_[1])) eq $_[1];
}

и сосредоточьте свои усилия на оптимизации в другом месте.

ОБНОВЛЕНИЕ. Основываясь на критике моего сценария "худшего случая", описанного выше, я запускал новый набор тестов с произвольно созданной строкой в 20 000 < char, сравнивая ее с собой и с строкой, которая отличалась только последний байт.

Для таких длинных строк решение регулярных выражений было самым худшим (20 000 символов - ад): 105 мкс для успеха в матче, 100 мкс для неудачи матча.

Решения index и substr были довольно быстрыми. index составлял 11,83 мкс /11,86 мкс для успеха/неудачи, а substr составлял 4,09 мкс /4,15 мкс. Перемещение кода в отдельную функцию добавлено около 0.222 ± 0.05μs.

Код теста доступен по адресу: http://codepaste.net/2k1y8e

Я не знаю характеристик данных @Stephane, но мой совет стоит.