Понимание кода в реализации strlen

У меня есть два вопроса относительно реализации strlen в string.h в glibc.

Ответ 1

Это используется для поиска 4 байтов (32 бита) или даже 8 (64 бит) за один раз, чтобы проверить, является ли один из них нулем (конец строки) вместо проверки каждого байта отдельно.

Вот один пример проверки нулевого байта:

unsigned int v; // 32-bit word to check if any 8-bit byte in it is 0
bool hasZeroByte = ~((((v & 0x7F7F7F7F) + 0x7F7F7F7F) | v) | 0x7F7F7F7F);

Для более подробной информации см. Бит Tweedling Hacks.

Используемый здесь (32-разрядный пример):

Существует еще более быстрый метод - используйте hasless (v, 1), который определен ниже; он работает в 4 операциях и не требует подсекции проверка. Это упрощает

#define haszero(v) (((v) - 0x01010101UL) & ~(v) & 0x80808080UL)

Подвыражение (v - 0x01010101UL) оценивается как высокий бит, установленный в любой байт, когда соответствующий байт в v равен нулю или больше, чем 0x80. Подвыражение ~ v и 0x80808080UL оценивается с помощью набора высоких бит в байтах, где байт v не имеет своего битового набора (так что байт был меньше 0x80). Наконец, посредством ANDing этих двух подвыражений результатом являются высокие биты, в которых байты в v равны нулю, поскольку высокие биты, установленные из-за значения, превышающего 0x80 в первом подвыражение маскируется вторым.

Глядя на один байт за раз, стоит, по крайней мере, столько циклов процессора, сколько смотрит на полное межсетевое значение (регистр широкий). В этом алгоритме проверяются полные целые числа, чтобы увидеть, содержат ли они нуль. Если нет, используются небольшие инструкции, и можно перейти к следующему полному целому. Если внутри есть нулевой байт, делается еще одна проверка, чтобы увидеть, в какой именно точке оно было.

Понимание кода в реализации strlen

Ответы

Ответ 1