Визуальная ошибка сегментации SIGSEGV в методе std::string:: assign() из libstdС++. So.6

Моя программа недавно столкнулась с странным segfault при запуске. Я хочу знать, встречался ли кто-то с этой ошибкой раньше и как это можно было бы исправить. Вот дополнительная информация:

Обратите внимание, что segfault начинается с basic_string:: operator =().

Связанный код: (Я показал больше кода, чем это могло бы потребоваться, и, пожалуйста, игнорируйте теперь стиль стиля кодирования.)

Я думаю, что такие операции присваивания строк должны быть своего рода широко используемым, но я просто не понимаю, почему здесь может возникнуть segfault.

Я искал в Интернете ответы. Я посмотрел на здесь. В ответе говорится о попытке перекомпилировать программу с макросом _GLIBCXX_FULLY_DYNAMIC_STRING. Я попытался, но авария все еще происходит.

Я также посмотрел здесь. Он также говорит, что перекомпилировать программу с помощью _GLIBCXX_FULLY_DYNAMIC_STRING, но автор, похоже, имеет дело с другой проблемой с моей, поэтому я не думаю, что его решение работает для меня.

Привет, ребята, вот оригинальный код этого FormatTimeStamp. Я понимаю, что кодировка выглядит не очень красиво (слишком много магических чисел, например..), но сначала сосредоточьтесь на проблеме сбоев.

Эта проблема наконец решена и исправлена. Функция FormatTimeStamp() не имеет ничего общего с основной причиной. Segfault вызван переполнением записи локального буфера char.

Эта проблема может быть воспроизведена с помощью следующей более простой программы (пожалуйста, не обращайте внимания на плохие имена некоторых переменных):

Вот два факта, которые мы должны помнить, прежде чем продолжать: 1). Моя машина - это компьютер Intel x86, поэтому он использует правило Little Endian. Поэтому для переменной "m" типа int, значением которой является, скажем, 10, ее макет памяти может выглядеть следующим образом:

2). Программа выше работает в основном потоке. Когда дело доходит до функции overflow_it(), расположение переменных в потоковом стеке выглядит так (что показывает только важные переменные):

1). m - счетчик в overflow_it(), значение которого увеличивается на 1 в каждом цикле и максимальное значение которого не должно превышать 6. Таким образом, его значение может быть полностью сохранено в m (байт # 1) (помните, что Little Endian), который бывает 3.

2). В строке с ошибкой: Когда t является 3-значным целым числом, таким как 109, тогда вызов sprintf() приведет к переполнению буфера, потому что сериализация номера 109 в строке "109" фактически требует 4 байта: '1', '0', '9' и завершение '\ 0'. Поскольку temp [] выделяется только с 3 байтами, окончательный '\ 0' определенно будет записан в temp 3, который является только m ( байт # 1), который, к сожалению, сохраняет значение m. В результате значение m равно reset to 0 каждый раз.

3). Однако ожидание программиста состоит в том, что цикл for в overflow_it() будет выполняться только 6 раз, причем каждый раз, когда m увеличивается на 1. Поскольку m всегда reset до 0, фактическое время цикла намного больше, чем 6 раз.

4). Давайте посмотрим на переменную я в overflow_it(): каждый раз, когда цикл for выполняется, значение я увеличивается на 2, и будет доступен доступ к A15Result [i]. Однако, если вы скомпилируете и запустите эту программу, вы увидите, что значение я добавит до 24, что означает, что overflow_it() записывает данные в байты от A15Result [0] до A15Result [23]. Обратите внимание, что объект str равен всего 16 байтам позади A15Result [0], поэтому overflow_it() имеет "sweeped through" str и уничтожает правильную макет памяти.

5). Я думаю, что правильное использование std::string, так как это не-POD-структура данных, зависит от того, что экземпляр объекта std::string должен иметь правильное внутреннее состояние. Но в этой программе внутренняя структура str была изменена силой извне. Это должно быть, почему вызов метода assign(), наконец, вызовет segfault.

В моем предыдущем обновлении от 08/19/2011 я сказал, что segfault был вызван вызовом метода локального объекта std::string, структура памяти которого была сломана и, таким образом, стала "уничтоженным" объектом. Это не "всегда" истинная история. Рассмотрим программу на С++ ниже:

Вызов Hello() будет успешным. Это будет успешным, даже если вы назначите явно плохой указатель на pa. Причина в том, что не виртуальные методы класса не находятся внутри макета памяти объекта, в соответствии с объектной моделью С++. Компилятор С++ превращает метод A:: Hello() в нечто вроде, скажем, A_Hello_xxx (A * const this,...), которое может быть глобальной функцией. Таким образом, до тех пор, пока вы не будете работать с указателем "this", все будет хорошо.

Этот факт показывает, что "плохим" объектом является НЕ основная причина, которая приводит к segfault SIGSEGV. Метод assign() не является виртуальным в std::string, поэтому объект "bad" std::string не будет вызывать segfault. Должна быть другая причина, которая в конечном итоге вызвала segfault.

Я заметил, что segfault происходит из функции __gnu_cxx:: __ exchange_and_add(), поэтому я изучил его исходный код в этой веб-странице

Наконец, __exchange_and_add() вызывает __sync_fetch_and_add(). Согласно этой веб-странице, функция __sync_fetch_and_add() является встроенной функцией GCC, поведение которой выглядит следующим образом:

Вот оно! Указанный переданный указатель ptr разыменовывается здесь. В программе 08/19/2011 ptr фактически является указателем "this" объекта "bad" std::string в методе assign(). Именно разрывы в этой точке фактически вызвали ошибку сегментации SIGSEGV.

Мы могли бы протестировать это со следующей программой:

Ответы

Ответ 1

Возможны две возможности:

некоторый код до строки 798 повредил локальный tmpTimeStamp Объект
возвращаемое значение из FormatTimeStamp() было каким-то плохим.

_GLIBCXX_FULLY_DYNAMIC_STRING, скорее всего, красная селедка и не имеет ничего общего с проблемой.

Если вы установите пакет debuginfo для libstdc++ (я не знаю, что он назвал CentOS), вы сможете "видеть" этот код и, возможно, сможете определить, (LHS) или RHS оператора присваивания вызвали проблему.

Если это невозможно, вам придется отлаживать это на уровне сборки. Переход в рамку #2 и выполнение x/4x $ebp должно дать вам предыдущий ebp, адрес вызывающего абонента (0x081402fc), LHS (должен соответствовать &tmpTimeStamp в кадре #3) и RHS. Идите оттуда, и удачи!

Ответ 2

Я предполагаю, что внутри функции FormatTimeStamp может быть какая-то проблема, но без исходного кода трудно сказать что-либо. Попробуйте проверить свою программу под Valgrind. Обычно это помогает исправить такие ошибки.