Автоматически обнаруживать идентичные последовательные вызовы std::string:: find()

Во время просмотра кода я нашел исходный код следующим образом:

Внутри этой функции std::string:: find() вызывается три раза с тем же шаблоном (здесь "::" ).

Этот код, конечно, может быть реорганизован на

Кто-нибудь знает стратегию обнаружения такого шаблона, как это? У меня огромная база кода, где я собираюсь определить этот шаблон. Я планирую использовать среду Windows или Linux.

Я решил начать с потенциальной стратегии 1). Я планирую адаптировать cppcheck, чтобы поймать эту проблему.

Cppcheck предлагает возможность писать настраиваемые правила на основе регулярных выражений PCRE. Для этого cppcheck должен быть скомпилирован с поддержкой поддержки PCRE. Поскольку текущая среда тестирования основана на Linux, следующие команды можно использовать для загрузки последней версии cppcheck:

После этого скомпилируйте и установите инструмент следующим образом:

Теперь выполняется базовая настройка инструмента. Чтобы разработать правило cppcheck, я подготовил простой тестовый пример (файл: test.cpp), похожий на пример кода в первом разделе этой статьи. Этот файл содержит три функции, и правило cppcheck должно выдать предупреждение на f_odd и f_odd1 о последовательных одинаковых вызовах std::string::find.

Пока все хорошо. Теперь cppcheck должен быть изменен, чтобы поймать последовательные идентичные вызовы std::string::find. Для этого я создал cppcheck_rule файл, который содержит регулярное выражение, которое соответствует последовательным идентичным вызовам std::string::find:

Этот файл можно использовать для расширения cppcheck о новой проверке. Попробуем:

Теперь идентичные последовательные вызовы std::string::find могут быть обнаружены в кодах C/С++. Кто-нибудь знает лучшее/более эффективное или более умное решение?

Ответы

Ответ 1

Основная проблема с таким инструментом заключается в том, что лексический анализ может только проверять, есть ли текстовое повторение. Например, вызов className.find("::") дважды является потенциальной проблемой, если переменная ссылается на одну и ту же строку дважды. Но позвольте мне добавить небольшое изменение в ваш код: className = className.substr(className.find("::") + 2);. Внезапно значение следующего className.find резко изменилось.

Вы можете найти такие изменения? Для этого нужен полномасштабный компилятор, и даже тогда вы должны быть пессимистичными. Придерживаясь вашего примера, можно ли className изменить через итератор? Это не просто прямые манипуляции, о которых вы должны знать.

Нет ли положительных новостей? Ну: существующие компиляторы имеют аналогичный механизм. Он называется Common Subexpression Elimination, и он работает концептуально, так как вы хотите, чтобы он работал в приведенном выше примере. Но это также плохая новость одним способом: если ситуация обнаружима, это неважно, потому что она уже оптимизирована компилятором!