Альтернатива С++ для синтаксического анализа с помощью sscanf

Предполагая, что моя программа ожидает аргументы формы [ 0.562 , 1.4e-2 ] (т.е. пары поплавков), как я должен анализировать этот ввод на С++ без регулярных выражений? Я знаю, что есть много угловых случаев для рассмотрения, когда речь заходит о пользовательском вводе, но пусть предположить, что данный вход близко соответствует указанному выше формату (кроме дополнительных пробелов).

В C я мог бы сделать что-то вроде sscanf(string, "[%g , %g]", &f1, &f2);, чтобы извлечь два значения с плавающей запятой, что очень компактно.

В С++ это то, что я придумал до сих пор:

std::string s = "[ 0.562 , 1.4e-2 ]"; // example input

float f1 = 0.0f, f2 = 0.0f;

size_t leftBound = s.find('[', 0) + 1;
size_t count = s.find(']', leftBound) - leftBound;

std::istringstream ss(s.substr(leftBound, count));
string garbage;

ss >> f1 >> garbage >> f2;

if(!ss)
  std::cout << "Error while parsing" << std::endl;

Как я могу улучшить этот код? В частности, я связан с строкой garbage, но я не знаю, как еще пропустить , между этими двумя значениями.

Ответы

Ответ 1

Очевидным подходом является создание простого манипулятора и его использование. Например, манипулятор, использующий статически предоставленный char, чтобы определить, является ли следующий символ без пробелов этим символом, и, если это так, выдержки, он может выглядеть следующим образом:

#include <iostream>
#include <sstream>

template <char C>
std::istream& expect(std::istream& in)
{
    if ((in >> std::ws).peek() == C) {
        in.ignore();
    }
    else {
        in.setstate(std::ios_base::failbit);
    }
    return in;
}

Затем вы можете использовать манипулятор таким образом для извлечения символов:

int main(int ac, char *av[])
{
    std::string s(ac == 1? "[ 0.562 , 1.4e-2 ]": av[1]);
    float f1 = 0.0f, f2 = 0.0f;

    std::istringstream in(s);
    if (in >> expect<'['> >> f1 >> expect<','> >> f2 >> expect<']'>) {
        std::cout << "read f1=" << f1 << " f2=" << f2 << '\n';
    }
    else {
        std::cout << "ERROR: failed to read '" << s << "'\n";
    }
}

Ответ 2

Если вы можете использовать повышение, вы можете использовать Дух.

Увидеть

Из string Live On Coliru (в С++ 03):
Обновление А вот подход, если вы на самом деле пытались читать из потока (на самом деле он несколько проще и очень хорошо интегрируется с другими вашими действиями по чтению потока):
Жить на Колиру тоже (c++ 03)

Несмотря на то, что это кажется более многословным, Spirit также намного более мощный и безопасный для типов, чем sscanf. И это работает на потоках.

Также обратите внимание, что inf, -inf, nan будет обрабатываться как ожидалось.

Live On Coliru

#include <boost/spirit/include/qi.hpp>
#include <boost/spirit/include/qi_match.hpp>
#include <sstream>

namespace qi = boost::spirit::qi;

int main()
{
    std::istringstream ss("[ 0.562 , 1.4e-2 ]"); // example input
    ss.unsetf(std::ios::skipws); // we might **want** to handle whitespace in our grammar, not needed now

    float f1 = 0.0f, f2 = 0.0f;

    if (ss >> qi::phrase_match('[' >> qi::double_ >> ',' >> qi::double_ >> ']', qi::space, f1, f2))
    {
        std::cout << "Parsed: " << f1 << " and " << f2 << "\n"; // default formatting...
    } else
    {
        std::cout << "Error while parsing" << std::endl;
    }
}

Ответ 3

Помимо регулярных выражений, возможно, что-то в Boost можно использовать. Но если вы не можете использовать Boost, вы можете определить грань std::ctype<char>, которая эффективно игнорирует все ненужные символы, классифицируя их как пробельные символы. Вы можете установить этот фасет в локаль и наполнить его в ss.

Ответ 4

Использование старой школы и простоты:

std::istringstream inp_str("[ 0.562 , 1.4e-2 ]");
double x;
double y;
char c;
inp_str >> c; // Eat the '['
inp_str >> x; // Input the first ordinate.
inp_str >> c >> c; // Eat the space and comma.
inp_str >> y; // Input the second ordinate.

Это работает, потому что оператор извлечения пропускает ведущие пробелы для числовых типов.