Есть ли эквивалент 'sscanf()' в .NET?
.NET Framework предоставляет метод Format:
string s = string.Format("This {0} very {1}.", "is", "funny");
// s is now: "This is very funny."
Мне нужна функция "Unformat", например:
object[] params = string.Unformat("This {0} very {1}.", "This is very funny.");
// params is now: ["is", "funny"]
Я знаю, что нечто подобное существует в библиотеке ANSI-C (printf vs scanf).
Вопрос: есть ли что-то похожее в С#?
Обновление: захват групп с регулярными выражениями не является тем решением, которое мне нужно. Они также являются одним из способов. Я ищу систему, которая может работать в обоих направлениях в одном формате. Это нормально, чтобы отказаться от некоторых функций (например, типов и информации форматирования).
Ответы
Ответ 1
Нет такого метода, возможно, из-за проблем, устраняющих двусмысленности:
string.Unformat("This {0} very {1}.", "This is very very funny.")
// are the parameters equal to "is" and "very funny", or "is very" and "funny"?
Для этой проблемы создаются регулярные выражения capture groups; вы можете посмотреть в них.
Ответ 2
Если кому-то интересно, я только что разместил замену scanf()
для .NET. Если регулярные выражения не совсем сокращают его для вас, мой код следует за строкой формата scanf()
довольно близко.
Вы можете увидеть и загрузить код, который я написал в http://www.blackbeltcoder.com/Articles/strings/a-sscanf-replacement-for-net.
Ответ 3
Вы можете сделать string [] parts = string.Split(''), а затем извлечь из него части позиции индекса [1] и части [3] в вашем примере.
Ответ 4
Регулярное выражение с группировкой?
/This (.*?) very (.*?)./
Ответ 5
Угу. Они называются "регулярными выражениями". Тот, который сделает это,
This (?<M0>.+) very (?<M1>.+)\.
Ответ 6
@mquander: Actualy, PHP решает его даже по-другому:
$s = "This is very very funny.";
$fmt = "This %s very %s.";
sscanf($s, $fmt, $one, $two);
echo "<div>one: [$one], two: [$two]</div>\n";
//echo's: "one: [is], two: [very]"
Но, может быть, ваше замечание о регулярном выражении может мне помочь. Мне просто нужно переписать "This {0} very {1}."
на что-то вроде: new Regex(@"^This (.*) very (.*)\.$")
. Это должно быть сделано программным, поэтому я могу использовать одну строку формата в интерфейсе открытого класса.
BTW: У меня уже есть синтаксический анализатор, чтобы найти параметры: см. запись Named Format Redux в блоге Phil Haack (и да, я также хочу, чтобы именованные параметры работали в обоих направлениях).
Ответ 7
Я столкнулся с одной и той же проблемой, я верю, что есть использование элегантного решения с использованием REGEX... но придумал функцию С# для "UnFormat", которая работает достаточно хорошо. Извините за отсутствие комментариев.
/// <summary>
/// Unformats a string using the original formating string.
///
/// Tested Situations:
/// UnFormat("<nobr alt=\"1\">1<nobr>", "<nobr alt=\"{0}\">{0}<nobr>") : "1"
/// UnFormat("<b>2</b>", "<b>{0}</b>") : "2"
/// UnFormat("3<br/>", "{0}<br/>") : "3"
/// UnFormat("<br/>4", "<br/>{0}") : "4"
/// UnFormat("5", "") : "5"
/// UnFormat("<nobr>6<nobr>", "<nobr>{0}<nobr>") : "6"
/// UnFormat("<nobr>2009-10-02<nobr>", "<nobr>{0:yyyy-MM-dd}<nobr>") : "2009-10-02"
/// UnFormat("<nobr><nobr>", "<nobr>{0}<nobr>") : ""
/// UnFormat("bla", "<nobr>{0}<nobr>") : "bla"
/// </summary>
/// <param name="original"></param>
/// <param name="formatString"></param>
/// <returns>If an "unformat" is not possible the original string is returned.</returns>
private Dictionary<int,string> UnFormat(string original, string formatString)
{
Dictionary<int, string> returnList = new Dictionary<int, string>();
try{
int index = -1;
// Decomposes Format String
List<string> formatDecomposed = new List<string> (formatString.Split('{'));
for(int i = formatDecomposed.Count - 1; i >= 0; i--)
{
index = formatDecomposed[i].IndexOf('}') + 1;
if (index > 0 && (formatDecomposed[i].Length - index) > 0)
{
formatDecomposed.Insert(i + 1, formatDecomposed[i].Substring(index, formatDecomposed[i].Length - index));
formatDecomposed[i] = formatDecomposed[i].Substring(0, index);
}
else
//Finished
break;
}
// Finds and indexes format parameters
index = 0;
for (int i = 0; i < formatDecomposed.Count; i++)
{
if (formatDecomposed[i].IndexOf('}') < 0)
{
index += formatDecomposed[i].Length;
}
else
{
// Parameter Index
int parameterIndex;
if (formatDecomposed[i].IndexOf(':')< 0)
parameterIndex = Convert.ToInt16(formatDecomposed[i].Substring(0, formatDecomposed[i].IndexOf('}')));
else
parameterIndex = Convert.ToInt16(formatDecomposed[i].Substring(0, formatDecomposed[i].IndexOf(':')));
// Parameter Value
if (returnList.ContainsKey(parameterIndex) == false)
{
string parameterValue;
if (formatDecomposed.Count > i + 1)
if (original.Length > index)
parameterValue = original.Substring(index, original.IndexOf(formatDecomposed[i + 1], index) - index);
else
// Original String not valid
break;
else
parameterValue = original.Substring(index, original.Length - index);
returnList.Add(parameterIndex, parameterValue);
index += parameterValue.Length;
}
else
index += returnList[parameterIndex].Length;
}
}
// Fail Safe #1
if (returnList.Count == 0) returnList.Add(0, original);
}
catch
{
// Fail Safe #2
returnList = new Dictionary<int, string>();
returnList.Add(0, original);
}
return returnList;
}
Ответ 8
Я ссылаюсь на более ранний ответ, написал образец, смотри следующий
string sampleinput = "FirstWord.22222";
Match match = Regex.Match(sampleinput, @"(\w+)\.(\d+)$", RegexOptions.IgnoreCase);
if(match.Success){
string totalmatchstring = match.Groups[0]; // FirstWord.22222
string firstpart = match.Groups[1]; // FirstWord`
string secondpart = match.Groups[2]; // 22222
}