Анализ HTML с помощью С#.net
Я пытаюсь разобрать следующий HTML файл, мне бы хотелось получить значение ключа. Это делается для телефона Silverlight для Windows.
<HTML>
<link ref="shortcut icon" href="favicon.ico">
<BODY>
<script Language="JavaScript">
location.href="login.html?key=UEFu1EIsgGTgAV7guTRhsgrTQU28TImSZkYhPMLj7BChpBkvlCO11aJU2Alj4jc5"
</script>
<CENTER><a href="login.html?key=UEFu1EIsgGTgAV7guTRhsgrTQU28TImSZkYhPMLj7BChpBkvlCO11aJU2Alj4jc5">Welcome</a></CENTER></BODY></HTML>
любая идея о том, куда идти отсюда?
спасибо
Ответы
Ответ 1
Дайте HTMLAgilityPack посмотреть. Его довольно приличный парсер HTML
http://html-agility-pack.net/?z=codeplex
======
Здесь приведен код для запуска (требуется проверка ошибок)
HtmlDocument document = new HtmlDocument();
string htmlString = "<html>blabla</html>";
document.LoadHtml(htmlString);
HtmlNodeCollection collection = document.DocumentNode.SelectNodes("//a");
foreach (HtmlNode link in collection)
{
string target = link.Attributes["href"].Value;
}
Ответ 2
Вы можете использовать регулярное выражение (класс Regex) для него. Выражение может быть примерно таким: login.html\?key=[^"]*