Получить значение атрибута HtmlAgilityPack
Я хочу получить значение атрибута HtmlAgilityPack. Код HTML:
<link href="style.css">
<link href="anotherstyle.css">
<link href="anotherstyle2.css">
<link itemprop="thumbnailUrl" href="#" onclick="location.href='http://image.jpg'; return false;">
<link href="anotherstyle5.css">
<link href="anotherstyle7.css">
Я хочу получить последний атрибут href.
Мой код С#:
HtmlWeb web = new HtmlWeb();
HtmlAgilityPack.HtmlDocument htmldoc = web.Load(Url);
htmldoc.OptionFixNestedTags = true;
var navigator = (HtmlNodeNavigator)htmldoc.CreateNavigator();
string xpath = "//link/@href";
string val = navigator.SelectSingleNode(xpath).Value;
Но этот код возвращает первое значение href.
Ответы
Ответ 1
После XPath выбирает link
элементы, которые имеют атрибут href
. Затем из ссылок вы выбираете последний:
var link = doc.DocumentNode.SelectNodes("//link[@href]").LastOrDefault();
// you can also check if link is not null
var href = link.Attributes["href"].Value; // "anotherstyle7.css"
Вы также можете использовать оператор last()
XPath
var link = doc.DocumentNode.SelectSingleNode("/link[@href][last()]");
var href = link.Attributes["href"].Value;
UPDATE: если вы хотите получить последний элемент с атрибутами itemprop
и href
, используйте XPath //link[@href and @itemprop][last()]
или //link[@href and @itemprop]
, если вы пойдете с первым подходом.
Ответ 2
вам нужно что-то вроде этого:
HtmlWeb web = new HtmlWeb();
HtmlAgilityPack.HtmlDocument htmldoc = web.Load(Url);
htmldoc.OptionFixNestedTags = true;
var navigator = (HtmlNodeNavigator)htmldoc.CreateNavigator();
string xpath = "//link[@itemprop]/@href";
string val = navigator.SelectSingleNode(xpath).Value;
Ответ 3
загрузите веб-страницу как Htmldocument и непосредственно выберите последний тег ссылки.
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load(Url);
var output = doc.DocumentNode.SelectNodes("//link[@href]").LastOrDefault();
var data = output.Attributes["href"].Value;
или
загрузите веб-страницу как Htmldocument и получите коллекцию всех выбранных тегов ссылок
затем перемещение с использованием цикла, затем доступ к последнему атрибуту тега select.
HtmlWeb web = new HtmlWeb();
HtmlDocument doc = web.Load(Url);
int count = 0;
string data = "";
var output = doc.DocumentNode.SelectNodes("//link[@href]");
foreach (var item in output)
{
count++;
if (count == output.Count)
{
data=item.Attributes["href"].Value;
break;
}
}
Ответ 4
Хорошо, я пришел к следующему:
var link = htmldoc.DocumentNode.SelectSingleNode("//link[@itemprop='thumbnailUrl']");
var href = link.Attributes["href"].Value;
Ответ 5
Получить HtmlNode по значению атрибута:
public static class Extensions
{
public static HtmlNode GetNodeByAttributeValue(this HtmlNode htmlNode, string attributeName, string attributeValue)
{
if (htmlNode.Attributes.Contains(attributeName))
{
if (string.Compare(htmlNode.Attributes[attributeName].Value, attributeValue, true) == 0)
{
return htmlNode;
}
}
foreach (var childHtmlNode in htmlNode.ChildNodes)
{
var resultNode = GetNodeByAttributeValue(childHtmlNode, attributeName, attributeValue);
if (resultNode != null) return resultNode;
}
return null;
}
}
Usage
Usage
var searchResultsDiv = pageDocument.DocumentNode.GetNodeByAttributeValue("someattributename", "resultsofsearch");