Запрос HttpClient как браузер
Когда я вызываю сайт www.livescore.com по классу HttpClient, я всегда получаю ошибку "500".
Вероятно, сервер заблокировал запрос от HttpClients.
1) Есть ли какой-либо другой способ получить html с веб-страницы?
2) Как я могу настроить заголовки для получения html-контента?
Когда я устанавливаю заголовки, как в браузере, я всегда получаю stange-кодированный контент.
http_client.DefaultRequestHeaders.TryAddWithoutValidation("Accept", "text/html,application/xhtml+xml,application/xml");
http_client.DefaultRequestHeaders.TryAddWithoutValidation("Accept-Encoding", "gzip, deflate");
http_client.DefaultRequestHeaders.TryAddWithoutValidation("User-Agent", "Mozilla/5.0 (Windows NT 6.2; WOW64; rv:19.0) Gecko/20100101 Firefox/19.0");
http_client.DefaultRequestHeaders.TryAddWithoutValidation("Accept-Charset", "ISO-8859-1");
3) Как я могу решить эту проблему? Любые предложения?
Я использую приложение "Стиль Metro 8" в С# и HttpClientClass
Ответы
Ответ 1
Вот, пожалуйста, обратите внимание, что вы должны распаковать кодированный gzip-результат, который вы получите в соответствии с mleroy:
private static readonly HttpClient _HttpClient = new HttpClient();
private static async Task<string> GetResponse(string url)
{
using (var request = new HttpRequestMessage(HttpMethod.Get, new Uri(url)))
{
request.Headers.TryAddWithoutValidation("Accept", "text/html,application/xhtml+xml,application/xml");
request.Headers.TryAddWithoutValidation("Accept-Encoding", "gzip, deflate");
request.Headers.TryAddWithoutValidation("User-Agent", "Mozilla/5.0 (Windows NT 6.2; WOW64; rv:19.0) Gecko/20100101 Firefox/19.0");
request.Headers.TryAddWithoutValidation("Accept-Charset", "ISO-8859-1");
using (var response = await _HttpClient.SendAsync(request).ConfigureAwait(false))
{
response.EnsureSuccessStatusCode();
using (var responseStream = await response.Content.ReadAsStreamAsync().ConfigureAwait(false))
using (var decompressedStream = new GZipStream(responseStream, CompressionMode.Decompress))
using (var streamReader = new StreamReader(decompressedStream))
{
return await streamReader.ReadToEndAsync().ConfigureAwait(false);
}
}
}
}
называть такие как:
var response = await GetResponse("http://www.livescore.com/").ConfigureAwait(false); // or var response = GetResponse("http://www.livescore.com/").Result;
Ответ 2
Можно также попробовать это, чтобы добавить поддержку сжатия:
var compressclient = new HttpClient(new HttpClientHandler()
{
AutomaticDecompression = DecompressionMethods.Deflate | DecompressionMethods.GZip
});
Это также добавляет заголовки.
В соответствии с той же поддержкой потоков в системе Windows Store: http://social.msdn.microsoft.com/Forums/windowsapps/en-US/429bb65c-5f6b-42e0-840b-1f1ea3626a42/httpclient-data-compression-and-caching?prof=required
Ответ 3
Несколько замечаний.
-
Этот сайт требует, чтобы вы предоставили агент пользователя, или он возвращает 500 HTTP-ошибок.
-
Запрос GET для livecore.com отвечает 302 на livescore.us. Вам необходимо обработать перенаправление или напрямую запросить livecore.us
- Вам нужно распаковать gzip-сжатый ответ
Этот код работает с использованием .NET Client Client, я дам вам понять, подходит ли оно для приложения Windows Store.
var request = (HttpWebRequest)HttpWebRequest.Create("http://www.livescore.com");
request.AllowAutoRedirect = true;
request.UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.57 Safari/537.17";
string content;
using (var response = (HttpWebResponse)request.GetResponse())
using (var decompressedStream = new GZipStream(response.GetResponseStream(), CompressionMode.Decompress))
using (var streamReader = new StreamReader(decompressedStream))
{
content = streamReader.ReadToEnd();
}
Ответ 4
Я думаю, вы можете быть уверены, что сделали все, чтобы остановить разработчиков с экрана.
Если я попытаюсь выполнить стандартный проект С# с помощью этого кода:
var request = WebRequest.Create("http://www.livescore.com ");
var response = request.GetResponse();
Получаю этот ответ:
The remote server returned an error: (403) Forbidden.