Ответ 1
Я хотел бы внести некоторый код в Алексей ответить. Несколько моментов:
-
Строго говоря, не всегда возможно определить, когда страница закончила рендеринг со 100% -ной вероятностью. Некоторые страницы являются довольно сложными и используют непрерывные обновления AJAX. Но мы может быть довольно близко, путем опроса текущего моментального снимка HTML для изменений и проверка свойства
WebBrowser.IsBusy
. То, чтоLoadDynamicPage
ниже. -
Некоторая логика тайм-аута должна присутствовать над вышесказанным, в случае, если рендеринг страниц бесконечен (примечание
CancellationTokenSource
). -
Async/await
- отличный инструмент для кодирования этого, поскольку он дает линейную кода к нашей асинхронной логике опроса, что значительно упрощает ее. -
Важно включить рендеринг HTML5 с помощью Функция браузера Control, поскольку
WebBrowser
работает в режиме эмуляции IE7 по умолчанию. То, чтоSetFeatureBrowserEmulation
делает ниже. -
Это приложение WinForms, но концепция может быть легко преобразована в консольное приложение.
-
Эта логика хорошо работает с указанным вами URL-адресом: https://www.google.com/#q=where+am+i.
using Microsoft.Win32;
using System;
using System.ComponentModel;
using System.Diagnostics;
using System.Threading;
using System.Threading.Tasks;
using System.Windows.Forms;
namespace WbFetchPage
{
public partial class MainForm : Form
{
public MainForm()
{
SetFeatureBrowserEmulation();
InitializeComponent();
this.Load += MainForm_Load;
}
// start the task
async void MainForm_Load(object sender, EventArgs e)
{
try
{
var cts = new CancellationTokenSource(10000); // cancel in 10s
var html = await LoadDynamicPage("https://www.google.com/#q=where+am+i", cts.Token);
MessageBox.Show(html.Substring(0, 1024) + "..." ); // it too long!
}
catch (Exception ex)
{
MessageBox.Show(ex.Message);
}
}
// navigate and download
async Task<string> LoadDynamicPage(string url, CancellationToken token)
{
// navigate and await DocumentCompleted
var tcs = new TaskCompletionSource<bool>();
WebBrowserDocumentCompletedEventHandler handler = (s, arg) =>
tcs.TrySetResult(true);
using (token.Register(() => tcs.TrySetCanceled(), useSynchronizationContext: true))
{
this.webBrowser.DocumentCompleted += handler;
try
{
this.webBrowser.Navigate(url);
await tcs.Task; // wait for DocumentCompleted
}
finally
{
this.webBrowser.DocumentCompleted -= handler;
}
}
// get the root element
var documentElement = this.webBrowser.Document.GetElementsByTagName("html")[0];
// poll the current HTML for changes asynchronosly
var html = documentElement.OuterHtml;
while (true)
{
// wait asynchronously, this will throw if cancellation requested
await Task.Delay(500, token);
// continue polling if the WebBrowser is still busy
if (this.webBrowser.IsBusy)
continue;
var htmlNow = documentElement.OuterHtml;
if (html == htmlNow)
break; // no changes detected, end the poll loop
html = htmlNow;
}
// consider the page fully rendered
token.ThrowIfCancellationRequested();
return html;
}
// enable HTML5 (assuming we're running IE10+)
// more info: https://stackoverflow.com/a/18333982/1768303
static void SetFeatureBrowserEmulation()
{
if (LicenseManager.UsageMode != LicenseUsageMode.Runtime)
return;
var appName = System.IO.Path.GetFileName(System.Diagnostics.Process.GetCurrentProcess().MainModule.FileName);
Registry.SetValue(@"HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\Main\FeatureControl\FEATURE_BROWSER_EMULATION",
appName, 10000, RegistryValueKind.DWord);
}
}
}