Как получить исходный код страницы в c#?

Как получить исходный код страницы с помощью класса WebBrowser?

В этой статье рассмотрим на простом примере, как получить исходный код страницы помощью класса WebBrowser.

Для начала создадим новый проект типа Windows Forms Application.

Затем добавим на форму кнопку и control WebBrowser (wb). Если выводить содержимое страницы не требуется, то тогда вместо элемента управления используйте класс WebBrowser.

C помощью метода Navigate загружаем страницу в веб-браузер.

private void button1_Click(object sender, EventArgs e)
{
wb.Navigate(@"указываем url адрес сайта или страницы");
}

Подписываемся на событие DocumentCompleted, чтобы дождаться полной загрузки страницы.

private void wb_DocumentCompleted(object sender,
WebBrowserDocumentCompletedEventArgs e)
{
}

Используем свойство DocumentText, чтобы получить исходный код всей страницы.

private void wb_DocumentCompleted(object sender,
WebBrowserDocumentCompletedEventArgs e)
{
string htmlCode = wb.DocumentText;
}

Если же вам нужно получить исходный код не всей страницы, а только той части, что содержится между тегами BODY, то тогда вы можете поступить следующим образом:

private void wb_DocumentCompleted(object sender,
WebBrowserDocumentCompletedEventArgs e)
{
string htmlCodeBody = wb.Document.Body.InnerHtml;
}

Если вам нужно получить исходный код страницы, который содержится между тегами HEAD, то тогда используйте следующий способ:

private void wb_DocumentCompleted(object sender,
WebBrowserDocumentCompletedEventArgs e)
{
HtmlElementCollection elmsHead;
elmsHead = wb.Document.GetElementsByTagName("head")
string htmlCodeHead = elmsHead[0].OuterHtml;
}

Читайте также:

Leave a Reply

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*