Python Web Scraping: проверить, найдена ли данная страница на сервере или нет
Python Web Scraping: Упражнение-1 с решением
Напишите программу на Python, чтобы проверить, найдена ли данная страница на сервере или нет.
Пример решения : -
Код Python:
from urllib.request import urlopen
from urllib.error import HTTPError
from urllib.error import URLError
try:
html = urlopen("https://abcxyz.com")
except HTTPError as e:
print("HTTP error")
except URLError as e:
print("Server not found!")
else:
print(html.read())
try:
html = urlopen("http://www.example.com/")
except HTTPError as e:
print("HTTP error")
except URLError as e:
print("Server not found!")
else:
print("HTML Details")
print(html.read())
Выход:
Сервер не найден! HTML детали b '<! doctype html> / П <HTML> / П <голова> / n <title> Пример домена </ title> / n / n <meta charset = "utf-8" /> / n <meta http-equ = "Content-type" content = "text / html; charset = utf-8" /> / n <meta name = "viewport" content = "width = device-width, initial-scale = 1" /> / n <style type = "text / css"> / n body { / n цвет фона: # f0f0f2; / n маржа: 0; / n отступов: 0; / n font-family: «Open Sans», «Helvetica Neue», Helvetica, Arial, без засечек; / n / n} / n div {/ n width: 600px; / n поля: 5em авто; / n отступ: 50px; / n background-color: #fff; / n border-radius: 1em; / n} / на: ссылка, а: посетил { / n цвет: # 38488f; / n текстовое оформление: нет; / n} / n @media (максимальная ширина: 700 пикселей) { / n body { / n background-color: #fff; / n} / n div {/ n width: auto; / n поле: 0 авто; / n border-radius: 0; / n отступы: 1em; / n} / n} / n </ style> / П </ голова> / П / п <тело> / П <DIV> / n <h1> Пример домена </ h1> / n <p> Этот домен создан для использования в качестве иллюстративных примеров в документах. Вы можете использовать это / n домен в примерах без предварительного согласования или запроса разрешения. </ p> / n <p> <a href="http://www.iana.org/domains/example"> Подробнее ... </a> </ Р> / П </ DIV> / П </ тело> / П </ html> / п»
Блок - схема:
Редактор кода Python:
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Python Web Scraping Exercises Home.
Далее: Напишите программу на Python для загрузки и отображения содержимого robot.txt для en.wikipedia.org.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования
disqus2code