Python BeautifulSoup: найдите все теги h2 и перечислите первые четыре с веб-страницы python.org
BeautifulSoup: Упражнение-9 с решением
Напишите программу на Python, чтобы найти все теги h2, и перечислите первые четыре на веб-странице python.org.
Пример решения :
Код Python:
import requests
from bs4 import BeautifulSoup
url ='https://www.python.org/'
reqs = requests.get(url)
soup = BeautifulSoup(reqs.text, 'lxml')
print("First four h2 tags from the webpage python.org.:")
print(soup.find_all('h2')[0:4])
Пример вывода:
Первые четыре тега h2 с веб-страницы python.org. [<h2 class = "widget-title"> <span aria-hidden = "true" class = "icon-get-start"> </ span> Начало работы </ h2>, <h2 class = "widget-title"> <span aria-hidden = "true" class = "icon-download"> </ span> Загрузить </ h2>, <h2 class = "widget-title"> <span aria-hidden = "true" class = "icon-Documentation"> </ span> Документы </ h2>, <h2 class = "widget-title"> <span aria-hidden = "true" class = "icon-jobs"> </ span> Работа </ h2>]
Редактор кода Python:
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Напишите программу на Python для извлечения всех URL-адресов с веб-страницы python.org, которые вложены в теги <li> из.
Далее: Напишите программу на Python, чтобы найти все теги ссылок и перечислить первые десять на веб-странице python.org.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования
disqus2code