Python BeautifulSoup: печать имен всех тегов HTML данной веб-страницы, проходящих через дерево документа
BeautifulSoup: Упражнение-13 с решением
Напишите программу на Python для печати имен всех тегов HTML данной веб-страницы, проходящей через дерево документа.
Пример решения :
Код Python:
import requests
from bs4 import BeautifulSoup
url ='https://www.python.org/'
reqs = requests.get(url)
soup = BeautifulSoup(reqs.text, 'lxml')
print("\nNames of all HTML tags (https://www.python.org):\n")
for child in soup.recursiveChildGenerator():
if child.name:
print(child.name)
Пример вывода:
Имена всех HTML-тегов (https://www.python.org): HTML голова мета мета ссылка на сайт мета мета мета мета мета мета мета мета мета мета скрипт ссылка на сайт ссылка на сайт ссылка на сайт ссылка на сайт ссылка на сайт ссылка на сайт ссылка на сайт ссылка на сайт мета мета мета заглавие .......... скрипт скрипт скрипт скрипт скрипт
Редактор кода Python:
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Напишите программу на Python для извлечения всего текста с данной веб-страницы.
Далее: Напишите программу на Python для извлечения дочерних тегов html с заданной веб-страницы.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования
disqus2code