Python BeautifulSoup: печать имен всех тегов HTML данной веб-страницы, проходящих через дерево документа

Последнее обновление 30 мая 2019 12:57:39 (UTC / GMT +8 часов)

script1adsense2code

script1adsense3code

BeautifulSoup: Упражнение-13 с решением

Напишите программу на Python для печати имен всех тегов HTML данной веб-страницы, проходящей через дерево документа.

Пример решения :

Код Python:

import requests
from bs4 import BeautifulSoup
url ='https://www.python.org/'
reqs = requests.get(url)
soup = BeautifulSoup(reqs.text, 'lxml')
print("\nNames of all HTML tags (https://www.python.org):\n")
for child in soup.recursiveChildGenerator():
    if child.name:
        print(child.name)

Пример вывода:

 Имена всех HTML-тегов (https://www.python.org):
HTML
голова
мета
мета
ссылка на сайт
мета
мета
мета
мета
мета
мета
мета
мета
мета
мета
скрипт
ссылка на сайт
ссылка на сайт
ссылка на сайт
ссылка на сайт
ссылка на сайт
ссылка на сайт
ссылка на сайт
ссылка на сайт
мета
мета
мета
заглавие
..........
скрипт
скрипт
скрипт
скрипт
скрипт

Редактор кода Python:

Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.

Предыдущий: Напишите программу на Python для извлечения всего текста с данной веб-страницы.
Далее: Напишите программу на Python для извлечения дочерних тегов html с заданной веб-страницы.