кодесурса
«BeautifulSoup

Python BeautifulSoup: печать имен всех тегов HTML данной веб-страницы, проходящих через дерево документа

script1adsense2code
script1adsense3code

BeautifulSoup: Упражнение-13 с решением

Напишите программу на Python для печати имен всех тегов HTML данной веб-страницы, проходящей через дерево документа.

Пример решения :

Код Python:

import requests
from bs4 import BeautifulSoup
url ='https://www.python.org/'
reqs = requests.get(url)
soup = BeautifulSoup(reqs.text, 'lxml')
print("\nNames of all HTML tags (https://www.python.org):\n")
for child in soup.recursiveChildGenerator():
    if child.name:
        print(child.name)

Пример вывода:

 Имена всех HTML-тегов (https://www.python.org):
HTML
голова
мета
мета
ссылка на сайт
мета
мета
мета
мета
мета
мета
мета
мета
мета
мета
скрипт
ссылка на сайт
ссылка на сайт
ссылка на сайт
ссылка на сайт
ссылка на сайт
ссылка на сайт
ссылка на сайт
ссылка на сайт
мета
мета
мета
заглавие
..........
скрипт
скрипт
скрипт
скрипт
скрипт

Редактор кода Python:

Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.

Предыдущий: Напишите программу на Python для извлечения всего текста с данной веб-страницы.
Далее: Напишите программу на Python для извлечения дочерних тегов html с заданной веб-страницы.

Каков уровень сложности этого упражнения?

Новый контент: Composer: менеджер зависимостей для PHP , R программирования


script1adsense4code
script1adsense5code
disqus2code
script1adsense6code
script1adsense7code
script1adsense8code
buysellads2code