Python BeautifulSoup: получение дочерних тегов html с заданной веб-страницы
BeautifulSoup: Упражнение-14 с решением
Напишите программу на Python для извлечения дочерних тегов html с заданной веб-страницы.
Пример решения :
Код Python:
import requests
from bs4 import BeautifulSoup
url ='https://www.python.org/'
reqs = requests.get(url)
soup = BeautifulSoup(reqs.text, 'lxml')
print("\nChildren of the html tag (https://www.python.org):\n")
root = soup.html
root_childs = [e.name for e in root.children if e.name is not None]
print(root_childs)
Пример вывода:
Дети тега html (https://www.python.org): ['голова', 'тело']
Редактор кода Python:
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Напишите программу на Python для печати имен всех тегов HTML данной веб-страницы, проходящей через дерево документа.
Далее: Напишите программу на Python для извлечения всех потомков тега body с заданной веб-страницы.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования
disqus2code