кодесурса
«BeautifulSoup

Python BeautifulSoup: получение дочерних тегов html с заданной веб-страницы

script1adsense2code
script1adsense3code

BeautifulSoup: Упражнение-14 с решением

Напишите программу на Python для извлечения дочерних тегов html с заданной веб-страницы.

Пример решения :

Код Python:

import requests
from bs4 import BeautifulSoup
url ='https://www.python.org/'
reqs = requests.get(url)
soup = BeautifulSoup(reqs.text, 'lxml')
print("\nChildren of the html tag (https://www.python.org):\n")
root = soup.html    
root_childs = [e.name for e in root.children if e.name is not None]
print(root_childs)

Пример вывода:

 Дети тега html (https://www.python.org):
['голова', 'тело']

Редактор кода Python:

Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.

Предыдущий: Напишите программу на Python для печати имен всех тегов HTML данной веб-страницы, проходящей через дерево документа.
Далее: Напишите программу на Python для извлечения всех потомков тега body с заданной веб-страницы.

Каков уровень сложности этого упражнения?

Новый контент: Composer: менеджер зависимостей для PHP , R программирования


script1adsense4code
script1adsense5code
disqus2code
script1adsense6code
script1adsense7code
script1adsense8code
buysellads2code