Python BeautifulSoup: извлечь тег или строку из заданного дерева HTML-документа
BeautifulSoup: Упражнение-32 с решением
Напишите программу на Python для извлечения тега или строки из заданного дерева HTML-документа.
Пример решения :
Код Python:
from bs4 import BeautifulSoup
html_content ='<a href="https://w3resource.com/">Python exercises<i>w3resource</i></a>'
soup = BeautifulSoup(html_content, "lxml")
print("Original Markup:")
print(soup.a)
i_tag = soup.i.extract()
print("\nExtract i tag from said html Markup:")
print(i_tag)
Пример вывода:
Оригинальная разметка: <a href="https://w3resource.com/"> Python упражнения <i> w3resource </ i> </a> Извлеките тег из указанной HTML-разметки: <Я> w3resource </ I>
Редактор кода Python:
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Напишите программу на Python, чтобы удалить содержимое тега в данном HTML-документе.
Далее: Напишите программу на Python, чтобы удалить тег из заданного дерева HTML-документа и уничтожить его и его содержимое.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования
disqus2code