Python BeautifulSoup: разобрать дерево в красиво отформатированную строку Юникода, с отдельной строкой для каждого тега и строки HTML / XML
BeautifulSoup: Упражнение-20 с решением
Напишите программу на Python для создания дерева разбора Beautiful Soup в красиво отформатированную строку Юникода с отдельной строкой для каждого тега и строки HTML / XML.
Пример решения:
Код Python:
from bs4 import BeautifulSoup
str1 ="<p>Some<b>bad<i>HTML Code</i></b></p>"
print("Original string:")
print(str1)
soup = BeautifulSoup("<p>Some<b>bad<i>HTML Code</i></b></p>", "xml")
print("\nFormatted Unicode string:")
print(soup.prettify())
Пример вывода:
Исходная строка: <p> Некоторый <b> плохой <i> HTML-код </ i> </ b> </ p> Форматированная строка Unicode: <? xml version = "1.0" encoding = "utf-8"?> <Р> Немного <Б> плохой <Я> HTML-код </ I> </ B> </ Р>
Редактор кода Python:
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Напишите программу на Python для печати элемента (ов), который имеет указанный идентификатор данной веб-страницы.
Далее: Напишите программу на Python, чтобы найти первый тег с заданным значением атрибута в HTML-документе.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования
disqus2code