Python BeautifulSoup: разобрать дерево в красиво отформатированную строку Юникода, с отдельной строкой для каждого тега и строки HTML / XML

Последнее обновление 22 июня 2019 11:26:47 (UTC / GMT +8 часов)

script1adsense2code

script1adsense3code

BeautifulSoup: Упражнение-20 с решением

Напишите программу на Python для создания дерева разбора Beautiful Soup в красиво отформатированную строку Юникода с отдельной строкой для каждого тега и строки HTML / XML.

Пример решения:

Код Python:

from bs4 import BeautifulSoup
str1 ="<p>Some<b>bad<i>HTML Code</i></b></p>"
print("Original string:")
print(str1)
soup = BeautifulSoup("<p>Some<b>bad<i>HTML Code</i></b></p>", "xml")
print("\nFormatted Unicode string:")
print(soup.prettify())

Пример вывода:

 Исходная строка:
<p> Некоторый <b> плохой <i> HTML-код </ i> </ b> </ p>
Форматированная строка Unicode:
<? xml version = "1.0" encoding = "utf-8"?>
<Р>
 Немного
 <Б>
  плохой
  <Я>
   HTML-код
  </ I>
 </ B>
</ Р>

Редактор кода Python:

Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.

Предыдущий: Напишите программу на Python для печати элемента (ов), который имеет указанный идентификатор данной веб-страницы.
Далее: Напишите программу на Python, чтобы найти первый тег с заданным значением атрибута в HTML-документе.