кодесурса
«BeautifulSoup

Python BeautifulSoup: найдите ссылку на первый тег <a> данного HTML-документа

script1adsense2code
script1adsense3code

BeautifulSoup: Упражнение-7 с решением

Напишите программу на Python, чтобы найти ссылку на первый тег <a> данного HTML-документа.

Пример решения :

Код Python:

from bs4 import BeautifulSoup
html_doc = """
<html>
<head>
<meta http-equiv="Content-Type" content="text/html;
charset=iso-8859-1">
<title>An example of HTML page</title>
</head>
<body>
<h2>This is an example HTML page</h2>
<p>
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nunc at nisi velit,
aliquet iaculis est. Curabitur porttitor nisi vel lacus euismod egestas. In hac
habitasse platea dictumst. In sagittis magna eu odio interdum mollis. Phasellus
sagittis pulvinar facilisis. Donec vel odio volutpat tortor volutpat commodo.
Donec vehicula vulputate sem, vel iaculis urna molestie eget. Sed pellentesque
adipiscing tortor, at condimentum elit elementum sed. Mauris dignissim
elementum nunc, non elementum felis condimentum eu. In in turpis quis erat
imperdiet vulputate. Pellentesque mauris turpis, dignissim sed iaculis eu,
euismod eget ipsum. Vivamus mollis adipiscing viverra. Morbi at sem eget nisl
euismod porta.</p>
<p><a href="/html/HTML-tutorials.php">Learn HTML from w3resource.com</a></p>
<p><a href="/css/CSS-tutorials.php">Learn CSS from 
w3resource.com</a></p>
</body>
</html>
"""
soup = BeautifulSoup(html_doc, 'html.parser')
print("href of the first <a> tag:")
print(soup.find('a').attrs['href'])

Пример вывода:

 HREF первого тега <a>:
/html/HTML-tutorials.php

Редактор кода Python:

Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.

Предыдущий: Напишите программу на Python, чтобы найти текст первого тега <a> данного HTML-текста.
Далее: Напишите программу на Python для извлечения всех URL-адресов с веб-страницы python.org, которые вложены в теги <li> из.

Каков уровень сложности этого упражнения?

Новый контент: Composer: менеджер зависимостей для PHP , R программирования


script1adsense4code
script1adsense5code
disqus2code
script1adsense6code
script1adsense7code
script1adsense8code
buysellads2code