Python BeautifulSoup: извлеките все URL-адреса с веб-страницы python.org, вложенные в теги <li> из
BeautifulSoup: Упражнение-8 с решением
Напишите программу на Python для извлечения всех URL-адресов с веб-страницы python.org, которые вложены в теги <li> из.
Пример решения :
Код Python:
import requests
from bs4 import BeautifulSoup
url ='https://www.python.org/'
reqs = requests.get(url)
soup = BeautifulSoup(reqs.text, 'lxml')
urls = []
for h in soup.find_all('li'):
a = h.find('a')
urls.append(a.attrs['href'])
print(urls)
Пример вывода:
['/', '/ psf-landing /', 'https://docs.python.org', 'https://pypi.python.org/', '/ jobs /', '/ community /', '#', 'javascript :;', 'javascript :;', 'javascript :;', '#', 'https://www.facebook.com/pythonlang?fref=ts', 'https: // twitter .com / ThePSF ',' / community / irc / ',' / about / ',' / about / apps / ',' / about / quotes / ',' / about / Gettingstarted / ',' / about / help / ',' http://brochure.getpython.info/ ',' / downloads / ',' / downloads / ',' / downloads / source / ',' / downloads / windows / ',' / downloads / mac-osx / ',' / download / other / ',' https://docs.python.org/3/license.html ',' / download / alternatives ',' / doc / ',' / doc / ',' / doc / av ',' https://wiki.python.org/moin/BeginnersGuide ',' https://devguide.python.org/ ',' https://docs.python.org/faq/ ',' http://wiki.python.org/moin/Languages ',' http://python.org/dev/peps/ ',' https://wiki.python.org/moin/PythonBooks ',' / doc / эссе / ',' / сообщество / ',' / сообщество / опрос ',' / сообщество / разнообразие / ',' / сообщество / списки / ',' / сообщество / irc / ',' / сообщество / форумы / ',' / сообщество / мастерские / ',' / сообщество / сиг s / ',' / community / logos / ',' https://wiki.python.org/moin/ ',' / community / merchandise / ',' / community / awards ',' https: //www.python .org / psf / codeofconduct / ',' / история успеха / ',' / истории успеха / категория / искусство / ',' / истории успеха / категория / бизнес / ',' / истории успеха / категория / образование / ',' / истории успеха / категории / инженерия / ',' / истории успеха / категории / правительство / ',' / истории успеха / категории / научные / ',' / истории успеха / категории / разработка программного обеспечения / ',' / blogs / ',' / blogs / ',' http://planetpython.org/ ',' http://pyfound.blogspot.com/ ',' http://pycon.blogspot.com/ ',' / events / ',' / events / python-events ',' / events / python-user-group / ',' / events / python-events / past / ',' / events / python-user-group / past / ',' https://wiki.python.org/moin/PythonEventsCalendar#Submitting_an_Event ',' / shell / ',' //docs.python.org/3/tutorial/controlflow.html#defining-functions ' , '//docs.python.org/3/tutorial/introduction.html#lists', 'http://docs.python.org/3/tutorial/introduction.html#using-python-as-a-calculator' ' //docs.python.org/3/tutorial/ ',' //docs.python.org/3/tutorial/controlflow.html ',' http://feedproxy.google.com/~r/PythonSoftwareFoundationNews/~3 /NXMcoIchkxY/2018-in-review.html ',' http://feedproxy.google.com/~r/PythonSoftwareFoundationNews/~3/t_DSEH1vASY/python-core-developer-mentorship.html ',' http: // feedproxy , /petr-viktorin-extension-modules-and.html ',' http://feedproxy.google.com/~r/PythonSoftwareFoundationNews/~3/-JcoXQeMgsQ/scott-shawcroft-history-of-circuitpython.html ',' / events / python-events / 809 / ',' / events / python-user-group / 848 / ',' / events / python-user-group / 838 / ',' / events / python-events / 827 / ' , '/ events / python-events / 826 /', 'http://www.djangoproject.com/', 'http://wiki.python.org/moin/TkInter', 'http: //www.scipy .org ',' http://buildbot.net/ ',' http://www.ansible.com ',' / about / ',' / about / apps / ',' / about / q uotes / ',' / about / Gettingstarted / ',' / about / help / ',' http://brochure.getpython.info/ ',' / downloads / ',' / downloads / ',' / downloads / source / ',' / downloads / windows / ',' / downloads / mac-osx / ',' / download / other / ',' https://docs.python.org/3/license.html ',' / download / alternatives ',' / doc / ',' / doc / ',' / doc / av ',' https://wiki.python.org/moin/BeginnersGuide ',' https://devguide.python.org/ ',' https://docs.python.org/faq/ ',' http://wiki.python.org/moin/Languages ',' http://python.org/dev/peps/ ',' https : //wiki.python.org/moin/PythonBooks ',' / doc / essays / ',' / community / ',' / community / survey ',' / community /iversity / ',' / community / lists / ' , '/ community / irc /', '/ community / форумы /', '/ community / works /', '/ community / sigs /', '/ community / logos /', 'https: //wiki.python. org / moin / ',' / community / merchandise / ',' / community / awards ',' https://www.python.org/psf/codeofconduct/ ',' / success-Stories / ',' / success- истории / категории / искусство / ',' / истории успеха / категория / бизнес / ',' / истории успеха / категория / образование / ',' / succ ess-истории / категории / инженерия / ',' / истории успеха / категория / правительство / ',' / истории успеха / категория / научные / ',' / истории успеха / категория / разработка программного обеспечения / ',' / blogs / ',' / blogs / ',' http://planetpython.org/ ',' http://pyfound.blogspot.com/ ',' http://pycon.blogspot.com/ ',' / events / ',' / events / python-events ',' / events / python-user-group / ',' / events / python-events / past / ',' / events / python-user-group / past / ', 'https://wiki.python.org/moin/PythonEventsCalendar#Submitting_an_Event', '/ dev /', 'https://devguide.python.org/', 'https://bugs.python.org/', 'https://mail.python.org/mailman/listinfo/python-dev', '/ dev / core-mentorship /', '/ news / security /', '/ about / help /', '/ community / iversity / ',' https://github.com/python/pythondotorg/issues ',' https://status.python.org/ ']
Редактор кода Python:
Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.
Предыдущий: Напишите программу на Python, чтобы найти текст первого тега <a> данного HTML-текста.
Далее: Напишите программу на Python, чтобы найти все теги h2 и перечислите первые четыре с веб-страницы python.org.
Каков уровень сложности этого упражнения?
Новый контент: Composer: менеджер зависимостей для PHP , R программирования
disqus2code