кодесурса
«Python

Python Web Scraping: получает произвольную страницу Википедии «Python» и создает список ссылок на этой странице.

script1adsense2code
script1adsense3code

Python Web Scraping: Упражнение 10 с решением

Напишите программу на Python, которая извлекает произвольную страницу Википедии «Python» и создает список ссылок на этой странице.

Пример решения : -

Код Python:

from urllib.request import urlopen
from bs4 import BeautifulSoup
html = urlopen("https://en.wikipedia.org/wiki/Python")
bsObj = BeautifulSoup(html)
for link in bsObj.findAll("a"):
  if 'href' in link.attrs:
    print(link.attrs['href'])

Выход:

 # Мвт-голова
# Р-поиск
https://en.wiktionary.org/wiki/Python
https://en.wiktionary.org/wiki/python
#Snakes
#Древняя Греция
#Media_and_entertainment
#Computing
#Engineering
#Roller_coasters
#Vehicles
#Weaponry
#Смотрите также
/w/index.php?title=Python&action=edit§ion=1
/ Вики / питоны
/ Вики / Python_ (род)
/w/index.php?title=Python&action=edit§ion=2
/ Вики / Python_ (мифология)
/ Вики / Python_of_Aenus
/ Вики / Python_ (художник)
/ Вики / Python_of_Byzantium
/ Вики / Python_of_Catana
/w/index.php?title=Python&action=edit§ion=3
/ Вики / Python_ (пленка)
/ Вики / Pythons_2
/ Вики / Monty_Python
/ Вики / Python_ (Рокфор) _Pictures
/w/index.php?title=Python&action=edit§ion=4
/ Вики / Python_ (programming_language)
/ Вики / CPython
/ Вики / CMU_Common_Lisp
/ Вики / PERQ # PERQ_3
/w/index.php?title=Python&action=edit§ion=5
/w/index.php?title=Python&action=edit§ion=6
/ Вики / Python_ (Busch_Gardens_Tampa_Bay)
/ Вики / Python_ (Coney_Island, _Cincinnati, _Ohio)
/ Вики / Python_ (Эфтелинг)
/w/index.php?title=Python&action=edit§ion=7
/ Вики / Python_ (automobile_maker)
/ Вики / Python_ (Ford_prototype)
/w/index.php?title=Python&action=edit§ion=8
/ Вики / Colt_Python
/ Вики / Python_ (ракета)
/w/index.php?title=Python&action=edit§ion=9
/ Вики / Cython
/ Вики / Pyton
/wiki/File:Disambig_gray.svg
/ Вики / Help: Disambiguation
//en.wikipedia.org/w/index.php?title=Special:WhatLinksHere/Python&namespace=0
https://en.wikipedia.org/w/index.php?title=Python&oldid=845762125
/ Вики / Help: Категория
/ вики / Категория: Disambiguation_pages
/ Вики / Категория: Disambiguation_pages_with_short_description
/ Вики / Категория: All_article_disambiguation_pages
/ Вики / Категория: All_disambiguation_pages
/ Вики / Категория: Animal_common_name_disambiguation_pages
/ Вики / Special: MyTalk
/ вики / Special: MyContributions
/w/index.php?title=Special:CreateAccount&returnto=Python
/w/index.php?title=Special:UserLogin&returnto=Python
/ Вики / Python
/ Вики / Обсуждение: Python
/ Вики / Python
/w/index.php?title=Python&action=edit
/w/index.php?title=Python&action=history
/ Вики / Main_Page
/ Вики / Main_Page
/ вики / Portal: Содержание
/ Вики / Портал: Featured_content
/ вики / Portal: Current_events
/ Вики / Special: Random
https://donate.wikimedia.org/wiki/Special:FundraiserRedirector?utm_source=donate&utm_medium=sidebar&utm_campaign=C13_en.wikipedia.org&uselang=en
//shop.wikimedia.org
/ вики / Справка: Содержание
/ Вики / Википедия: О
/ Вики / Википедия: Community_portal
/ вики / Special: RecentChanges
//en.wikipedia.org/wiki/Wikipedia:Contact_us
/ Вики / Special: WhatLinksHere / Python
/ Вики / Special: Связанные правки / Python
/ Вики / Википедия: File_Upload_Wizard
/ вики / Special: SpecialPages
/w/index.php?title=Python&oldid=845762125
/w/index.php?title=Python&action=info
https://www.wikidata.org/wiki/Special:EntityPage/Q747452
/w/index.php?title=Special:CiteThisPage&page=Python&id=845762125
/w/index.php?title=Special:Book&bookcmd=book_creator&referer=Python
/w/index.php?title=Special:ElectronPdf&page=Python&action=show-download-screen
/w/index.php?title=Python&printable=yes
https://commons.wikimedia.org/wiki/Category:Python
https://af.wikipedia.org/wiki/Python
https://als.wikipedia.org/wiki/Python
https://bn.wikipedia.org/wiki/%E0%A6%AA%E0%A6%BE%E0%A6%87%E0%A6%A5%E0%A6%A8_(%E0%A6%A6% E0% A7% 8D% E0% A6% AC% E0% A7% 8D% E0% A6% AF% E0% A6% B0% E0% A7% 8D% E0% A6% A5% E0% A6% A4% E0% A6% BE_% E0% A6% A8% E0% A6% BF% E0% A6% B0% E0% A6% B8% E0% A8 A6%)
https://be.wikipedia.org/wiki/Python
https://bg.wikipedia.org/wiki/%D0%9F%D0%B8%D1%82%D0%BE%D0%BD_(%D0%BF%D0%BE%D1%8F%D1%81% D0% BD% D0% B5% D0% BD% D0% B8% D0% B5)
https://cs.wikipedia.org/wiki/Python_(rozcestn%C3%ADk)
https://da.wikipedia.org/wiki/Python
https://de.wikipedia.org/wiki/Python
https://eo.wikipedia.org/wiki/Pitono_(apartigilo)
https://eu.wikipedia.org/wiki/Python_(argipena)
https://fa.wikipedia.org/wiki/%D9%BE%D8%A7%DB%8C%D8%AA%D9%88%D9%86
https://fr.wikipedia.org/wiki/Python
https://ko.wikipedia.org/wiki/%ED%8C%8C%EC%9D%B4%EC%84%A0
https://hr.wikipedia.org/wiki/Python_(razdvojba)
https://io.wikipedia.org/wiki/Pitono
https://id.wikipedia.org/wiki/Python
https://ia.wikipedia.org/wiki/Python_(disambiguation)
https://is.wikipedia.org/wiki/Python
https://it.wikipedia.org/wiki/Python_(disambigua)
https://he.wikipedia.org/wiki/%D7%A4%D7%99%D7%AA%D7%95%D7%9F
https://ka.wikipedia.org/wiki/%E1%83%9E%E1%83%98%E1%83%97%E1%83%9D%E1%83%9C%E1%83%98_(% Е1% 83% 9B% E1% 83% A0% E1% 83% 90% E1% 83% 95% E1% 83% 90% E1% 83% 9A% E1% 83% 9B% E1% 83% 9C% E1% 83% 98% E1% 83% A8% E1% 83% 95% E1% 83% 9C% E1% 83% 94% E1% 83% 9A% E1% 83% 9D% E1% 83% 95% E1% 83% 90% E1% 83% 9C% E1% 83% 98)
https://kg.wikipedia.org/wiki/Mboma_(nyoka)
https://la.wikipedia.org/wiki/Python_(discretiva)
https://lb.wikipedia.org/wiki/Python
https://hu.wikipedia.org/wiki/Python_(egy%C3%A9rtelm%C5%B1s%C3%ADt%C5%91_lap)
https://mr.wikipedia.org/wiki/%E0%A4%AA%E0%A4%BE%E0%A4%AF%E0%A4%A5%E0%A5%89%E0%A4%A8_(% E0% A4% 86% E0% A4% 9C% E0% A5% 8D% E0% A4% 9E% E0% A4% BE% E0% A4% B5% E0% A4% B2% E0% A5% 80_% E0% A4% AD% E0% A4% BE% E0% A4% B7% E0% A4% BE)
https://nl.wikipedia.org/wiki/Python
https://ja.wikipedia.org/wiki/%E3%83%91%E3%82%A4%E3%82%BD%E3%83%B3
https://no.wikipedia.org/wiki/Pyton
https://pl.wikipedia.org/wiki/Pyton
https://pt.wikipedia.org/wiki/Python_(desambigua%C3%A7%C3%A3o)
https://ru.wikipedia.org/wiki/Python_(%D0%B7%D0%BD%D0%B0%D1%87%D0%B5%D0%BD%D0%B8%D1%8F)
https://sd.wikipedia.org/wiki/%D8%A7%D8%B1%DA%99
https://sk.wikipedia.org/wiki/Python
https://sh.wikipedia.org/wiki/Python
https://fi.wikipedia.org/wiki/Python
https://sv.wikipedia.org/wiki/Pyton
https://th.wikipedia.org/wiki/%E0%B9%84%E0%B8%9E%E0%B8%97%E0%B8%AD%E0%B8%99
https://tr.wikipedia.org/wiki/Python
https://uk.wikipedia.org/wiki/%D0%9F%D1%96%D1%84%D0%BE%D0%BD
https://ur.wikipedia.org/wiki/%D9%BE%D8%A7%D8%A6%DB%8C%D8%AA%DA%BE%D9%88%D9%86
https://vi.wikipedia.org/wiki/Python
https://zh.wikipedia.org/wiki/Python_(%E6%B6%88%E6%AD%A7%E4%B9%89)
https://www.wikidata.org/wiki/Special:EntityPage/Q747452#sitelinks-wikipedia
//en.wikipedia.org/wiki/Wikipedia:Text_of_Creative_Commons_Attribution-ShareAlike_3.0_Unported_License
//creativecommons.org/licenses/by-sa/3.0/
//wikimediafoundation.org/wiki/Terms_of_Use
//wikimediafoundation.org/wiki/Privacy_policy
//www.wikimediafoundation.org/
https://wikimediafoundation.org/wiki/Privacy_policy
/ Вики / Википедия: О
/ Вики / Википедия: General_disclaimer
//en.wikipedia.org/wiki/Wikipedia:Contact_us
https://www.mediawiki.org/wiki/Special:MyLanguage/How_to_contribute
https://wikimediafoundation.org/wiki/Cookie_statement
//en.m.wikipedia.org/w/index.php?title=Python&mobileaction=toggle_view_mobile
https://wikimediafoundation.org/
//www.mediawiki.org/
/usr/local/lib/python3.6/dist-packages/bs4/__init__.py:181: UserWarning: не был явно указан синтаксический анализатор, поэтому я использую лучший доступный анализатор HTML для этой системы ("lxml"). Обычно это не проблема, но если вы запускаете этот код в другой системе или в другой виртуальной среде, он может использовать другой анализатор и вести себя по-другому.
Код, вызвавший это предупреждение, находится в строке 4 файла /tmp/sessions/0f56b56f1170593f/main.py. Чтобы избавиться от этого предупреждения, измените код, который выглядит следующим образом:
 BeautifulSoup ([ваша разметка])
к этому:
 BeautifulSoup ([ваша разметка], «lxml»)
 

Блок - схема:

«Python

Редактор кода Python:

Есть другой способ решить это решение? Внесите свой код (и комментарии) через Disqus.

Предыдущий: Напишите программу на Python для извлечения и отображения всех ссылок на изображения из en.wikipedia.org/wiki/Peter_Jeffrey_(RAAF_officer)
Далее: Напишите программу на Python, чтобы проверить, содержит ли страница заголовок или нет.

Каков уровень сложности этого упражнения?

Новый контент: Composer: менеджер зависимостей для PHP , R программирования


script1adsense4code
script1adsense5code
disqus2code
script1adsense6code
script1adsense7code
script1adsense8code
buysellads2code