Wyciągnij wszystkie adresy URL za pomocą pięknej zupy i pithon3

2408
553
Igor Madej

Poniższy link wyodrębni wszystkie adresy URL dla danej strony internetowej.

#!/usr/bin/env python3 # Python Wersja: 3.4.2 # BS4 Wersja: 4.3.2-2 z urllib.Poproś o import urlopen z BS4 Import BeautifulSoup HTML = urlopen („http: // gnU.org ") # Wstaw swój adres URL do wyodrębnienia BSOBJ = Beautifulsoup (html.Czytać()); Do połączyć W Bsobj.Find_All („a”): wydrukować(połączyć.Get („href”))

Zapisz powyższy skrypt w pliku, np. Wyciąg-URL.py i spraw, aby był wykonywalny:

$ chmod +x ekstrakt-url.py

Uruchom skrypt:

$ ./ekstrakt-URL.py

Powiązane samouczki Linux:

Jak zbudować aplikację Tkinter za pomocą obiektu zorientowanego na…
Jak pracować z WooCommerce Rest API z Pythonem
Jak skonfigurować serwer OpenVPN na Ubuntu 20.04
Pobierz plik z adresu URL w systemie Linux za pomocą wiersza poleceń
Wprowadzenie do automatyzacji, narzędzi i technik Linuksa
Rzeczy do zainstalowania na Ubuntu 20.04
Jak ustawić domyślne programy za pomocą alternatywnych aktualizacji na…
Jak czytać i tworzyć pliki CSV za pomocą Pythona
Jak zeskrobać strony internetowe z wiersza poleceń za pomocą HTMLQ
Jak napisać rozszerzenia Nautilus z Nautilus-Python

Wyciągnij wszystkie adresy URL za pomocą pięknej zupy i pithon3

Powiązane samouczki Linux:

Najlepsze artykuły

Jak zainstalować najnowsze nodeJS i NPM w Linux

W tym przewodniku przyjrzymy się, w jaki sposób można zainstalować Nodejs i NPM w Rhel, Centos, Fedo...

Jak prowadzić aplikacje kątowe za pomocą kątowego CLI i PM2

Pokażamy, jak uruchamiać aplikacje kątowe za pomocą kątowego CLI i węzła PM2.JS Process Manager, któ...