Apa itu urllib?
urllib adalah modul Python yang boleh digunakan untuk membuka URL. Ini menentukan fungsi dan kelas untuk membantu dalam tindakan URL.
Dengan Python anda juga dapat mengakses dan mengambil data dari internet seperti XML, HTML, JSON, dll. Anda juga boleh menggunakan Python untuk bekerja dengan data ini secara langsung. Dalam tutorial ini kita akan melihat bagaimana kita dapat mengambil data dari web. Sebagai contoh, di sini kami menggunakan URL video guru99, dan kami akan mengakses URL video ini menggunakan Python serta mencetak fail HTML URL ini.
Dalam tutorial ini kita akan belajar
- Cara Membuka URL menggunakan Urllib
- Cara membaca fail HTML untuk URL anda di Python
Cara Membuka URL menggunakan Urllib
Sebelum kita menjalankan kod untuk menyambung ke data Internet, kita perlu mengimport penyataan untuk modul perpustakaan URL atau "urllib".
- Import uribib
- Tentukan fungsi utama anda
- Menyatakan webUrl pemboleh ubah
- Kemudian panggil fungsi urlopen di perpustakaan lib URL
- URL yang kami buka adalah tutorial guru99 di youtube
- Seterusnya, kami akan mencetak kod hasilnya
- Kod hasil diambil dengan memanggil fungsi getcode pada pemboleh ubah webUrl yang telah kami buat
- Kami akan menukarnya menjadi rentetan, sehingga dapat digabungkan dengan rentetan "kod hasil" kami
- Ini akan menjadi kod HTTP biasa "200", yang menunjukkan permintaan http berjaya diproses
Cara mendapatkan URL borang fail HTML di Python
Anda juga dapat membaca fail HTML dengan menggunakan "fungsi baca" di Python, dan ketika anda menjalankan kod, file HTML akan muncul di konsol.
- Panggil fungsi baca pada pemboleh ubah webURL
- Pemboleh ubah baca memungkinkan untuk membaca kandungan fail data
- Baca keseluruhan kandungan URL ke dalam pemboleh ubah yang disebut data
- Jalankan kod- Ia akan mencetak data ke dalam format HTML
Inilah kod lengkapnya
Python 2 Contoh
## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()
Python 3 Contoh
## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)