Apakah Pembelajaran Mesin yang Diselia?
Dalam pembelajaran yang diawasi, anda melatih mesin menggunakan data yang "dilabel" dengan baik . Ini bermaksud beberapa data sudah ditandai dengan jawapan yang betul. Ia boleh dibandingkan dengan pembelajaran yang berlaku di hadapan pengawas atau guru.
Algoritma pembelajaran yang diawasi belajar dari data latihan berlabel, membantu anda meramalkan hasil untuk data yang tidak dijangka. Berjaya membangun, menskalakan, dan menggunakan pembelajaran mesin yang diselia dengan tepat Model sains data memerlukan masa dan kepakaran teknikal dari pasukan saintis data berkemahiran tinggi. Lebih-lebih lagi, saintis Data mesti membina semula model untuk memastikan pandangan yang diberikan tetap benar sehingga datanya berubah.
Dalam tutorial ini, anda akan belajar
- Apakah Pembelajaran Mesin yang Diselia?
- Apa itu Pembelajaran Tanpa Pengawasan?
- Mengapa Pembelajaran Diawasi?
- Mengapa Pembelajaran Tanpa Pengawasan?
- Bagaimana Pembelajaran diawasi berfungsi?
- Bagaimana Pembelajaran Tanpa Pengawasan berfungsi?
- Jenis-Jenis Teknik Pembelajaran Mesin yang Diselia
- Jenis-Jenis Teknik Pembelajaran Mesin Tanpa Pengawasan
- Pembelajaran yang diselia berbanding yang tidak diawasi
Apa itu Pembelajaran Tanpa Pengawasan?
Pembelajaran tanpa pengawasan adalah teknik pembelajaran mesin, di mana anda tidak perlu mengawasi model. Sebaliknya, anda perlu membiarkan model berfungsi sendiri untuk menemui maklumat. Ini terutama berkaitan dengan data yang tidak berlabel.
Algoritma pembelajaran tanpa pengawasan membolehkan anda melaksanakan tugas pemprosesan yang lebih kompleks berbanding dengan pembelajaran yang diselia. Walaupun, pembelajaran tanpa pengawasan boleh menjadi lebih tidak dapat diramalkan berbanding dengan kaedah pembelajaran mendalam dan pengukuhan pembelajaran semula jadi yang lain.
Mengapa Pembelajaran Diawasi?
- Pembelajaran yang diawasi membolehkan anda mengumpulkan data atau menghasilkan output data dari pengalaman sebelumnya.
- Membantu anda mengoptimumkan kriteria prestasi menggunakan pengalaman
- Pembelajaran mesin yang diselia membantu anda menyelesaikan pelbagai jenis masalah pengiraan dunia nyata.
Mengapa Pembelajaran Tanpa Pengawasan?
Berikut adalah sebab utama untuk menggunakan Pembelajaran Tanpa Pengawasan:
- Pembelajaran mesin tanpa pengawasan menemui semua jenis corak yang tidak diketahui dalam data.
- Kaedah yang tidak diselia membantu anda mencari ciri yang berguna untuk pengkategorian.
- Ia berlaku dalam waktu nyata, sehingga semua data input akan dianalisis dan dilabel di hadapan pelajar.
- Lebih mudah mendapatkan data tanpa label dari komputer daripada data berlabel, yang memerlukan campur tangan manual.
Bagaimana Pembelajaran diawasi berfungsi?
Contohnya, anda ingin melatih mesin untuk membantu anda meramalkan berapa lama masa yang diperlukan untuk memandu pulang dari tempat kerja anda. Di sini, anda mulakan dengan membuat sekumpulan data berlabel. Data ini merangkumi
- Keadaan cuaca
- Masa dalam sehari
- Percutian
Semua butiran ini adalah input anda. Hasilnya adalah jumlah masa yang diperlukan untuk pulang ke rumah pada hari tertentu.
Anda secara naluriah tahu bahawa jika hujan di luar, maka anda akan memerlukan lebih lama untuk pulang. Tetapi mesin itu memerlukan data dan statistik.
Mari lihat sekarang bagaimana anda dapat mengembangkan model pembelajaran yang diawasi dari contoh ini yang membantu pengguna untuk menentukan masa perjalanan. Perkara pertama yang perlu anda buat ialah set data latihan. Set latihan ini akan mengandungi jumlah masa perjalanan dan faktor-faktor yang sesuai seperti cuaca, waktu dan lain-lain. Berdasarkan set latihan ini, mesin anda mungkin melihat ada hubungan langsung antara jumlah hujan dan masa yang anda perlukan untuk pulang.
Oleh itu, memastikan bahawa semakin banyak hujan, semakin lama anda memandu untuk pulang ke rumah anda. Ia juga dapat melihat hubungan antara waktu anda berhenti bekerja dan waktu anda berada di jalan raya.
Semakin hampir pukul 6 petang, semakin lama masa yang diperlukan untuk pulang ke rumah. Mesin anda mungkin menjumpai beberapa hubungan dengan data berlabel anda.
Ini adalah permulaan Model Data anda. Ia mula memberi kesan bagaimana hujan mempengaruhi cara orang memandu. Ia juga mulai melihat bahawa lebih banyak orang melakukan perjalanan pada waktu tertentu dalam sehari.
Bagaimana Pembelajaran Tanpa Pengawasan berfungsi?
Mari, ambil kes bayi dan anjing keluarganya.
Dia kenal dan kenal pasti anjing ini. Beberapa minggu kemudian seorang rakan keluarga membawa seekor anjing dan cuba bermain dengan bayi itu.
Bayi belum pernah melihat anjing ini. Tetapi ia menyedari banyak ciri (2 telinga, mata, berjalan dengan 4 kaki) seperti anjing peliharaannya. Dia mengenal pasti haiwan baru seperti anjing. Ini adalah pembelajaran tanpa pengawasan, di mana anda tidak diajar tetapi anda belajar dari data (dalam hal ini data mengenai anjing.) Sekiranya ini diawasi pembelajaran, rakan keluarga akan memberitahu bayi bahawa itu adalah anjing.
Jenis-Jenis Teknik Pembelajaran Mesin yang Diselia
Regresi:
Teknik regresi meramalkan nilai output tunggal menggunakan data latihan.
Contoh: Anda boleh menggunakan regresi untuk meramalkan harga rumah dari data latihan. Pemboleh ubah input akan menjadi lokaliti, ukuran rumah, dll.
Pengelasan:
Pengelasan bermaksud mengelompokkan output di dalam kelas. Sekiranya algoritma cuba melabel input ke dalam dua kelas yang berbeza, ia dipanggil klasifikasi binari. Memilih antara lebih daripada dua kelas disebut sebagai klasifikasi multikelas.
Contoh : Menentukan sama ada seseorang akan menjadi peminjam pinjaman atau tidak.
Kekuatan : Output selalu mempunyai tafsiran probabilistik, dan algoritma dapat diatur untuk mengelakkan kelebihan.
Kelemahan : Regresi logistik mungkin berprestasi rendah apabila terdapat banyak batas keputusan atau tidak linear. Kaedah ini tidak fleksibel, jadi tidak menangkap hubungan yang lebih kompleks.
Jenis-Jenis Teknik Pembelajaran Mesin Tanpa Pengawasan
Masalah pembelajaran yang tidak diawasi kemudiannya dikelompokkan menjadi masalah pengelompokan dan persatuan.
Penggabungan
Penggabungan adalah konsep penting ketika datang ke pembelajaran tanpa pengawasan. Ini terutama berkaitan dengan mencari struktur atau corak dalam pengumpulan data yang tidak dikategorikan. Algoritma pengelompokan akan memproses data anda dan mencari kelompok semula jadi (kumpulan) jika terdapat dalam data. Anda juga boleh mengubah seberapa banyak kluster yang harus dikenal pasti algoritma anda. Ini membolehkan anda menyesuaikan butiran kumpulan ini.
Persatuan
Peraturan persatuan membolehkan anda menjalin hubungan antara objek data di dalam pangkalan data yang besar. Teknik tanpa pengawasan ini adalah mengenai mencari hubungan menarik antara pemboleh ubah dalam pangkalan data besar. Contohnya, orang yang membeli rumah baru kemungkinan besar akan membeli perabot baru.
Contoh lain:
- Subkumpulan pesakit barah dikelompokkan berdasarkan ukuran ekspresi gen mereka
- Kumpulan pembeli berdasarkan sejarah penyemakan imbas dan pembelian mereka
- Kumpulan filem mengikut penilaian yang diberikan oleh penonton filem
Pembelajaran yang diselia berbanding yang tidak diawasi
Parameter | Teknik pembelajaran mesin yang diselia | Teknik pembelajaran mesin yang tidak diselia |
Proses | Dalam model pembelajaran yang diawasi, pemboleh ubah input dan output akan diberikan. | Dalam model pembelajaran yang tidak diawasi, hanya data input yang akan diberikan |
Data Input | Algoritma dilatih menggunakan data berlabel. | Algoritma digunakan terhadap data yang tidak dilabel |
Algoritma Digunakan | Sokong mesin vektor, rangkaian Neural, regresi Linear dan logistik, hutan rawak, dan pokok Klasifikasi. | Algoritma yang tidak diawasi dapat dibahagikan kepada kategori yang berbeza: seperti algoritma Cluster, K-means, Hierarchical clustering, dll. |
Kerumitan Komputasi | Pembelajaran yang diselia adalah kaedah yang lebih mudah. | Pembelajaran tanpa pengawasan adalah kompleks secara komputasi |
Penggunaan Data | Model pembelajaran yang diawasi menggunakan data latihan untuk mempelajari kaitan antara input dan output. | Pembelajaran tanpa pengawasan tidak menggunakan data output. |
Ketepatan Hasil | Kaedah yang sangat tepat dan boleh dipercayai. | Kaedah yang kurang tepat dan boleh dipercayai. |
Pembelajaran Masa Sebenar | Kaedah pembelajaran berlaku di luar talian. | Kaedah pembelajaran berlaku dalam masa nyata. |
Bilangan Kelas | Jumlah kelas diketahui. | Bilangan kelas tidak diketahui. |
Kekurangan Utama | Mengelaskan data besar boleh menjadi cabaran sebenar dalam Pembelajaran Terawasi | Anda tidak dapat memperoleh maklumat yang tepat mengenai penyortiran data, dan hasilnya sebagai data yang digunakan dalam pembelajaran tanpa pengawasan dilabel dan tidak diketahui. |
Ringkasan
- Dalam pembelajaran yang diawasi, anda melatih mesin menggunakan data yang "dilabel" dengan baik.
- Pembelajaran tanpa pengawasan adalah teknik pembelajaran mesin, di mana anda tidak perlu mengawasi model.
- Pembelajaran yang diawasi membolehkan anda mengumpulkan data atau menghasilkan output data dari pengalaman sebelumnya.
- Pembelajaran mesin tanpa pengawasan membantu anda mencari semua jenis corak yang tidak diketahui dalam data.
- Sebagai contoh, anda akan dapat menentukan masa yang diambil untuk sampai ke belakang berdasarkan keadaan cuaca, Waktu hari dan percutian.
- Contohnya, Bayi dapat mengenal pasti anjing lain berdasarkan pembelajaran yang diawasi sebelumnya.
- Regresi dan Klasifikasi adalah dua jenis teknik pembelajaran mesin yang diselia.
- Pengelompokan dan Perhimpunan adalah dua jenis pembelajaran Tanpa Pengawasan.
- Dalam model pembelajaran yang diawasi, pemboleh ubah input dan output akan diberikan sementara dengan model pembelajaran yang tidak diawasi, hanya data input yang akan diberikan