By greatnusa • 24 Februari 2022
Unsupervised learning adalah penggunaan algoritma kecerdasan buatan atau artificial intelligence (AI) untuk mengidentifikasi pola dalam kumpulan data yang berisi titik data yang tidak diklasifikasikan atau diberi label.
Jika kamu bukan berasal dari bidang IT, mungkin kamu akan merasa asing dengan istilah unsupervised learning. Dalam artikel GreatNusa kali ini, kami akan membahas beragam jenis unsupervised learning beserta contohnya.
Unsupervised learning atau pembelajaran tak terarah adalah teknik pembelajaran mesin di mana pengguna tidak perlu mengawasi modelnya. Sebaliknya, pembelajaran tak terarah memungkinkan model bekerja sendiri untuk menemukan pola dan informasi yang sebelumnya tidak terdeteksi, terutama yang berkaitan dengan data yang tidak berlabel.
Baca Juga: Apa Itu Data Science dan Fungsinya dalam Dunia Kerja
Algoritma unsupervised learning memungkinkan pengguna untuk melakukan tugas pemrosesan yang lebih kompleks dibandingkan dengan supervised learning. Namun, pembelajaran tak terarah bisa lebih tidak terduga dibandingkan dengan metode pembelajaran alami lainnya. Algoritma pembelajaran tak terarah termasuk pengelompokan, deteksi anomali, jaringan saraf, dan lain-lain.
Clustering adalah konsep penting dalam pembelajaran tak terarah. Clustering biasanya berkaitan dengan menemukan struktur atau pola dalam kumpulan data yang tidak dikategorikan. Algoritma unsupervised learning jenis clustering akan memproses data dan menemukan kluster (grup) alami jika ada dalam data.
Kamu juga dapat mengubah berapa banyak kluster yang harus diidentifikasi oleh algoritma. Ini memungkinkan kamu untuk menyesuaikan perincian grup ini.
Ada berbagai jenis pengelompokan yang dapat kamu manfaatkan:
Dalam metode clustering yang satu ini, data dikelompokkan sedemikian rupa sehingga satu data hanya dapat dimiliki oleh satu kluster saja.
Contoh: K-means
Dalam teknik clustering ini, setiap data adalah sebuah kluster. Penggabungan berulang antara dua kluster terdekat mengurangi jumlah kluster.
Contoh: Hierarchical cluster
Dalam teknik ini, himpunan fuzzy digunakan untuk mengelompokkan data. Setiap titik dapat dimiliki oleh dua kluster atau lebih dengan derajat keanggotaan yang berbeda.
Di sini, data akan dikaitkan dengan nilai keanggotaan yang sesuai.
Contoh: Fuzzy C-Means
Teknik ini menggunakan distribusi probabilitas untuk membuat cluster
Contoh: Keyword di bawah ini
dapat dikelompokkan menjadi dua kategori "sepatu" dan "sarung tangan" atau "pria" dan "wanita."
Aturan asosiasi memungkinkan kamu untuk membuat asosiasi di antara objek data di dalam database besar. Teknik pembelajaran tak terarah ini adalah tentang menemukan hubungan yang menarik antara variabel dalam database besar. Misalnya, orang yang membeli rumah baru kemungkinan besar akan membeli perabotan baru.
Contoh lain:
Sementara unsupervised learning digunakan terhadap data yang tidak diberi label, unsupervised learning menggunakan kumpulan data berlabel untuk melatih algoritme untuk mengidentifikasi dan mengurutkan berdasarkan label yang disediakan.
Objek input, atau sampel, memiliki label yang sesuai sehingga algoritma belajar mengidentifikasi dan mengklasifikasikan objek input yang cocok dengan label yang sama.
Dengan kata lain, algoritma membuat peta dari input yang diberikan ke hasil tertentu berdasarkan apa yang mereka pelajari dari data pelatihan yang telah diberi label oleh teknisi machine learning atau data scientist.
Selain itu, supervised learning menggunakan data pelatihan berlabel dan data validasi berlabel. Hal ini memungkinkan keakuratan keluaran pembelajaran yang diawasi untuk diperiksa keakuratannya dengan cara yang tidak dapat diukur dengan pembelajaran tak terarah. Teknisi machine learning atau data scientist dapat memilih untuk menggunakan kombinasi data berlabel dan tidak berlabel untuk melatih algoritma mereka. Opsi di antara ini secara tepat disebut pembelajaran semi-diawasi.
Berikut adalah beberapa perbedaan antara unsupervised learning dan supervised learning dalam tabel:
Parameter | Unsupervised Learning | Supervised Learning |
Input Data | Algoritma digunakan terhadap data yang tidak berlabel | Algoritma dilatih menggunakan data berlabel |
Kompleksitas Komputasi | Unsupervised learning sangat kompleks secara komputasi | Supervised learning adalah metode yang lebih sederhana |
Akurasi | Metode yang kurang akurat namun tetap dapat dipercaya | Metode yang sangat akurat dan dapat dipercaya |
Mari kita ambil contoh pembelajaran tak terarah untuk bayi dan anjing peliharaan keluarganya. Bayi tersebut tahu dan mengidentifikasi anjing ini. Beberapa minggu kemudian seorang teman dari keluarganya membawa seekor anjing dan mencoba bermain dengan bayinya.
Bayi tersebut belum pernah melihat anjing yang di bawah teman dari keluarganya ini sebelumnya. Namun, bayi tersebut mengenali banyak fitur dari anjing yang di bawah teman dari keluarganya itu (2 telinga, 2 mata, berjalan dengan 4 kaki) yang sama seperti anjing peliharaannya.
Bayi tersebut selanjutnya mengidentifikasi hewan baru itu sebagai anjing. Ini adalah unsupervised learning, di mana kamu tidak diajarkan tetapi kamu belajar dari data yang ada dan belum dilabelkan tersebut (dalam hal ini data tentang seekor anjing.) Jika ini adalah supervised learning, seseorang akan memberi tahu bayi tersebut bahwa itu adalah anjing juga sama seperti anjing peliharaannya.
Selanjutnya, ini adalah beberapa penerapan teknik Unsupervised Learning:
Unsupervised learning dapat mengidentifikasi pola yang sebelumnya tidak diketahui dalam data. Ini bisa lebih mudah, lebih cepat, dan lebih murah untuk digunakan daripada supervised learning karena pembelajaran tak terarah tidak memerlukan pekerjaan manual yang terkait dengan pelabelan data yang dibutuhkan pembelajaran terawasi. Ditambah, unsupervised learning dapat bekerja dengan data real-time untuk mengidentifikasi suatu pola.
Meskipun fitur unsupervised learning tersebut sangat berguna, ada beberapa kelemahan atau kekurangan yang perlu kamu ketahui, antara lain:
Jika kamu berminat untuk mempelajari lebih lanjut tentang topik ini, kamu bisa mengikuti kursus belajar machine learning pemula di GreatNusa. Untuk informasi lebih lanjut, kunjungi website kami di sini. Semoga setelah membaca artikel ini, kamu semakin paham bahwa unsupervised learning adalah penggunaan AI untuk mengidentifikasi pola dalam kumpulan data yang berisi titik data yang tidak diklasifikasikan atau diberi label.
By greatnusa • 14 Februari 2022
By greatnusa • 16 Februari 2022
By greatnusa • 29 Maret 2023
By greatnusa • 29 Maret 2023
By greatnusa • 5 Mei 2023
By greatnusa • 8 Mei 2023