Sejak awal, komputer telah berhasil melakukan berbagai tugas yang
sulit bagi manusia. Berikan permasalahan gravitasi, perancangan
roket, simulasi reaksi kimia, dan berbagai hal lain yang terlihat
mustahil, komputer dapat menyelesaikannya dengan baik dan sangat
cepat.
Namun anehnya, ketika berusaha menyelesaikan masalah yang sangat
mudah bagi manusia seperti mengenali objek dalam foto dan memahami
percakapan manusia, komputer seakan tak berdaya. Setidaknya sampai
era Deep Learning dimulai.
Jauh sebelum AlphaGo memenangkan permainan Go melawan juara dunia,
mobil mengemudi dengan sendirinya, dan asisten virtual seperti Siri,
ilmuwan-ilmuwan komputer telah berusaha membuat sistem yang memiliki
kecerdasan— Artificial Intelligence (AI).
Jenis AI yang paling sederhana dapat kita lihat pada sistem berbasis
aturan-aturan. Sederhananya, komputer melakukan tindakan berdasarkan
aturan-aturan seperti “Jika A maka B”. Aturan-aturan ini ditulis
secara formal dengan bahasa yang dapat dipahami komputer. Pendekatan
seperti ini disebut dengan Knowledge
Base.
Tentu saja pendekatan seperti ini tidak praktis untuk permasalahan
yang luas. Semakin luas permasalahan yang akan diselesaikan, semakin
banyak pula aturan-aturan yang perlu ditulis secara manual.
Masalahnya, sangat sulit untuk menyusun pengetahuan dalam
aturan-aturan formal yang cukup kompleks untuk mendeskripsikan
lingkup permasalahan secara akurat.
Kesulitan ini mendorong sebuah pendekatan sistem AI yang baru. Dari
pada memberikan sistem AI pengetahuan yang tertulis secara formal,
sistem AI diberikan kemampuan untuk belajar kemampuan untuk mencari
pengetahuannya sendiri. Kemampuan ini disebut Pembelajaran Mesin
(Machine Learning).
Pembelajaran Mesin
Pembelajaran mesin menggunakan algoritma yang umum dapat digunakan
untuk berbagai masalah yang berbeda. Kita hanya perlu memberikan
data, lalu algoritma itu akan mencari hal-hal yang menarik dalam data
yang kita berikan, hingga akhirnya sistem AI akan membangun
pengetahuan berdasarkan data tersebut. Dengan kata lain, pembelajaran
mesin dapat beradaptasi terhadap suatu masalah dengan mempelajari
pola-pola yang ditemukan dalam data.
Sebagai contoh, kita dapat mengelompokkan spesies bunga dari genus
Iris dengan melihat ukuran sepal (kelopak) dan petalnya (mahkota).
Secara umum algoritma pembelajaran mesin dapat dikategorikan menjadi
dua jenis tergantung dari data yang diberikan, yaitu Supervised
Learning dan Unsupervised Learning.
Supervised Learning
Contoh kasus bunga iris di atas adalah contoh Supervised Learning.
Pada supervised learning, algoritma pembelajaran mesin diberikan
contoh input (ukuran sepal dan petal) dan pasangan outputnya
(spesies). Tugas algoritma pembelajaran mesin adalah mencari hubungan
antara masing-masing pasangan ukuran sepal dan petal dengan
spesiesnya— mencari operasi-operasi yang dibutuhkan agar semua
input mengarah pada output yang tepat. Dalam pembelajaran mesin,
output dari contoh input tertentu biasa disebut dengan label.
Beberapa contoh algoritma supervised learning adalah Decision Tree,
Naive Bayes, Nearest Neighbor, dan Support Vector Machine.
Unsupervised Learning
Berbeda dengan supervised learning, label tidak diberikan pada
algoritma unsupervised learning. Bayangkan tabel dataset bunga iris
diatas, namun tanpa kolom spesies. Tentu saja algoritma unsupervised
learning tidak akan secara ajaib mengetahui bahwa ukuran sepal dan
petal tertentu masuk ke spesies Iris setosa, namun algoritma
unsupervised learning dapat menemukan struktur dari data yang
diberikan.
Beberapa contoh algoritma unsupervised learning adalah k-Means dan
Hidden Markov Model.
Pentingnya Representasi Data
Dalam kebanyakan kasus, sistem pembelajaran mesin klasik tidak
belajar berdasarkan data mentah, melainkan berdasarkan representasi
dari data tersebut.
Misalnya, kita memiliki data sensor akselerometer untuk mengenali
aktivitas manusia. Data mentah dari akselerometer tersebut terlalu
berantakan untuk dipelajari langsung oleh sistem pembelajaran mesin.
Sistem akan kesulitan menemukan informasi penting dari data mentah
yang polanya tak teratur, sehingga performa pembelajaran menjadi
buruk. Maka dari itu perlu dicari informasi-informasi yang dapat
mewakilkan data tersebut, seperti nilai rata-rata dari suatu data dan
warna dan bentuk objek pada gambar. Masing-masing informasi yang
mewakilkan data disebut sebagai Fitur. Pemilihan fitur ini tergantung
pada karakteristik datanya.
Performa suatu algoritma pembelajaran mesin sangat bergantung pada
representasi data yang digunakan. Sayangnya, dalam banyak kasus sulit
untuk mengetahui fitur yang perlu diekstrak dari suatu data.
Misalnya, kita tahu bahwa burung memiliki sayap, sehingga kita dapat
menggunakan keberadaan sayap sebagai fitur untuk mengenali burung
dalam sebuah gambar. Namun sayap itu sendiri sangat sulit untuk
dideskripsikan dalam nilai-nilai piksel, sehingga sulit untuk
mengekstrak fitur yang mewakilkan berbentuk sayap.
Masalah seperti ini dapat diatasi dengan menggunakan pembelajaran
mesin bukan hanya untuk menemukan output dari representasi data, tapi
juga untuk menemukan representasi data itu sendiri. Pendekatan ini
disebut sebagai Pembelajaran Representasi (Representation Learning).
Dengan mengandalkan sistem untuk mencari representasi datanya
sendiri, algoritma-algoritma pembelajaran representasi memungkinkan
fitur-fitur terbaik ditemukan dengan cepat tanpa intervensi manusia.
Selain itu, representasi yang dihasilkan pun biasanya lebih baik
daripada representasi yang dicari secara manual.
Pembelajaran representasi terdengar sempurna, namun pada aplikasinya
data yang sangat kompleks masih sulit untuk direpresentasikan dengan
baik. Sehingga pada akhirnya performa pembelajaran pun buruk. Untuk
mengatasi masalah tersebut, representasi data yang kompleks dapat
dideskripsikan dengan susunan representasi-representasi yang lebih
sederhana, membentuk struktur representasi dengan lapisan-lapisan
bertingkat. Dengan menggunakan struktur yang berlapis-lapis, kita pun
mulai memasuki dunia Deep Learning.
Deep Learning
Ide dari deep learning adalah membuat hierarki konsep-konsep dengan
arsitektur yang terdiri dari beberapa lapisan, menyusun konsep yang
kompleks dari konsep-konsep yang lebih sederhana. Sifat ini
memberikan deep learning kemampuan untuk merepresentasikan sebuah
permasalahan dengan fleksibilitas yang tinggi.
Machine learning diterjemahkan menjadi pembelajaran mesin dan
representation learning menjadi pembelajaran representasi. Tapi
pembelajaran dalam terdengar kurang enak, jadi saya akan tetap
menggunakan istilah deep learning.
Referensi
Goodfellow, I., Bengio, Y. & Courville, A., 2016. Deep Learning.
Book in preparation for MIT Press.
Bengio, Y., Courville, A. and Vincent, P., 2013. Representation
learning: A review and new perspectives. IEEE transactions on pattern
analysis and machine intelligence, 35(8), pp.1798–1828.
Deng, L., 2014. A Tutorial Survey of Architectures, Algorithms, and
Applications for Deep Learning. APSIPA Transactions on Signal and
Information Processing, Volume 3.
Deng, L. & Yu, D., 2014. Deep Learning: Methods and Applications.
Foundations and Trends® in Signal Processing, 7(3–4), pp. 197–387.
https://medium.com/@ilhamadun/pembelajaran-mesin-dan-deep-learning-5c86c7cf77b9
0 Comments