Training dan Loss
atau dalam bahasa Indonesia dengan sederhananya adalah Pelatihan dan
Kerugian.
Ilustrasi |
Pelatihan
Mengapa penting bagi kita
memahami apa yang disebut dengan Training/pelatihan dalam
Machine Learning ? Training berguna sebagai cara yang digunakan pada
model kita untuk mempelajari weight/bobot dan intercept/bias
pada sample kita, contohnya adalah pada sample yang memiliki label
dan tak berlabel. Jika anda ingin mengulang materi tersebut anda
dapat kembali sejenak. Mengapa melakukan pelatihan terhadap bobot dan
bias sample penting bagi model kita ? Hal ini adalah cara yang dapat
kita gunakan untuk meminimalkan kesalahan(baca:kerugian/loss)
pada model yang kita latih. Hal ini jelas sebagai dasar dari apa yang
disebut Supervised Learning mengenai suatu cara mengurangi risiko
empiris atau juga yang dikenal dalam bahasa inggris sebagai empirical
risk minimization.
Kerugian
Sebagaimana telah dijelaskan
diatas bahwa kerugian/loss dapat kita peroleh dari hasil training
pada sample dimana dalam arti sederhananya kita akan dapat menentukan
bahwa sample yang kita peroleh cocok atau tidaknya bila sudah melalui
pelatihan dan daripada pelatihan tersebut kemudian kita mendapat
hasil kerugian/loss yang kita miliki. Contohnya adalah model
tersebut dikatakan tidak cocok bila nilai kerugian tersebut adalah
besar atau nilai loss yang kita miliki dikatakan adalah sangat
tinggi, begitupun sebaliknya bila nilai loss atau kerugian
yang kita peroleh dari pelatihan sample kita adalah sama dengan nol
maka model dikatakan sempurna.
Contoh model dengan Regresi
Linier/Regression Linear atau dapat dikenali pada masyarakat umum
sebagai squared loss(Loss2) :
=
the square of the difference between the label and the prediction
=
(observation - prediction(x))2
=
(y - y')2
Mean Square Error (MSE)
adalah jumlah loss rata-rata kuadrat yang kita miliki dari seluruh
kumpulan data. Berikut adalah rumus daripada MSE tersebut :
dimana :
(x, y) adalah sebagai
berikut :
x adalah seluruh set daripada
fitur yang dimiliki sample yang digunakan sebagai model untuk membuat
prediksi
y adalah contoh daripada label
tersebut
prediction(x) adalah
fungsi yang didefiniskan sebagai nilai bobot dan bias dalam
keseluruhan set fitur yang dimiliki oleh x
D
adalah seluruh kumpulan data yang berisi banyak contoh berlabel dan
merupakan dari pasangan (x,y)
N adalah
jumlah contoh dalam D
Demikian
penjelasan daripada MSE yang
diupayakan oleh Author dan sekaligus Founder MeemTechnology/MeemCode
, namun penting bagi kita untuk saling mengingatkan bahwa hal
ini(MSE) bukanlah
satu-satunya cara untuk melakukan analisis loss/kerugian dalam
Machine Learning.
0 Comments