Training, Loss dan Mean Square Error (MSE)



Training dan Loss atau dalam bahasa Indonesia dengan sederhananya adalah Pelatihan dan Kerugian. 

https://i.stack.imgur.com/Vnf0p.png
Ilustrasi
Pelatihan
Mengapa penting bagi kita memahami apa yang disebut dengan Training/pelatihan dalam Machine Learning ? Training berguna sebagai cara yang digunakan pada model kita untuk mempelajari weight/bobot dan intercept/bias pada sample kita, contohnya adalah pada sample yang memiliki label dan tak berlabel. Jika anda ingin mengulang materi tersebut anda dapat kembali sejenak. Mengapa melakukan pelatihan terhadap bobot dan bias sample penting bagi model kita ? Hal ini adalah cara yang dapat kita gunakan untuk meminimalkan kesalahan(baca:kerugian/loss) pada model yang kita latih. Hal ini jelas sebagai dasar dari apa yang disebut Supervised Learning mengenai suatu cara mengurangi risiko empiris atau juga yang dikenal dalam bahasa inggris sebagai empirical risk minimization.

Kerugian
Sebagaimana telah dijelaskan diatas bahwa kerugian/loss dapat kita peroleh dari hasil training pada sample dimana dalam arti sederhananya kita akan dapat menentukan bahwa sample yang kita peroleh cocok atau tidaknya bila sudah melalui pelatihan dan daripada pelatihan tersebut kemudian kita mendapat hasil kerugian/loss yang kita miliki. Contohnya adalah model tersebut dikatakan tidak cocok bila nilai kerugian tersebut adalah besar atau nilai loss yang kita miliki dikatakan adalah sangat tinggi, begitupun sebaliknya bila nilai loss atau kerugian yang kita peroleh dari pelatihan sample kita adalah sama dengan nol maka model dikatakan sempurna.

Contoh model dengan Regresi Linier/Regression Linear atau dapat dikenali pada masyarakat umum sebagai squared loss(Loss2) :
= the square of the difference between the label and the prediction
= (observation - prediction(x))2
= (y - y')2
Mean Square Error (MSE) adalah jumlah loss rata-rata kuadrat yang kita miliki dari seluruh kumpulan data. Berikut adalah rumus daripada MSE tersebut :

dimana :
(x, y) adalah sebagai berikut :
x adalah seluruh set daripada fitur yang dimiliki sample yang digunakan sebagai model untuk membuat prediksi
y adalah contoh daripada label tersebut

prediction(x) adalah fungsi yang didefiniskan sebagai nilai bobot dan bias dalam keseluruhan set fitur yang dimiliki oleh x

D adalah seluruh kumpulan data yang berisi banyak contoh berlabel dan merupakan dari pasangan (x,y)

N adalah jumlah contoh dalam D

Demikian penjelasan daripada MSE yang diupayakan oleh Author dan sekaligus Founder MeemTechnology/MeemCode , namun penting bagi kita untuk saling mengingatkan bahwa hal ini(MSE) bukanlah satu-satunya cara untuk melakukan analisis loss/kerugian dalam Machine Learning.

Post a Comment

0 Comments