Machine
Learning bukanlah hal baru dalam lanskap ilmu komputer. Bagian dari
konsep Artificial Intelligence ini makin populer dewasa ini seiring
dengan meningkatnya awareness banyak pihak atas pengelolaan data
digital dan otomatisasi sistem guna menggantikan peran manual oleh
manusia. Untuk mengulas tentang teknologi ini, terutama kaitannya
dengan development approach di startup, DailySocial berbincang dengan
Jim Geovedi sebagai salah satu praktisi terbaik dalam teknologi ini.
Memulai
diskusi, Jim, yang juga terlibat dalam pengembangan teknologi di
layanan media online Beritagar.id, mengatakan bahwa implementasi dan
manfaat Machine Learning sebenarnya sudah kita rasakan, walau mungkin
tidak banyak dari kita menyadarinya. Dalam bahasa yang sederhana, Jim
mendefinisikan teknik Machine Learning sebagai algoritma komputer
untuk mempelajari data, mengenali pola, dan membuat model berdasarkan
data historik. Model tersebut digunakan untuk melakukan klasifikasi
atau prediksi terhadap data baru yang memungkinkan kita untuk membuat
atau mendukung pengambilan keputusan.
Analogi
konsep Machine Learning
Misalnya
DailySocial ingin mengadakan acara yang akan mengundang banyak
startup untuk presentasi terkait dengan produk dan potensinya di
pangsa pasar Indonesia. Panitia berhasil mengumpulkan 10 startup
yakni Go-Jek, FitInline, GrabBike, OkeTiket, Kulina, Abraresto,
Traveloka, Tees, Tiket, dan foodpanda.
Agar
lebih rapi tim acara memutuskan agar sesi presentasi dikelompokkan
berdasarkan kategori startup. Katakanlah kebetulan tim redaksi
DailySocial saat ini sedang tidak di kantor semua untuk liputan, jadi
tim acara harus melakukan identifikasi startup tersebut berdasarkan
kategori secara mandiri. Berhubung tim acara DailySocial sudah
mengadakan acara serupa beberapa kali dan sudah sering bertemu dengan
berbagai startup maka tim acara tersebut memiliki beberapa hal untuk
dijadikan penilaian untuk menentukan startup berdasarkan kategorinya,
yakni:
Dari
dua hal tersebut tim masih bisa mendefinisikan secara lebih gamblang,
yakni:
Nama
Startup
Biasanya nama startup dengan kategori produk makanan akan mengandung
kata-kata yang herhubungan dengan makanan atau restoran.
Biasanya nama startup dengan kategori produk travel akan mengandung
kata-kata yang herhubungan dengan berbagai hal yang berhubungan
dengan kebutuhan perjalanan.
Biasanya nama startup dengan kategori produk transportasi akan
mengandung kata-kata yang herhubungan dengan alat-alat transportasi.
Biasanya nama startup produk fashion akan mengandung kata berhubungan
dengan fashion dan pakaian.
Logo
Startup
Biasanya startup dengan kategori produk makanan akan menggunakan logo
bergambarkan atribut perlengkapan makanan.
Biasanya startup dengan kategori travel akan menggunakan logo yang
merepresentasikan perjalanan.
Biasanya startup dengan kategori transportasi akan memiliki logo yang
berhubungan dengan perlengkapan jalan.
Biasanya startup dengan kategori produk fashion akan memiliki logo
yang berhubungan dengan fashion dan pakaian.
Dari
dua detail tersebut maka tim acara sudah bisa mengelompokkan 10
startup tersebut berdasarkan kategori produk:
Berdasarkan
nama startup
Kategori produk makanan: Kulina (mendekati kata kuliner), Abraresto
(ada kata resto), foodpanda (ada kata food)
Kategori produk travel: Traveloka (ada kata travel), Tiket dan
OkeTiket (ada kata tiket)
Kategori produk trasnportasi: Go-Jek (mendekati kata ojek) dan
GrabBike (terdapat kata bike)
Kategori produk fashion: FitInline (fit merupakan ukuran yang sering
direpresentasikan untuk produk baju) dan Tees
Berdasarkan
logo startup
Kira-kira
didefinisikan seperti pada poin nama startup.
Dalam
istilah teknis Machine Learning, nama startup dan logo merupakan
bagian yang disebut sebagai fitur (features) dan beberapa detail dari
masing-masing fitur disebut dengan distribusi frekuensi (frequency
distribution). Proses belajar mesin kira-kira seperti itu. Kadang
dalam fitur tertentu suatu objek tidak memiliki spesifikasi yang pas,
misalnya dari contoh di atas logo Tees yang hanya berupa tulisan,
namun dapat diindentifikasi dengan jelas pada fitur sebelumnya yaitu
nama startup. Namun dapat disiasati dengan memberikan fitur dan
frekuensi distribusi yang lebih banyak dan mendetil. Begitulah
kira-kira sebuah algoritma Machine Learning disusun agar sebuah mesin
komputer belajar.
Pengembangan
solusi berbasis Machine Learning untuk tech-startup
Sebelum
berbicara lebih detail tentang ruang lingkup yang dapat digarap
sebuah tech-startup dengan konsep Machine Learning, Jim Geovedi
menjelaskan tantangan implementasi teknologi tersebut, khususnya di
Indonesia. Jim mengatakan:
“Cukup
banyak tantangan terhadap implementasi teknologi Machine Learning di
Indonesia, di antaranya upah kerja manusia yang masih relatif rendah
yang sulit menjadi argumen efisiensi biaya, pemahaman tentang manfaat
teknologi yang masih minimum, sampai rasa takut tenaga kerja manusia
akan tergantikan.”
Namun
demikian jika berbicara tentang kemampuan dan teknis pengembangan,
Machine Learning yang ada saat ini sudah begitu canggih, dan sangat
memungkinkan untuk membuat sistem yang mempelajari sendiri data set
kompleks dan berskala besar dengan intervensi manusia yang minimum.
Tentunya implementasi dianggap berhasil jika hasil proses otomatisasi
yang dilakukan mampu mendekati kualitas pekerjaan manusia dengan
harga yang terjangkau. Manfaat seperti ini yang diyakini akan mampu
menjadi sebuah kontradiksi dari isu tersebut di atas.
“Saya
cukup optimis bahwa implementasi teknologi Machine Learning di
Indonesia akan marak dalam waktu dekat dan diikuti oleh banyaknya
perusahaan yang mengkhususkan diri untuk pengembangan teknologi
tersebut,” ujar Jim.
Suatu hukum sederhana yang penting untuk menjadi acuan adalah kendati
sebuah konsep teknologi terlihat kompleks, namun tak selalu
penerapannya juga harus pada masalah yang terkesan besar dan
kompleks.
Jim
mencontohkan implementasi sederhana dari Machine Learning, yaitu
identifikasi spam/junk. Teknik yang digunakan adalah mempelajari data
terdahulu yang telah diberikan label (spam atau bukan) dengan
mengekstrak fitur yang kemudian akan dijadikan parameter input dari
algoritma yang digunakan untuk melakukan pengklasifikasian. Untuk
otomatisasi, maka dibuatkanlah sebuah model sebagai hasil
pembelajaran dan juga algoritma yang digunakan. Model tersebutlah
yang akan digunakan untuk melakukan klasifikasi atau prediksi
terhadap data baru.
Contoh
lain yang juga umum ditemukan di sektor publik secara online di
Indonesia antara lain rekomendasi konten. Mulai dari rekomendasi
artikel lain yang terkait dengan artikel yang sedang dibaca di sebuah
situs media online, barang lain terkait dengan barang yang sedang
dilihat di sebuah situs komersial, sampai video lain terkait dengan
video yang sedang ditonton di situs tontonan video online.
Machine
Learning juga sudah digunakan untuk keperluan-keperluan spesifik
industri di Indonesia yang tidak berhubungan langsung dengan publik,
misalnya mengidentifikasi pola serangan (dari hacker, rootkit, virus,
dan lain-lain) yang ditujukan ke sebuah jaringan dan secara otomatis
melakukan pemblokiran, melakukan penawaran otomatis (autobid) iklan,
mengidentifikasi kepribadian pengguna berdasarkan interaksi daring
mereka, memprediksi kejadian-kejadian atau tokoh-tokoh yang
diperkirakan akan menjadi pemberitaan, sampai membuat konten teks
secara otomatis.
Menurut
Jim, area pengembangan untuk tech-startup untuk teknologi Machine
Learning adalah untuk produk-produk seperti yang dicontohkan di atas.
Hal tersebut karena biaya bisa dibayarkan sesuai keperluan
(on-demand) berkat kemudahan teknologi cloud computing. Bahkan untuk
teknologi back-end Machine Learning beberapa provider cloud computing
sudah menyediakannya untuk siap pakai.
Kebutuhan
pasar akan solusi teknologi berplatform Machine Learning
Jim
melihat bahwa saat ini di Indonesia sedang terjadi kekurangan tenaga
ahli terkait pengembangan teknologi Machine Learning. Hal ini mungkin
ada hubungannya dengan fokus industri yang lebih banyak mengedepankan
aspek pemasaran ketimbang investasi bidang teknologi sehingga lebih
memilih implementasi siap pakai (lewat kemudahan PaaS dan SaaS) yang
sudah dikembangkan oleh pihak-pihak lain di luar negeri. Seiring
makin sadarnya tentang efisiensi yang dapat diakumulasi dengan
teknologi yang lebih kustom, diyakini ke depan teknologi semacam ini
akan diperhitungkan dan diprioritaskan.
Jadi
ini adalah kesempatan yang pas untuk bergegas memperisapkan diri
untuk belajar. Jim merekomendasikan beberapa rujuan belajar yang
dapat diikuti, di antaranya:
“Introduction to Artificial Intelligence” oleh Sebastian Thrun
and Peter Norvig. Sebastian Thrun dikenal sebagai pembuat
self-driving car di Google dan Peter Norvig adalah salah satu pionir
teknologi kecerdasan buatan yang saat ini menjabat sebagai Director
of Research di Google.
“Machine Learning” oleh Andrew Ng, salah satu profesor Stanford
yang kemudian menjadi Chief Scientist di Baidu Research.
“Neural Networks for Machine Learning” oleh Geoffrey Hinton, yang
dikenal karena risetnya seputar neural network dan saat ini bekerja
sebagai Distinguished Researcher untuk Google dan juga Distinguished
Emeritus Professor di University of Toronto.
Selain
tiga sumber di atas, masih banyak sekali sumber belajar yang bisa
dimanfaatkan yang dapat dicari tahu dengan search engine. Otomatisasi
sistem akan menjadi cara terbaru sebuah pelayanan ke depan, termasuk
di Indonesia yang sudah mulai terasa pemanfaatannya.
Referensi
:
https://dailysocial.id/post/machine-learning
Jim
Geovedi
Introduction
to Artificial Intelligence, Sebastian Thrun and Peter Norvig
Machine
Learning, oleh Andrew Ng
Neural
Networks for Machine Learning, Geoffrey Hinton
0 Comments