Cara Menjadi Data Scientis | Bagian 1 (pertama)

Applied Data Science merupakan buku hasil karya dua (2) orang yang menggeluti bidang Matematika dan Perusahaan Teknologi, Merriam Tech. Yaitu adalah Ian Langmore dan David Krasner . Anda dapat membaca buku tersebut dengan mengetikkan judul yang sama pada mesin pencari Applied Data Science juga jangan lupa untuk membaca repository githubnya ya mims.

sampul buku applied data science
Sampul buku Applied Data Science
Baiklah, pada artikel kali ini penulis akan membahas mengenai seluruh hal tentang bagaimana sih menjadi Data Scientis ? .
Tentunya di MeemCode kita sudah berulangkali membahas gambaran dari AI/Artificial Intelligence atau Kecerdasan Buatan, bagaimana sih masa depan dengan kecanggihan AI/Artificial Intelligence atau Kecerdasan Buatan itu ?
Dan penting untuk pembaca MeemCode ketahui, menjadi Data Scientist sendiri adalah salah satu bagian dari perkembangan AI/Artificial Intelligence atau Kecerdasan Buatan.
Bagaimana bisa ?
Ya bisa, tetap baca artikel ini hingga selesai dan lengkap ya teman-teman mims, jangan lupa untuk SHARE/BAGIKAN dan SUBSCRIBE/LANGGANAN untuk mendapat pemberitahuan mengenai artikel MeemCode terbaru.
Sebelum membahas lebih jauh tentang data dan lain sebagainya, penting penulis MeemCode ingatkan para pembaca alias mims, untuk mengetahui di artikel sebelumnya tentang definisi mengenai :
Data adalah informasi yang benar/fakta.
Lalu bagaimana penulis dan pembaca MeemCode mengetahui bahwa informasi yang kita peroleh dapat disebut data ?

5W + 1H, FORMULA KHUSUS
Pada saat penulis dan teman-teman mims sekolah pada tahap sekolah dasar kita mengenal sebuah formula yang disebut dengan formula 5W+1H, masih ingat ?
Mari penulis ingatkan.

what who when where why how
Sumber gambar : Pixabay.com
5W + 1H itu adalah singkatan daripada  WHAT, WHO, WHEN, WHERE, WHY dan HOW.  Dalam terjemahan bahasa Indonesianya adalah APA, SIAPA, KAPAN, DIMANA, KENAPA, dan BAGAIMANA.
Mari kita mulai dari datum ‘MeemCode’. Maka akan menjadi berikut, berdasarkan formula 5W + 1H ini :
1.      Apakah MeemCode itu ?
2.      Siapakah bagian dari MeemCode ?
3.      Kapan MeemCode dibuat ?
4.      Dimana situs MeemCode ?
5.      Kenapa harus MeemCode ?
6.      Bagaimana menjadi bagian dari MeemCode ?
Cukup ? hehe, pasti cukuplah. Karena hanya ada 6 bentuk pertanyaan dari 5W + 1H. Namun jika teman-teman sedikit asing dengan 5W + 1H ini, 5W + 1H dikenal juga sebagai ADIK SIMBA. 
Sudah lengkap tentunya pemahaman para mims, tentang apakah dan bagaimana garis besar tentang data dan cara memperolehnya. Kita akan semakin jauh pada topik artikel ini mengenai Cara Menjadi Data Scientist.

PERBEDAAN ANTARA DATA SCIENCE DAN DATA SCIENTIST
Sebagai catatan pengingat untuk para pembaca MeemCode dan penulis, penulis perlu menjelaskan tentang apa yang membedakan antara Data Science dan Data Scientist.
Jadi begini teman-teman mims, Data Science adalah sebuah disiplin ilmu yang mempelajari data, dari yang terstruktur hingga tidak terstruktur. Mulai dari bagaimana data tersebut dikumpulkan, diolah, dikelompokkan, disajikan dan lalu diubah menjadi informasi yang berguna dan dapat dipahami orang-orang dan juga bahkan robot (baca : AI/Artificial Intelligence atau Kecerdasan Buatan).
Lalu apakah yang disebut dengan Data Scientist itu ?

dua monitor dan handphone
Sumber gambar : Pixabay.com
Data Scientist adalah bagian dari ilmu Data Science tersebut, yaitu adalah orang yang melakukan dan mengerjakan proses pengumpulan, pengolahan hingga penyajian informasi yang dapat dimengerti. Pada umumnya seorang Data Scientist menggunakan pola dan rumus tertentu, baik menggunakan keahlian ‘programming’ atau mengolah informasi dengan keahlian pengkodean program hingga aplikasi perangkat lunak pengolah data. Seperti MySQL, Hadoop dan sebagainya.

HAL APA YANG DIBUTUHKAN MENJADI SEORANG DATASCIENCE ?
Dalam buku karya Ian Langmore dan David Krasner, Applied Data Science. Dijelaskan bahwa seorang Data Scientis harus memiliki 3 (tiga) keahlian mayor yang digambarkan dalam sebuah diagram yang disebut dengan diagram ‘Drew Conway Venn’.

diagram conway venn
Diagram Conway Venn

Dalam digram ‘Drew Conway Venn’, disebutkan bahwa seorang Data Scientist harus memiliki 3 (tiga) hal yang saling berhubungan, yaitu :
1.      Hacking Skill atau kemampuan meretas, penulis harap pembaca MeemCode sekalian sudah memahami perbedaan hacking dengan cracking.
2.      Pengetahuan Matematika dan Statistika, tentunya bukan. Karena kedua hal ini akan saling berhubungan dalam menghasilkan perhitungan dan penyajian informasi dalam bentuk fakta.
3.      Dan terakhir adalah pengalaman tertentu, yaitu adalah pengalaman seseorang tentang cara dan bagaimana mengolah data itu sendiri.
Berdasarkan buku karya Ian Langmore dan David Krasner, Applied Data Science . Diterangkan bahwa seseorang yang dengan kemampuan hacking yang cukup baik akan seringnya mencapai tujuan menjadi seorang Data Scientist. Namun tidak menutup untuk kemungkinan-kemungkinan lain bukan teman-teman mims, karena saat ini sudah banyak kursus online yang menyediakan kursus bagi orang-orang yang ingin bekerja dalam lingkup TI/Teknologi Informasi namun tidak memiliki latar belakang IT. Dan kabar baiknya lagi mereka yang mengikuti kursus ini dapat disalurkan langsung ke perusaha maupun badan usaha yang membutuhkan keahlian tersebut. WOW. Sounds great, right ?

DATA PROCESSING ATAU PEMPROSESSAN DATA
Bagaimana data-data tersebut diproses ? setelah dikumpulkan lalu ditumpukkan dan ditambah terus menerus lalu bagaimana proses akhirnya ? Tentu ada mediumnya bukan ?
Yaps, benar sekali.
Seperti yang kita bahas pada tulisan diatas tentang gambaran mengenai Data Scientist, seorang Data Scientist tidak selalu mengandalkan kemampuan proggrammingnya pada setiap penyelesaian pemprosessan data hingga menjadi informasi yang berguna dan berupa fakta.

orang dalam urusan berbisnis
Sumber gambar : Pixabay.com
Adapun beberapa aplikasi yang digunakan seorang Data Scientist adalah berikut :
1.      Hadoop
Hadoop merupakan perangkat lunak pengolah data oleh Apache Foundation. Hadoop dapat digunakan pada Sistem Operasi : Windows, Linux, OS X.
2.      MapReduce
MapReduce  awalnya dikembangkan oleh Google. Dan digunakan pada Sistem Operasi Independen.
3.      GridGain
GridGain merupakan gabungan antara Hadoop dan MapReduce, dapat digunakan pada Sistem Operasi : Windows, Linux, OS X.

Jangan lupa untuk SHARE/BERBAGI artikel MeemCode mengenai “Cara Menjadi Data Scientis | Bagian 1 (pertama) “ dan Klik BERLANGGANAN/SUBSCRIBE ya teman-teman mims sekalian, untuk mendapatkan pemberitahuan terbaru di email kalian mengenai Artificial Intelligence atau Kecerdasan Buatan dari situs MeemCode.

Diperbaharui tanggal : 10-Oktober-2019

Post a Comment

0 Comments