Skill Wajib Dimiliki Data Scientist

data scientist visualization

Skill wajib dimiliki data scientist ada 8 secara garis besar. Jika belum tahu apa ya data scientist itu silahkan klik [data scientist] untuk mengetahui lebih jauh lagi tentang ini. Adapun skill yang wajib dimiliki data scientist antara lain :

Programming Skill

Tidak dipungkiri lagi untuk memproses dan memvisualisasikan data di komputer kita memperlukan bahasa pemograman. Bahasa Pemrograman untuk data scientist yang paling banyak fitur dan lengkap yakni antar bahasa R dan Python. Bahasa R memiliki banyak library mantap untuk mendukung para data scientist. Sementara python juga tidak kalah hebat, tetapi python hebat jika dikolaborasikan dengan library seperti numphy, panda, scipy, etc. Visualisasi dan koneksi ke database back and forth juga harus lewat programming language, sehingga pasti akan penting.

 

Machine Learning Skill

Jika bekerja di perusahaan internet atau perusahaan yang berdasar pada data untuk produk dan servicenya seperti gojek. Pasti kamu tidak akan jauh jauh daari namanya machine learning

Machine learning menjadi booming dikarenakan banyaknya data yang ada di dunia dipanen dengan bantuan sistem komputerisasi dunia yang sudah maju dan sangat murah. Machine learning adalah disiplin ilmu untuk mempelajari pola dan pattern history untuk training model yang dipakai. Bagi kamu yang mau belajar machine learning direkomendasikan menggunakan library tensorflow.

 

Statistic Skill & Math Skill

Skill Statistik diperlukan oleh data scientist untuk menganalisa data. Diperlukan skill untuk menghitung standard deviation, central tendency, Q1,Q2,Q3 dan Q4.  Statistik dan matematika (deret, suku banyak, peluang) adalah dasar untuk menjadi data scientist. Untuk mempelajari ini tentunya by experience atau otodidak sudah cukup. Training di youtube dan di khan academy menyediakan banyak sekali resources untuk mempelajari statistik dan matematika. Tetapi yang harus di aware adalah banyak formula sudah dipermudah oleh library programing language, jadi ada formula yang sudah ready to use, jangan belajar membuat ban lagi kuncinya. Jadi anda harus aware akan semua fungsi supaya anda tidak mempelajari sesuatu yang mubazir.

 

Data Wrangler

Data wrangling adalah kegiatan penyeragaman data / pembersihan data data “kotor” menjadi data bersih yang siap digunakan untuk analysis dan uji coba. Data kotor maksudnya data tersebut memiliki banyak ketidak seragaman format dan banyak tambahan suffix, affix dsb. Itu membuat data tidak standard dan susah dilakukan analysis otomatis oleh komputer. Data wrangler bertugas untuk ini. Tanpa data wrangler, data yang kotor tidak dapat digunakan sebaik mungkin.

 

Data Visualization and Communication

Data visualization and Communication adalah salah satu Skill Wajib Dimiliki Data Scientist. Visualisasi data yang baik mewakili dan menjelaskan sendirinya dan dapat dengan mudah ditarik kesimpulannya dari sana. Visualisasi data yang baik juga membuat orang mengerti akan data secara lebih cepat dan tanpa ada bimbingan. Data visualisasi di data science mungkin terlihat sepele dan mudah, tetapi sebenarnya untuk data yang memiliki parameter puluhan hal ini menjadi sangat rumit dan memusingkan.

Make sure juga bahwa data yang dimaksud memiliki keterangan dan warna yang contrast sehingga dapat secara jelas pembedaannya. Data visualisasi yang baik akan membuat re freh memory akan data tersebut lebih cepat apalagi dengan keterangan yang sesuai.

 

Software Engineering

Software engineering adalah syarat skill selanjutnya yang harus dimiliki seorang data scientist. Seorang data scientist handal harus tahu flow dari software untuk memanen data itu kemudian memprosesnya dan menyimpannya di database. Software engineering diperlukan untuk logging ataupun membuat produk yang data driven.

Data Intuition

Data intuition dimaksudkan sebagai intuisi arti sebuah data yang sudah ada. Data intuisi bisa diasah seiring berjalannya waktu dan pengalaman. Bagaimana sebagai data scientist kita berinteraksi dengan semua pihak seperti software engineer dan project leader. Method apa yang digunakan. Perkiraan apa yang mungkin.