Python Library untuk Data Scientist

Python Library untuk data scientist sangat banyak di pasaran. Python tanpa library akan tidak ada gunanya dan tidak bisa apa apa. Itulah mengapa kita wajib menggunakan library yang ada demi kemudahan kita menganalis, memvisualisasikan dan memformulakan data data mentah menjadi informasi yang berharga.

Python library yang terkenal di dunia data scientist yakni Numpy, Panda, Scipy dan Matplot Lib

 

1. Numpy

numpy library python untuk data science

numpy library python untuk data science

NumPy adalah pustaka untuk bahasa pemrograman Python, menambahkan dukungan untuk array dan matriks multidimensi yang besar, bersama dengan koleksi besar fungsi matematika tingkat tinggi untuk beroperasi pada larik ini.(wikipedia). Python Library untuk Data Scientist numpy bisa didownload di http://www.numpy.org/index.html . Library ini adalah library open source yang dapat dipakai siapa saja dengan gratis. Numpy menerima sumbangan / donation untuk bantuan dana.

2. Pandas

pandas library python untuk data sciencepandas library python untuk data sciencepandas library python untuk data science

pandas library python untuk data science

Library pandas sangat terkenal di kalangan data scientis python. Python Library untuk Data Scientist ini tersedia secara free dan dapat didownload di https://pandas.pydata.org/. Pandas sangat baik untuk analysis dan visualisasi data. beberapa keunggulan pandas antara lain

  • Objek DataFrame yang cepat dan efisien untuk manipulasi data dengan pengindeksan terintegrasi;
  • Alat untuk membaca dan menulis data antara struktur data dalam memori dan berbagai format: CSV dan file teks, Microsoft Excel, database SQL, dan format HDF5 yang cepat;
  • Penjajaran data yang cerdas dan penanganan terpadu data yang hilang: dapatkan penyelarasan berbasis label otomatis dalam perhitungan dan mudah memanipulasi data yang berantakan ke dalam bentuk yang teratur;
  • Pembentukan dan pivoting set data yang fleksibel;
  • Pemotongan berbasis label cerdas, pengindeksan mewah, dan subset dari kumpulan data besar;
  • Kolom dapat dimasukkan dan dihapus dari struktur data untuk ukuran yang berubah-ubah;
  • Menggabungkan atau mentransformasikan data dengan grup yang kuat dengan engine yang memungkinkan operasi split-apply-menggabungkan pada set data;
  • Penggabungan dan penggabungan set data yang tinggi;
  • Pengindeksan sumbu hierarkis menyediakan cara intuitif untuk bekerja dengan data dimensi tinggi dalam struktur data dimensi rendah;Fungsionalitas seri waktu: pembuatan rentang tanggal dan konversi frekuensi, statistik jendela bergerak, regresi linier jendela bergerak, pergeseran tanggal, dan lagging. Bahkan membuat offset waktu khusus domain dan bergabung dengan deret waktu tanpa kehilangan data;
  • Sangat dioptimalkan untuk kinerja, dengan jalur kode kritis ditulis dalam Cython atau C.
    Python dengan panda sedang digunakan di berbagai domain akademik dan komersial, termasuk Keuangan, Ilmu Saraf, Ekonomi, Statistik, Periklanan, Analisis Web, dan banyak lagi.
    (dikutip dari pandas.pydata.org)

3. Scipy

SciPy berisi rutinitas tambahan yang diperlukan dalam karya ilmiah: misalnya, rutin untuk komputasi integral secara numerik, menyelesaikan persamaan diferensial, optimisasi, dan matriks jarang. Scipy berisikan stack berisi banyak fungsional numerik. Juga berisi toolbox domain spesifik, proses signal, optimization, statistic and much more. Scipy digunakan di kalangan researcher data dengan masif karena kemuadahannya dan kelengkapannya.

 

4. Matplot Lib

matplotlib untuk data science

matplotlib untuk data science

Modul matplotlib menghasilkan plot berkualitas tinggi. Dengannya Anda dapat mengubah data atau model Anda menjadi angka untuk presentasi atau artikel. Tidak perlu melakukan pekerjaan numerik dalam satu program, menyimpan data, dan memplotnya dengan program lain. Mendengar kata matplot lib, mungkin ada yang mengait ngaitkan dengan software matlab. Software matlab banyak

 

TEMUKAN PENJELASAN SKILL YANG DIPERLUKAN UNTUK DATA SCIENTIS DISINI