Statistika Desktiptif untuk Data Science

Statistika Desktiptif Untuk Data Science
 

PENGERTIAN

Sebelum belajar tentang data sciene, kita orang harus paham dulu tentang statistika. Karena data sciene itu tentang teknik mengolah data. Pengolahan data-data menjadi informasi berhubungan dengan ilmu statistik.

Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. Pengklasifikasian menjadi statistika deskriptif dan statistika inferensi dilakukan berdasarkan aktivitas yang dilakukan. Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna.Pengklasifikasian menjadi statistika deskriptif dan statistika inferensi dilakukan berdasarkan aktivitas yang dilakukan. 

Statistika Deskriptif hanya menampilkan data sebagai informasi, namun tidak menarik kesimpulan. Statistika Deskriptif hanya menyajikan data dalam bentuk tabel, rekap dan diagram sehingga lebih informatif bagi pengguna datanya.

PENDEKATAN

Dalam menjelaskan data, ada 2 metode yang digunakan:

1. Pendekatan Kuantitatif, yaitu menjelaskan data dengan numerik atau angka-angka.

2.  Pendekatan Visual, yaitu menampilkan data dengan bentuk visual, seperti grafik, chart, histogram dan lain sebagainya.

POPULASI DAN SAMPEL

Populasi adalah kesuluruhan subyek atau obyek yang ingin diteliti. Namun cakupan populasi ini sangat besar, sehingga perlu disederhanakan dengan sampel. Sampel adalah sebagian dari subyek atau obyek dalam populasi yang dipelajari.

Untuk menghitung sampel dari populasi, maka digunakan perhitungan dan acuan tabel yang sudah dikembangkan oleh para ahli. Sehingga sampel yang kita ambil bisa menjadi gambaran dari keseluruhan populasi.

MENDESKRIPSIKAN DATA

Data-data yang telah dihimpun kemudian diolah dan dideskripsikan. Ada 2 cara yang umum dilakukan dalam mendeskripsikan data:

a. Ukuran Nilai Tengah

yaitu mendeskripsikan titik tengah dari sekumpulan data. Ada 3 cara yang umum dilakukan yaitu

Mean

Mean dalam bahasa Indonesia dikenal denggan rata-rata. Untuk mendapatkan nilai Mean. Nilai numerikal dijumlahkan kemudian dibagi sejumlah datanya.

Median

Median adalah posisi tengah dari suatu nilai. Untuk mendapatkan nilai median , nilai data numerik digelar dan diurutkan. Kemudian diambil posisi yang paling tengah. jika jumlah datanya ganjil. Hasilnya berada ditengah persis. Tapi kalaiu jumlah datanya genap. Nilai Median diambil dari 2 nilai yang berada ditengah, lebih tepatnya ditambahkan kemudian dibagi 2.

Mode/Modus

Mode/Modus biasanya digunakan untuk mencari data non numerik. Mode/Modus menampilkan data yang paling sering muncul. Jika datanya berupa numerik. Maka data yang keluar adalah data yang paling sering muncul/keluar.

b. Penyebaran Data

 Mendeskripsikan data melalui pesebaran data biasanya digunakan untuk mendapatkan pola atau gambaran persebaran datanya. Visual yang biasanya digunakan dalam metode ini adalah plotting

Range

Range adalah mengambil perbedaan nilai terkecil dan terbesar.
 

Quartil

Quartil membagi data menjadi 4 bagian. Bagian-bagian itu disebut Quarter. Nah Quartil adalah nilai yang membagi, bukan hasil bagiannya.

Variance 

Variance adalah ukuran seberapa jauh sebuah kumpulan bilangan tersebar. variance dihitung berdasarkan total dari setiap data, kemudian dikurangi dengan mean data.
 
Variance nol mengindikasikan semua data sama, varian yang rendah mengindikasikan titik data sangat condong dengan faktor rerata dan antara satu dengan yang lainnya. Sedangkan nilai varian yang tinggi mengindikasikan titik data sangat tersebar disekitar rerata dan antara satu dengan lainnya.

Standart Deviation

 Standart deviation adalah ukuran sebaran statistik yang paling lazim. Standart Deviation mengukur bagaimana titik-titik data tersebar. Bisa juga didefinikan sebagai rata-rata jarank penyimpangan titik-titik data diukur dari nilai rata-rata data tersebut.
 
Statistika deskriptif digunakan untuk mempelajari data-data yang terkumpul yang selanjutnya bisa kita buat menjadi deskripsi data.

Selain menjadi deskripsi data, statistika deskriptif juga berguna untuk membuat pemodelan data yang kita buat untuk membuat machine learning. 
Kapan-kapan kita bahas lebih detail tentang statistika deskriptif dan pengaplikasiannya di Pyton. Thanks for read.

sumber:
https://medium.com/purwadhikaconnect/statistik-dasar-untuk-data-scientist-part-1-af7ee6999911


1 comment for "Statistika Desktiptif untuk Data Science"

  1. Aku hora mudheng. Yang kutahu phyton itu salah satu jenis ular.. 🤣🤣🤣

    ReplyDelete

Post a Comment