Belajar Python Data Sciene Day 6, Mengenal Pandas 2

 Postingan ini adalah postingan lanjutan dari Belajar Python Data Sciene Day 6, Mengenal Pandas.

Kehebatan Pandas adalah dia bisa terkoneksi dengan beragam database dan method. Selain mengisi data variable di dalam Python, Kita juga bisa menggunakan cara lain. 

Membaca Data Dari File

Ada banyak cara untuk meload data ke Pandas Dataframe. Salah satunya adalah dengan membaca file csv dan excel. Salah duanya akan aku terangkan dibawah nanti. Sebelum data kita importkan ke Pandas. Kita harus menyamakan struktur data di excel menjadi Tabular/Tabel. 

Untuk membuka file, Pandas menyediakan dua method yang berbeda sesuai dengan jenis filenya.

# membaca dari dari csv
df_from_csv = pd.read_csv('jabar.csv')

# membaca data dari excel
df_from_excel = pd.read_excel('jabar.xlsx')

Pemeriksaan Sederhana Tentang Karakteristik Data

Sebelum proses analisa yang lebih mendalam. Kita bisa memeriksa karakteristik data dengan fungsi-fungsi yang sudah disediakan oleh pandas. yaitu:

  • Head()
  • Tail()
  • Info()
  • Descibe

Head()

Head adalah fungsi untuk mengambil 5 baris pertama. Tapi kamu bisa mengambil hingga baris ke -n. Caranya adalah dengan menuliskan jumlah baris yang ingin ditampilkan didalam tanda kurung.
contohnya seperti ini :

df = pd.read_csv('../input/indonesia-coronavirus-cases/jabar.csv')
#penggunaan tanpa parameter menghasilkan 5 baris paling atas
df.head()
#penggunaan dengan parameter menghasilkan sejumlah baris dari atas
df.head(9)


hasilnya seperti dibawah ini :

python data sciene-head practice

Tail()

Kebalikan dari Head(). perintah tail digunakan untuk mengambil data sejumlah n dari belakang. Cara penggunaannya sama. Kamu hanya perlu mengubah kata Head menjadi Tail. Contohnya seperti dibawah ini:
 
df = pd.read_csv('../input/indonesia-coronavirus-cases/jabar.csv')
#penggunaan tanpa parameter menghasilkan 5 baris paling bawah
df.tail()
#penggunaan dengan parameter menghasilkan sejumlah baris dari bawah
df.tail(9)

hasilnya akan terlihat seperti dibawah ini:

python data sciene-penggunaan tail

 Info()

Perintah info() digunakan untuk mendapatkan ringkasan tipe data dari sebuah data frame. Data yang akan kamu dapatkan disini adalah:
1. Jumlah Kolom
2. Total penggunaan  memory
3. Tipe data dari kolom
4. Jumlah kolom yang null 
untuk lebih jelasnya bisa kamu lihat di gambar berikut:

python data sciene, info pandas

mohon maaf gambarnya terpotong karena tidak cukup.

Describe()

Menurutku salah satu kehebatan dari Pandas ada di perintah describe(). Di sinilah kesaktian Python feat Pandas. Kita bisa mendapatkan kesimpulan deskripsi statistik secara langsung. Nggak pakai anu-anuan. Kalau belum tahu tentang statistika deskriptif, cuss main ke artikelku yang berjudul Statistika Desktiptif untuk Data Science.


df = pd.read_csv('../input/indonesia-coronavirus-cases/jabar.csv')
df.describe()
Ringkasan statistika deskriptif yang kita dapatkan dari describe bisa kamu lihat di gambar berikut:

describe di panda data sciene


 Ternyata materi pengenalan Pandas tidak cukup satu postingan saja. Lumayan juga dibuat dua posting. Semoga sedikit ilmu ini bisa menambah keilmuan kita. Pada materi selanjutnya kita akan mulai mengenal Pandas lebih dalam. Keep your mind, eh your mouse



No comments for "Belajar Python Data Sciene Day 6, Mengenal Pandas 2"