Belajar Python Data Sciene Day 6, Mengenal Pandas
Setelah kemarin kita berkenalan dengan Statistika Deskriptif, sekarang kita berkenalan dengan Pandas. By the way, meskipun aku sering berurusan dengan data. Tapi sebenarnya aku nggak paham tentang ilmu Statistik. Apalagi Statistika Deskriptif.
Sebagai programmer yang memegang semua data dan aplikasi di Rumah Sakit. Aku sering mendapat permintaan data. Terutama data-data rekam medis yang sering meminta data suka-suka. Tapi aku juga nggak menyalahkan mereka. Soalnya mereka minta data ke kami karena mereka dimintai data oleh manajemen atau pihak lain.
Karena itulah aku berfikir sepertinya aku harus mempelajari Machine Learning. "Huff," ternyata Machine Learning tidak semudah yang kukira. Begitulah sedikit curcol dariku.
Sebelumnya aku mengolah data-data dengan Microsoft Excel atau lewat SQL Server. Terus terang mengolah data dengan Visual Basic 6 bukan hal yang menyenangkan. Bukan hanya Visual Basic 6, C#, VB.net dan PHP juga memberikan pengalaman yang sama. Tapi dengan Python, semuanya berubah.
Sebenarnya bukan Pythonnya yang sakti. Tapi library-librarynya yang sangat powerfull. Salah satunya adalah Pandas. Dulu aku kira nama Pandas dipilih buat lucu-lucuan, seperti aku yang gendut, imut dan lucu. Tapi ternyata bukan.
Pandas
Fitur
- Fast and efficient Series and DataFrame objects for data manipulation with integrated indexing
- Intelligent data alignment using indexes and labels
- Integrated handling of missing data
- Facilities for converting messy data into orderly data (tidying)
- Built-in tools for reading and writing data between in-memory data structures and files, databases, and web services
- The ability to process data stored in many common formats such as CSV, Excel, HDF5, and JSON
- Flexible reshaping and pivoting of sets of data
- Smart label-based slicing, fancy indexing, and subsetting of large datasets
- Columns can be inserted and deleted from data structures for size mutability
- Aggregating or transforming data with a powerful data grouping facility to perform split-apply-combine on datasets
- High-performance merging and joining of datasets
- Hierarchical indexing facilitating working with high-dimensional data in a lower-dimensional data structure
- Extensive features for time series data, including date range generation and frequency conversion, moving window statistics, moving window linear regressions, date shifting, and lagging
- Highly optimized for performance, with critical code paths written in Cython or C
Install Pandas
pip install pandas
Struktur Data Pandas
Series
import pandas as pd
x = pd.Series([1,2,3,4])
print(x)
=============
0 1
1 2
2 3
3 4
dtype: int64
DataFrame
import pandas as pd
df = pd.DataFrame({'panjang': [50, 21], 'lebar': [12, 15]})
print(df)
==========
panjang lebar
0 50 12
1 21 15
# check tipe data
print(type(df))
==========
<class 'pandas.core.frame.DataFrame'>
No comments for "Belajar Python Data Sciene Day 6, Mengenal Pandas"
Post a Comment