Pandas¶
Pandas adalah pustaka open source yang menyediakan struktur data dan alat analisis data yang powerful untuk Python. Pandas sangat cocok untuk bekerja dengan data tabular (seperti spreadsheet atau database).
Mengapa Pandas?¶
DataFrame - Struktur data 2D dengan label baris dan kolom
Fleksibel - Mudah membaca berbagai format file (CSV, Excel, SQL, dll)
Powerful - Operasi groupby, merge, reshape yang efisien
Terintegrasi - Bekerja baik dengan NumPy, matplotlib, scikit-learn
Instalasi¶
pip install pandas
Import Pandas¶
Konvensi standar untuk mengimport Pandas:
import pandas as pd
import numpy as np
Daftar Materi¶
Struktur Data Utama¶
Series¶
Array 1D dengan label (index):
import pandas as pd
# Membuat Series
s = pd.Series([1, 3, 5, 7, 9])
print(s)
# 0 1
# 1 3
# 2 5
# 3 7
# 4 9
# dtype: int64
# Series dengan index custom
s = pd.Series([1, 3, 5], index=['a', 'b', 'c'])
print(s['b']) # 3
DataFrame¶
Tabel 2D dengan label baris dan kolom:
import pandas as pd
# Membuat DataFrame dari dictionary
data = {
'nama': ['Ahmad', 'Budi', 'Citra'],
'umur': [20, 22, 21],
'nilai': [85, 90, 88]
}
df = pd.DataFrame(data)
print(df)
# nama umur nilai
# 0 Ahmad 20 85
# 1 Budi 22 90
# 2 Citra 21 88
Contoh Cepat¶
import pandas as pd
# Membaca CSV
df = pd.read_csv('data.csv')
# Melihat data awal
print(df.head())
# Informasi dataset
print(df.info())
print(df.describe())
# Seleksi kolom
print(df['nama'])
# Filter baris
print(df[df['nilai'] > 80])
# Groupby dan agregasi
print(df.groupby('jurusan')['nilai'].mean())
Langkah Selanjutnya¶
Lanjutkan ke Series dan DataFrame untuk mempelajari struktur data Pandas secara mendalam.