
Statistika deskriptif menyediakan ringkasan yang secara kuantitatif menggambarkan sampel data.
Populasi mengacu pada seluruh kelompok individu yang ingin kita tarik kesimpulan tentangnya.

Sampel mengacu pada kelompok orang (biasanya lebih kecil) yang telah kita kumpulkan datanya.

Untuk contoh-contoh selanjutnya, mari kita buat populasi data di R…:
Seperti apa nilai-nilainya?
Rata-rata, sering disebut juga average, didefinisikan sebagai jumlah dari semua nilai dibagi dengan banyaknya nilai. Ini adalah ukuran tendensi sentral yang memberi tahu kita apa yang terjadi di sekitar tengah data.
\(\bar{x} = \frac{1}{n} \sum_{i=i}^{n} x_{i}\)
Di R, kita menggunakan fungsi mean():
Median dari sebuah dataset adalah nilai tengah ketika data diurutkan secara menaik, atau rata-rata dari dua nilai tengah jika dataset memiliki jumlah observasi genap.
\(\tilde{x} = \begin{cases} x_{(\frac{n+1}{2})} & \text{jika } n \text{ ganjil} \\ \frac{x_{(\frac{n}{2})} + x_{(\frac{n}{2}+1)}}{2} & \text{jika } n \text{ genap} \end{cases}\)
Di R, kita menggunakan fungsi median():
Statistik modus mewakili nilai yang paling sering muncul dalam sebuah dataset.
Di R, tidak ada fungsi mode(). Sebagai gantinya, kita menghitung berapa banyak setiap nilai dan memilih yang memiliki jumlah tertinggi:
Rentang adalah selisih antara nilai maksimum dan minimum dalam sebuah dataset.
Di R, kita dapat menggunakan fungsi max() dan min() lalu mengurangkan nilainya:
Perhatikan bahwa fungsi range() mengembalikan nilai minimum dan maksimum, bukan satu nilai:
Varians sampel memberi tahu kita tentang seberapa tersebar datanya. Varians yang lebih rendah menunjukkan bahwa nilai-nilai cenderung dekat dengan rata-rata, dan varians yang lebih tinggi menunjukkan bahwa nilai-nilai tersebar di rentang yang lebih luas.
\(s^2 = \frac{\Sigma_{i= 1}^{N} (x_i - \bar{x})^2}{n-1}\)
Di R, kita menggunakan fungsi var():
Simpangan baku sampel adalah akar kuadrat dari varians. Ini juga memberi tahu kita tentang seberapa tersebar datanya.
\(s = \sqrt{\frac{\Sigma_{i= 1}^{N} (x_i - \bar{x})^2}{n-1}}\)
Di R, kita menggunakan fungsi sd():
Boxplot (diagram kotak) adalah visualisasi yang menampilkan distribusi data berdasarkan lima nilai ringkasan: minimum, kuartil pertama (Q1), median (Q2), kuartil ketiga (Q3), dan maksimum. Titik di luar batas atas dan bawah dianggap sebagai outlier.
Interquartile Range (IQR):
\[IQR = Q_3 - Q_1\]
Batas Bawah: \[\text{Lower Fence} = Q_1 - 1.5 \times IQR\]
Batas Atas: \[\text{Upper Fence} = Q_3 + 1.5 \times IQR\]
Membuat boxplot di R:
Menghitung nilai-nilai kuartil:
Statistika deskriptif menyediakan ringkasan yang secara kuantitatif menggambarkan sampel data.
5 5 3 6 7 1 6
05:00
Probabilitas adalah ukuran kemungkinan suatu peristiwa akan terjadi.
Probabilitas menjawab pertanyaan: Seberapa mungkin sesuatu terjadi?
Contoh Sederhana:
Probabilitas = (Jumlah kejadian yang diinginkan) / (Total kemungkinan kejadian)
\[P(A) = \frac{\text{Kejadian yang diinginkan}}{\text{Total kemungkinan}}\]
Contoh: Peluang mendapat angka genap (2, 4, 6) saat melempar dadu:
\[P(\text{genap}) = \frac{3}{6} = 0.5 \text{ atau } 50\%\]
Kombinatorika adalah cabang matematika yang mempelajari cara menghitung banyaknya kemungkinan atau cara mengatur objek.
Kombinatorika menjawab pertanyaan: Berapa banyak cara untuk mengatur atau memilih sesuatu?
Contoh Sederhana:
Permutasi adalah banyaknya cara mengatur objek di mana urutan penting.
\[P(n,r) = \frac{n!}{(n-r)!}\]
Dimana:
Contoh: Berapa banyak cara mengatur 3 orang (A, B, C) di 3 kursi?
\[P(3,3) = \frac{3!}{(3-3)!} = \frac{6}{1} = 6\]
Caranya: ABC, ACB, BAC, BCA, CAB, CBA
Kombinasi adalah banyaknya cara memilih objek di mana urutan tidak penting.
\[C(n,r) = \frac{n!}{r!(n-r)!}\]
Dimana:
Contoh: Berapa banyak cara memilih 2 orang dari 3 orang (A, B, C)?
\[C(3,2) = \frac{3!}{2!(3-2)!} = \frac{6}{2 \times 1} = 3\]
Caranya: AB, AC, BC (tidak sama dengan BA, CA, CB)
| Aspek | Permutasi | Kombinasi |
|---|---|---|
| Urutan | Penting | Tidak penting |
| Rumus | \(\frac{n!}{(n-r)!}\) | \(\frac{n!}{r!(n-r)!}\) |
| Contoh | ABC ≠ BAC | AB = BA |
Mari kita hitung faktorial dan permutasi/kombinasi di R:
R menyediakan fungsi untuk menghitung permutasi dan kombinasi:
Soal 1: Berapa banyak cara memilih 2 buah dari 5 buah apel?
Soal 2: Berapa banyak cara mengatur 4 orang untuk menjadi ketua, wakil, dan bendahara?
Soal 3: Ada 10 siswa, berapa banyak cara memilih 3 siswa untuk mewakili kelas?
Probabilitas bersyarat adalah probabilitas suatu kejadian terjadi, dengan mengetahui bahwa kejadian lain sudah terjadi.
Probabilitas bersyarat menjawab pertanyaan: Seberapa mungkin A terjadi, jika kita tahu B sudah terjadi?
Notasi: \(P(A|B)\) = Probabilitas A terjadi, JIKA B sudah terjadi
Contoh Sederhana:
\[P(A|B) = \frac{P(A \cap B)}{P(B)}\]
Dimana:
Interpretasi sederhana:
Kita melempar satu dadu. Berapa peluang mendapat angka lebih dari 4, jika kita tahu hasilnya adalah angka genap?
Dari satu deck kartu (52 kartu), kita ambil satu kartu. Berapa peluang kartu As, jika kita tahu kartu yang terambil adalah kartu hati?
Teorema Bayes adalah rumus untuk menghitung probabilitas bersyarat dengan cara yang lebih sistematis. Ini membantu kita memperbarui kepercayaan kita ketika ada informasi baru.
Teorema Bayes menjawab pertanyaan: Bagaimana kita memperbarui probabilitas ketika kita mendapat informasi baru?
Contoh Sederhana:
\[P(A|B) = \frac{P(B|A) \times P(A)}{P(B)}\]
Dimana:
Terminologi:
Dalam sebuah populasi:
Berapa peluang seseorang benar-benar sakit jika tes hasilnya positif?
Pendekatan ini lebih intuitif - kita bayangkan ada 10,000 orang, lalu hitung berapa banyak yang ada di setiap kategori.
Distribusi probabilitas menunjukkan semua kemungkinan nilai yang dapat diambil oleh variabel acak dan seberapa sering setiap nilai muncul.
Variabel acak: variabel yang nilainya ditentukan oleh hasil dari suatu proses acak (misalnya, hasil lemparan dadu).
Distribusi probabilitas menjawab pertanyaan: Jika kita mengulangi eksperimen berkali-kali, apa pola hasilnya?
Contoh Sederhana:
1. Distribusi Diskrit (hanya nilai bulat)
2. Distribusi Kontinu (nilai desimal)
Setiap hasil memiliki peluang yang sama.
Eksperimen: Lempar dadu 600 kali
Distribusi Binomial menggambarkan hasil dari n percobaan independen, di mana setiap percobaan hanya memiliki dua kemungkinan hasil: sukses atau gagal. Contoh umum adalah lemparan koin sebanyak n kali, jawaban benar/salah, atau respon ya/tidak.
🎯 Eksperimen: Lempar koin 10 kali, ulangi 1000 kali
Distribusi berbentuk lonceng, simetris di sekitar mean.
Eksperimen: Ukur tinggi 1000 orang (μ=170, σ=10)
PENTING: Y-axis = Density, bukan Probabilitas! - Probabilitas = luas area di bawah kurva
Dalam distribusi normal:
Jumlah kejadian dalam interval waktu/ruang tertentu.
Contoh: Rata-rata 5 email per jam
Waktu tunggu hingga kejadian pertama terjadi.
Contoh:
Parameter: λ (lambda) = rata-rata kejadian per satuan waktu
Hubungan dengan Poisson:
Skenario: Rata-rata 6 pelanggan per jam (λ = 6)
Berapa peluang menunggu < 10 menit?

| Distribusi | Jenis | Contoh |
|---|---|---|
| Uniform | Diskrit | Dadu, kartu |
| Binomial | Diskrit | Koin, ya/tidak |
| Poisson | Diskrit | Kejadian per interval |
| Normal | Kontinu | Tinggi, berat, skor |
| Eksponensial | Kontinu | Waktu antar kejadian |