Regresi Tak Linear
Regresi tak linear adalah salah satu metode regresi yang memodelkan hubungan antara input dan output dengan menggunakan fungsi-fungsi matematika yang tidak linier.
Apa fungsi regresi yang paling fit untuk data berikut?
Hubungan antara upah dan pengalaman kerja dapat dijelaskan dengan fungsi regresi tak linier. Semakin lama pengalaman kerja, upah yang diterima akan meningkat, namun maksimumnya akan tercapai. Setelah mencapai titik maksimum, upah akan tetap konstan atau bahkan menurun seiring bertambahnya pengalaman kerja.
\[ Y = \beta_0 + \beta_1 X + \beta_2 X^2 + \ldots + \beta_p X^d + \epsilon \]
di mana \(d\) adalah derajat polinomial.
Derajat polinomial yang sering digunakan adalah derajat 2 (kuadratik) dan derajat 3 (kubik).
Derajat polinomial yang tinggi dapat menyebabkan overfitting. Kurva berbentuk terlalu liar, terutama pada bagian ujung.
\[ Y = \beta_0 + \beta_1 I(X \leq c_1) + \beta_2 I(c_1 < X \leq c_2) + \ldots + \beta_k I(c_{k-1} < X \leq c_k) + \epsilon \]
di mana \(I\) adalah fungsi indikator.
Fungsi tangga membagi data menjadi beberapa segmen dan memodelkan setiap segmen dengan fungsi linier.
Setiap segmen memiliki intercept dan slope yang berbeda.
Regresi spline adalah metode regresi yang membagi data menjadi beberapa segmen dan memodelkan setiap segmen dengan fungsi polinomial. Regresi ini adalah generalisasi dari regresi polinomial dan regresi tangga.
Kelebihan regresi spline adalah fleksibilitas dalam menangkap pola data yang kompleks.
Pemulusan data adalah teknik untuk mengurangi fluktuasi atau noise dalam data sehingga pola utama lebih mudah terlihat. Teknik ini sering digunakan dalam analisis deret waktu. Metode Pemulusan Data: