ESTIMASI DAN INFERENSI MODEL REGRESI SEMI-PARAMETRIK PROSES PRODUKSI

Tubagus Pamungkas,

Dosen Tetap Pendidikan Matematika FKIP UNRIKA Batam

ABSTRAK

Regresi berganda terdapat kasus khusus dalam sebuah analisa regresi, pada regresi berganda terdapat satu variabel tak bebas yang akan diprediksi, tetapi terdapat dua atau lebih variabel bebas, pemilihan model yang terbaik akan dilakukan dengan 3 metode, yaitu Metode Quadratic Mode Estimator (QME), Metode Symmetrically Trimmed Least Squares (STLS) dan Metode Left Truncated (LT).  Data yang digunakan adalah data polusi udara yang disebabkan oleh 7 variabel bebas yang meliputi jumlah kendaraan yang melewati, suhu udara, kecepatan angin, perbedaan temperatur, angin, jam aktif dan hari aktif, Pemotongan atau penyensoran dari suatu variabel respon dalam suatu model regresi adalah salah satu masalah yang sering muncul dalam banyak aplikasi.

            Berdasarkan uraian dari pembahasan dan simulasi, terdapat beberapa hal penting yang dapat disimpulkan, dalam pemilihan model terbaik regresi semi-parametrik diperoleh model terbaik adalah dengan menggunakan metode QME, hal tersebut dapat dilihat dari nilai RMSE terkecil. Dalam uji parsial terdapat 2 variabel yang signifikan terhadap variabel dependent yaitu variabel yang berupa cars dan wind.speed dan juga konstanta yang berupa intercept. Dalam diagnostic checking dapat disimpulkan uji kenormalan menggunakan Kolmogorov Smirnov Test ternyata data tidak berdistribusi normal, namun karena data banyak sehingga kenormalan bisa diabaikan, sedangkan untuk uji autokorelasi menggunakan Durbin WatsonTest dapat disimpulkan tidak ada autokorelasi pada residual, untuk uji Homoskesdastisitas menggunakan Breusch Pagan Test dapat disimpulkan residual bersifat homoskedastisitas.

 

  1. PENDAHULUAN

Dalam kehidupan sehari-hari terdapat hal-hal yang dapat diselesaikan menggunakan matematika, statistika adalah salah satu cara dalam mengumpulkan data, mengolah, menganalisa dan menyimpulkan. Analisis Regresi merupakan salah satu teknik untuk melihat hubungan antara 2 variabel atau lebih dan kemudian mengestimasinya menjadi sebuah model yang dapat menjadi sebuah persamaan yang dapat menghubungkan variabel tergantung (dependent variable) terhadap variabel-variabel bebas (independent variabels). Banyak paper meregresi estimasi non-parametrik untuk efisiensi produksi atas variabel-variabel bebas dalam prosedur-prosedur tertentu untuk menjelaskan faktor yang mungkin mempengaruhi kinerja dari variabel tergantungnya. Model regresi yang menangani situasi tersebut memerlukan satu set persamaan (satu persamaan tunggal saja tidak cukup) yang perlu diselesaikan secara simultan dan model ini dikenal sebagai model ekonometrik. lebih dahulu akan di deskripsikan suatu data yang layak untuk model-model seperti ini. Kita mengajukan prosedur-prosedur bootstrap tunggal dan ganda; keduanya memungkinkan inferensi valid, dan prosedur bootstrap ganda memperbaiki efisiensi statistik dalam regresi. Kita menguji kinerja statistik estimator-estimator kita dengan menggunakan metode Metode Quadratic Mode Estimator (QME), Metode Symmetrically Trimmed Least Squares (STLS) dan Metode Left Truncated (LT) .

Regresi berganda terdapat kasus khusus dalam sebuah analisa regresi, pada regresi berganda terdapat satu variabel tak bebas yang akan diprediksi, tetapi terdapat dua atau lebih variabel bebas, dimana bentuk umum dari regresi berganda adalah :

, sehingga jika Y adalah variabel yang akan diramalkan maka  adalah dapat diuji pengaruhnya terhadap Y, dan variabel  tersebut dapat digunakan untuk menduga nilai di masa mendatang. Dimana model regresi secara teori dapat dijelaskan  dengan adalah parameter tetap,  diukur tanpa galat, sedangkan  adalah suatu variabel random yang diukur secara menyebar secara normal disekitar nol (nilai tengah ) dan mempunyai suatu ragam , sedangkan model regresi secara praktek dapat dijelaskan , untuk i = 1,2,3,….,N dimana  diasumsikan diukur tanpa galat,  adalah penaksir  dan semuanya adalah variabel acak, dengan sebaran bersama yang normal, sedangkan  (i=1,2,3,…,N) adalah suatu bagian galat taksiran, untuk pengamatan ke-i dan diasumsikan merupakan sampel independen dari suatu sebaran normal.

Pemecahan koefisien sendiri dapat dijelaskan sebgai berikut  baik secara eksplisit maupun implisit prakstisi tersebut memuat berbagai asumsi tentang koefisien, ukuran X (bahwa X diukur tanpa kesalahan) dan  bagian kesalahan, bentuk pragmatisnya adalah :  dan untuk setiap vektor pengamatan, dimana pengamatan ke-i dinotasikan sebagai :  dimana  = , sehingga , sehingga didapatkan  dan metode Ordinary Least Square (OLS) atau jumlah kuadrat kecil minimum dari kesalahan tersebut yaitu meminimumkan , dimana .

Pada pemilihan model yang terbaik akan dilakukan dengan 3 metode, yaitu Metode Quadratic Mode Estimator (QME), Metode Symmetrically Trimmed Least Squares (STLS) dan Metode Left Truncated (LT).  data yang digunakan adalah data polusi udara yang disebabkan oleh 7 variabel bebas yang meliputi jumlah kendaraan yang melewati, suhu udara, kecepatan angin, perbedaan temperatur, angin, jam aktif dan hari aktif, kemudian dengan bantuan software program R akan disajikan simulasi pengolahan data menjadi model yang terbaik dengan penggunaan package library(boot), library(misctools), library(maxlik), library(truncreg), library(truncSP). Hasil simulasi model terbaik ditunjukkan dengan RMSE terkecil.

Related Post