Perbandingan Metode Imputasi Multiple Imputation, Inverse Probability Weighting, dan Complete Case Analysis dalam Menangani Data Missing

Pemerintah saat ini sedang berupaya untuk memaksimalkan Program Satu Data Indonesia (SDI) untuk mengatasi volume data yang terus bertambah dari berbagai riset dan pendataan. Dalam proses menuju SDI, saat ini masih dilakukan survei khususnya dalam bidang kesehatan. Permasalahan yang dihadapi saat ini salah satunya adalah masalah bidang kependudukan. Keberhasilan program keluarga berencana salah satunya ditinjau melalui survei. 

          Peneliti menemukan terdapat berbagai data yang menyajikan cakupan penggunaan kontrasepsi yaitu Survei Sosial Ekonomi Nasional, Profil Kesehatan maupun data dari Dinas Kesehatan. Hasil dari survei yang dilakukan bervariasi. Permasalahan dalam data dapat menyebabkan adanya bias pengambilan kesimpulan termasuk hasil analisis faktor yang mempengaruhi penggunaan kontrasepsi. Perbedaan ini dapat terjadi oleh beberapa hal, termasuk salah satunya yaitu karakteristik data yang diperoleh serta perbedaan metode pengambilan sampel. 

          Salah satu permasalahan pengolahan data dalam survei adalah data missing atau data yang hilang. Masalah ini sering terjadi dalam penelitian survei, terutama survei berskala besar. Upaya untuk mengatasi data missingpun bervariasi, salah satunya dengan metode imputasi. Metode imputasi terbaru yang digunakan yaitu Multiple Imputation (MI) serta ada konsep lain yaitu Inverse Probability Weighting (IPW). Dalam konsep Multiple Imputation, pengulangan imputasi beberapa kali dapat meningkatkan kualitas estimasi. Penelitian lain menyebutkan bahwa penggunaan Inverse Probability Weighting juga bermanfaat dalam menangani data missing. 

          Penelitian terdahulu membandingkan kedua metode tersebut dan didapatkan hasil yang bervariasi untuk imputasi data missing terbaik dan belum membandingkan tingkat efektifitas berdasarkan tingkat kehilangan data (dalam %). Pilihan metode untuk menangani data yang hilang sangat penting untuk validitas kesimpulan, dan harus didasarkan pada pertimbangan yang cermat atas alasan hilangnya data, pola data yang hilang, dan ketersediaan informasi tambahan. Metode yang ada dibandingkan dengan data lengkap dan Complete Case Analysis (CCA). Berdasarkan permasalahan tersebut, penelitian tertarik mengkaji perbandingan teknik imputasi IPW, MI dan CCA (Studi Penggunaan Kontrasepsi Data Survei Sosial Ekonomi Nasional Kota Pasuruan tahun 2020). 

          Peneliti melakukan jenis penelitian non reaktif untuk data sekunder. Peneliti mengkaji dokumen laporan kesehatan sehingga tidak terjadi kontak dengan individu yang diteliti.  Penelitian ini berlokasi di Kota Pasuruan dengan menggunakan Data Survei Sosial Ekonomi Nasional Kota Pasuruan tahun 2020. Perempuan usia 10-54 tahun yang pernah menikah berdomisili di Kota Pasuruan tahun 2020 diwakili sebanyak 473 sampel yang masuk dalam pelaporan blok sensus. Sebanyak 98 responden dikeluarkan dari proses analisis karena berusia di atas 49 tahun dan memiliki kemungkinan mengalami menopause. 

            Peneliti melakukan simulasi data missing pada 375 data responden pada kehilangan data 5%, 10% dan 15%. Variabel yang digunakan yaitu variabel usia, jumlah anak 0-4 tahun, dan umur pertama menikah. Peneliti menggunakan aplikasi R Studio dengan simulasi menghilangkan data diulang sebanyak 3x. Data kemudian dilakukan imputasi dengan MI dan IPW. Hasil imputasi data dilakukan uji beda dengan data lengkap. Data diketahui tidak berdistribusi normal sehingga dilakukan Uji Kruskal Wallis. Penghitungan Mean Squared Error (MSE) antara data hasil imputasi dengan IPW, MI maupun CCA dilakukan untuk melihat metode imputasi terbaik. Data hasil imputasi terbaik dilakukan uji regresi dan dibandingkan dengan hasil regresi data lengkap. 

           Hasil penelitian menunjukkan bahwa tidak ada perbedaan yang signifikan antara data yang dilakukan penanganan data missing dengan Inverse Probability Weighting, Multiple Imputation dengan data lengkap. Hasil imputasi dengan IPW menunjukkan hasil terbaik dalam sebagian besar simulasi baik pada 5 %, 10 %  maupun 15% berdasarkan pengkajian MSE. Terdapat perbedaan pengaruh variabel terkait dengan penggunaan kontrasepsi pada data yang dilakukan imputasi data missing dengan data lengkap. Hasil analisis uji hubungan pada data imputasi missing 5% menunjukkan terdapat hubungan antara usia menikah dengan penggunaan kontrasepsi sedangkan data imputasi missing 10% dan 15% menunjukkan terdapat hubungan antara usia menikah dan umur dengan penggunaan kontrasepsi. Hasil uji regresi menunjukkan perbedaan pada imputasi 15% dibandingkan dengan data lengkap, imputasi 5% dan imputasi 10%. Umur, usia menikah pertama, jumlah anggota rumah tangga 0-4 tahun, tingkat pendidikan, pekerjaan, kepemilikan jaminan kesehatan, waktu melahirkan terakhir dan penggunaan internet berkaitan dengan penggunaan kontrasepsi. 

            Penelitian ini merekomendasikan pengkajian kriteria inklusi dan eksklusi dalam pelaksanaan survei sosial ekonomi nasional khususnya dalam terminologi wanita usia subur dan penjabaran status menopause. IPW dapat digunakan dalam imputasi data missing sehingga dapat disosialisasikan pada pengolahan data di fasilitas kesehatan maupun unit penyelenggara penelitian. Pada saat melakukan imputasi data missing perlu diperhatikan penggunaan kategori selain itu perlu mempertimbangkan keakuratan data dan jumlah persentase data missing karena berpengaruh terhadap keterkaitan antar variabel. Penelitian selanjutnya perlu menganalisis perbandingan penggunaan kategori tertentu yang mengarah pada perubahan hasil uji statistik keterkaitan antar variabel. Penelitian selanjutnya perlu menganalisis lebih lanjut terkait teknik imputasi pada data variabel counting yang memiliki range angka yang kecil dan mengarah pada distribusi poisson.

Penulis : Nur Anisah Rahmawati

Leave a Reply