Abstract

Universitas Muhammadiyah Sidoarjo

http://ojs.umsida.ac.id/index.php/rechtsidee/about/submissions#authorGuidelines

UMSIDA Article Template 2 (Indonesian)

10.21070/jicte.v4i1.916

Research Paper

Implementation of Naïve Bayes Algorithm on Prediction of Acceptance of Keluarga Harapan Program (PKH)

Penerapan Algoritma Naïve Bayes dalam Prediksi Penerimaan Bantuan Program Keluarga Harapan (PKH)

Penerapan Algoritma Naïve Bayes

Sriwibowo

Allan Wahyu Sekti

allanwahyu1@gmail.com 1 Alwi

Aslan

1 Sugianti

Sugianti

1 Universitas Muhammadiyah Ponorogo, Teknik Informatika, Fakultas Teknik

4 1

2020

Abstract

PKH is one of the programs for providing conditional social assistance to Poor Families which are designated as recipient families, PKH benefits with the aim of relieving the economy of those who are less fortunate. However, in its implementation, especially in the community, this program has not run well and optimally due to the unevenness of the PKH program. This is of course very influential on the welfare of the community where the programs that should be received by the poor have not been well realized. The concept of data mining can be used to provide solutions to problems at hand, the Naïve Bayes Method is a method which can predict an opportunity from previous experience. The variables used include; Disability, children under five, school children and the elderly, where this variable is a requirement of a family as PKH recipients with additional criteria classified as a poor family with variables of occupation, income and residence status. Then the variable data is processed in the R language to determine the prediction results on the eligibility of PKH recipient families. The results of this study can be used as benchmarks and help in the optimization of the PKH program, from the experiments conducted, the results obtained were two households with id Test24 and Test44 which had the status of a recipient that was predicted to be non-recipient, with an Accuracy of 96%, 100% Sensitivity, and Specivicity 92%.

Abstrak

PKH merupakan salah satu program pemberian bantuan sosial bersyarat kepada Keluarga Miskin (KM) yang ditetapkan sebagai keluarga penerima, manfaat PKH dengan tujuan untuk meringankan perekonomian mereka yang kurang mampu. Akan tetapi dalam implementasinya khususnya di masyarakat program ini belum berjalan dengan baik dan optimal dikarenakan belum meratanya program PKH ini. Hal ini tentunya sangat berpengaruh dengan kesejahteraan masyarakat dimana program yang seharusnya di terima oleh masyarakat miskin belum terealisasikan dengan baik. Konsep data mining dapat digunakan untuk memberikan solusi terhadap masalah yang dihadapi, Metode Naïve Bayes merupakan sebuah metode dimana dapat memprediksi sebuah peluang dari pengalaman sebelumnya. Variable yang digunakan antara lain; Disabilits,Anak Balita, Anak Sekolah dan Lansia, dimana variable tersebut merupakan syarat dari sebuah keluarga sebagai penerima PKH dengan tambahan kriteria tergolong Keluarga Miskin dengan variable Pekerjaan, Penghasilan dan Status Tempat Tinggal. Kemuadian data variable tersebut diolah dengan Bahasa R untuk mengetahui hasil prediksi terhadap kelayakan keluarga penerima PKH. Hasil dari penelitian ini dapat dijadikan tolak ukur dan membantu dalam pengoptimalan Program PKH, dari percobaan yang dilakukan didapatkan hasil dua kk dengan id Test24 dan Test44 yang mempunyai status Penerima yang di prediksi menjadi Bukan Penerima, dengan Accuracy sebanyak 96%, Sensitivity 100%, dan Specivicity 92%.

Keywords PKH Data Mining Naïve Bayes R Language. Keywords PKH Data Mining Naive Bayes Bahasa R Pendahuluan

Kesejahteraan masyarakat merupakan salah satu cita-cita pemerintahan dalam menciptakan masyarakat yang makmur, adil dan beradap bedasarkan cita-cita yang tertulis di UUD 1945. Akan tetapi jumlah penduduk masyarakat Indonesia yang banyak menimbulkan beberapa permasalahan dalam pemerataan kehidupan yang layak, pemerintah terus melakukan pemerataan terhadap bantuan yang diberikan dari perkotaan maupun pedesaan1 .

PKH merupakan salah satu program bantuan pemerintah yang bertujuan untuk mengurangi angka kemiskinan masyarakat Indonesia yang ditujukan untuk Keluarga Penerima Manfaat (KPM). Bantuan program Keluargs Miskin (PKH) merupakan salah satu program bantuan kepada masyarakat kurang mampu adalah bantuan Program Keluarga Harapan yang merupakan salah satu bentuk bantuan yang ditujukan untuk memperkecil angka kemiskinan atau program bantuan bersyarat yang disalurkan untuk keluarga miskin yang diberlakukan sejak tahun 2007 oleh pemerintah Indonesia 2 . Tujuan dari bantuan PKH untuk masyarakat kurang mampu dilihat berdasarkan data pada bulan Maret tahun 2016 angka kemiskinan Indonesia memiliki presentase 10,86% dari jumlah masyarakat Indonesia 28,01 juta jiwa. Pemerintah sendiri telah berupaya untuk menekan angka kemiskinan menurun 7-8% dari data yang diperoleh pada tahun 20193 .

Akan tetapi dalam prosesnya PKH memiliki beberapa kendala dalam pemerataan penyaluran bantuan tersebut, hal ini tentu saja sangat merugikan pemerintah dalam upaya penanggulangan kemiskinan terutama bagi masyarakat kurang mampu isu dibuktikan dengan berita yang dilansir pada situs Detik.com pada januari 2019 tentang masyarakat miskin yang belum masuk data penerima PKH.

Untuk menanggulangi permasalahan tersebut diperlukanya sebuah penelitian untuk mengkaji ulang penyaluran bantuan PKH tersebut, Data mining adalah sebuah ilmu komputer yang menggunakan pembelajaran komputer untuk melakukan analisa dan mendapatkan informasi secara otomatis4 5 , KDD atau biasa disebut dengan Knowledge discovery in databases adalah salah satu penerapan dalam bidang data mining. Data Mining merupakan sebuah proses pengumpulan data yang berukuran besar atau Big Data kemudian mengekstraksi data tersebut menjadi informasi – informasi yang nantinya dapat digunakan untuk sebuah keperluan dengan cara mencari ciri dari suatu data tersebut6 7 .

Metode Klasifikasi adalah sebuah metode yang memanfaatkan sekumpulan data untuk mencari sebuah model atau fungsi yang bertujuan untuk memprediksi sebuah kelas tertentu yang hasilnya belum diketahui dari sebuah objek8 . Naïve Bayes Classifier dikenal sebagai pengklasifikasi bayesian sederhana dan telah menjadi model probabilistik yang penting dan telah berhasil dalam praktiknya, Naïve Bayes memberikan rekomendasi sebaik model faktorisasi matriks, dan prediksi yang dapat dijelaskan9 10 . Algoritma Naïve Bayes menggunakan dua bentuk data dalam memulai prediksinya, dimana terdapat sebuah dataset dan datatest. Dataset adalah dimana sekumpulan data sebagai data latih yang digunakan untuk menentukan peluang yang akan terjadi11 , sedangkan datatest adalah sekumpulan data yang akan di prediksi dengan data latih yang sebelumnya telah dibuat dengan perhitungan probabilitas dan statistic.

Bahasa R merupakan sebuah bahasa pemograman untuk analisis dan statistik yang bersifat Open Source. Bahasa R memiliki kelebihan antara lain memiliki kemampuan membuat grafis yang canggih, Sintaksnya mudah dipelajari dengan banyak fungsi-fungsi statistik yang terpasang12 . Bahasa R memiliki IDE yang sering dikenal sebagai R studio, dimana user lebih mudah dalam melakukan pengoperasian yang dilengkapi dengan packages - packages pendukung dalam proses menyelesaikan permasalahan 13 , 14 .

Dari beberapa permasalahan diatas penulis membuat sebuah penelitian tentang prediksi penerimaan bantuan PKH dengan menggunakan algoritma Naïve Bayes dengan menggunakan bahasa pemograman R.

Metode Penelitian Jenis dan Sumber data

Untuk memperoleh informasi dan data yang digunakan dalam penelitian ini adalah data primer dan data sekunder. Data primer yang digunakan dalam penelitian ini antara lain adalah wawancara dan observasi yang bertujuan untuk menentukan variable pendukung yang digunakan untuk proses prediksi penerima bantuan Program Keluarga Harapan (PKH) pada Desa Selur, Kecamatan Ngrayun, Kabupaten Ponorogo. Data sekunder yang digunakan adalah data penduduk desa berupa data pekerjaan penghasilan dan anggota keluarga dengan jumlah 200 kepala keluarga yang diambil dari data 5 tahun terakhir dan data penerima PKH gelombang 6 pada Desa Selur, Kecamatan Ngrayun, Kabupaten Ponorogo. Data tersebut dibagi menjadi dua jenis data yaitu data Training dan data Test kemudian diolah dan disimpan dalam file berformat .CSV.

Analisis Data

Dalam penelitian ini penulis menganalisis data yang bersangkutan dengan penerimaan bantuan Program Keluarga Harapan (PKH), Data yang didapatkan dari hasil penelitian dipergunakan untuk pembentukan data Training dan data Test, data Training digunakan untuk pemodelan dengan algoritma Naive Bayes. Data yang digunakan untuk di proses pada tahap selanjutnya menggunakan atribut seperti pada Table 1, Table 2

Table 1 Tabel Atribut

Atribut	Keterangan
Pekerjaan	Meliputi data tentang pekerjaan dari penerima dan bukan penerima bantuan program keluarga harapan (PKH).
Penghasilan	Meliputi data tentang bersaran penghasilan dari penerima dan bukan penerima bantuan program keluarga harapan (PKH).
Status tempat Tinggal	Meliputi data status tempat tinggal (Hak Milik, Sewa, atau Bukan Hak Milik) dari penerima dan bukan penerima bantuan program keluarga harapan (PKH).
Anak Balita	Kepemilikan keluarga akan anak balita
Disabilitas	Kepemilikan anggota keluarga cacat/disabilitas.
Anak Sekolah	Kepemilikan anak sekolah jenjang SD, SMP, SMA
Lansia	Kepemilikan anggota keluarga lansia
Status	Meliputi status awal penerima dan bukan penerima bantuan PKH sebelum dilakukan prediksi.

Table 2 Predikat Penghasilan

Nominal	Predikat
0 – 1.500.000 Per Bulan	Rendah
1.500.000 – 2.500.000 Per Bulan	Cukup
2.500.000 - 3.500.000 +	Tinggi

Predikat penghasilan diatas berdasarkan penggolongan pendapatan menurut Badan Pusat Statistik (BPS).

Hasil dan Pembahasan Pengumpulan Data

Pada tahap pengumpulan data dilaksanakan pada minggu ke-2 bulan juni 2020, dengan didampingi sekertaris desa pengambilan data didapatkan dari data Desa Selur, Kecamatan Ngrayun, Kabupaten Ponorogo yang merupakan data real. Dengan data yang didapatkan berupa data keluarga dan data penerima bantuan PKH.

Untuk langkah lebih lanjut penulis menggunakan aplikasi Microsoft Excel sebagai aplikasi pengolah data, dan mengeleminasi data-data yang tidak diperlukan dalam penelitian. Hasil akhir yang didapatkan dari penelitian adalah algoritma Naïve Bayes memberikan akurasi sebanyak 96% dalam menyelesaikan permasalahan, kemudian memberika prediksi terhadap data Test yang diuji.

Pembahasan Data Selection

Data yang digunakan dalam kasus ini adalah data masyarakat di Desa Selur. Penyeleksian data dilakukan untuk mempermudah dalam proses data mining. Untuk atribut yang digunakan adalah Pekerjaan, Penghasilan, Status Tempat Tinggal, Disabilits, Anak Balita, Anak Sekolah dan Lansia

Preprocessing

Pada tahapan preprocessing data dikelompokan bedasarkan status dari data tersebut penerima atau bukan penerima. Dengan pengelompokan data ini dimaksudkan untuk mempermudah dalam pembuatan data training dan data test untuk perhitungan selanjutnya.

Transformasi

Dalam tahap transformation data dari tahapan preprocessing dapat digunakan untuk penyusunan sebuah data training. Data training merupakan data yang nantinya digunakan dalam pembuatan model perhitungan dalam prediksi menggunakan algoritma naïve bayes. Data training seperti padaTable 3 didapatkan dari penggabungan data penerima bantuan dan bukan penerima bantuan, dimana dari data tersebut berisikan atribut-atribut yang relevan dan mendukung dalam menentukan hasil prediksi nantinya. Dalam kasus ini penulis memperoleh 200 jumlah data yang nantinya akan dibagi menjadi 150 data training dan 50 data test.

Table 3 Data Training

KK	PEKERJAAN	PENGHASILAN	S T T	BAL ITA	DISABILITAS	SEKOLAH	LANSIA	STATUS
1	PNS	Tinggi	Hak Milik	Ada	Tidak	Ada	Tidak	Bukan Penerima
2	PNS	Tinggi	Hak Milik	Tidak	Tidak	Ada	Tidak	Bukan Penerima
3	PETANI/ PEKEBUN	Rendah	Hak Milik	Tidak	Tidak	Tidak	Tidak	Bukan Penerima
4	WIRASWASTA	Cukup	Hak Milik	Tidak	Tidak	Ada	Tidak	Penerima
5	PETANI/ PEKEBUN	Rendah	Hak Milik	Tidak	Tidak	Ada	Tidak	Penerima
6	WIRASWASTA	Cukup	Hak Milik	Tidak	Tidak	Ada	Tidak	Penerima
7	PETANI/ PEKEBUN	Rendah	Hak Milik	Tidak	Tidak	Tidak	Ada	Penerima
8	PETANI/ PEKEBUN	Rendah	Hak Milik	Tidak	Tidak	Ada	Ada	Penerima
…	…………………….	……….	….	……	…….	……	…….	………..
150	PETANI/ PEKEBUN	Rendah	Hak Milik	Tidak	Tidak	Ada	Tidak	Penerima

Implementasi

Implemantasi antar muka aplikasi menggunakan packages Shiny, Shiny merupakan antar muka atau UI dari bahasa R, shiny merupakan antar muka berbasis web dimana aplikasi ini berjalan dengan pemrograman dan algoritma bahasa R. Untuk tutorial dan pengertian lebih lanjut mengenai packages Shiny bisa di kunjungi di situs resmi Shiny.Rstudio.com.

Packages pendukung untuk pembuatan antar muka dan packages yang digunakan untuk pemodelan naïve bayes adalah sebagai perikut:

1. Shiny

2. Shiny Dashboard

3. e1071

4. Caret

Use Case Diagram Aplikasi

Use Case merupakan suatu penggambaran dari fungsi yang berjalan dalam interface atau antar muka sistem. Use Case yang digunakan dapat dilihat padaFigure 1

Figure 1 UseCase Diagram

Berdasarkan gambar diatas pengguna dapat mengakses enam menu dalam sistem, akses menu home, panduan, input data training dan data test serta melakukan prediksi dan analisis. Pengguna dapat menghapus dan menginputkan data training dan data testing baru.

Tampilan Aplikasi

Pada halaman home seperti pada Figure 2menampilkan informasi tentang antar muka aplikasi, dan algoritma yang digunakan untuk proses analisis dan prediksi data test.

Figure 2 HalamanHome

Menu panduan seperti pada Figure 3 merupakan salah satu langkah awal dalam penggunaan sistem, dimana pada menu ini terdapat beberapa panduan-panduan untuk penggunakan sistem. Panduan berisikan kebutuhan data, jenis data dan tahapan prediksi.

Figure 3 Halaman Panduan

Menu data training seperti padaFigure 4 digunakan untuk memasukan atau input file data latih dalam suatu kasus yang akan di prediksi atau dianalisis file yang di input berjenis .CSV, data training yang digunakan pada kasus ini berjumlah 150 data. Dengan hasil sebagai berikut

Figure 4 Halaman Training

Menu data test seperti pada Figure 5 digunakan untuk memasukan atau input file data test atau data uji dalam suatu kasus, file yang di input berjenis .CSV, data test yang digunakan pada kasus ini berjumlah 50 data. Dengan hasil sebagai berikut:

Figure 5 Halaman Training

Setelah memasukan data training dan data test, selanjutnya adalah proses data mining seperti terlihat pada Figure 6. Dimana dalam tahapan ini peneliti menggunakan algoritma Naïve Bayes untuk melihat output dari dari status penerimaan bantuan PKH, selain itu menampilkan analisis dengan Confusionmatrix

Figure 6 Halaman Hitung

Untuk hasil yang di dapatkan dapat di prediksi dua kk dengan id Test24 dan Test44 yang mempunyai status Penerima yang di prediksi menjadi Bukan Penerima, dengan akurasi sebanyak 96%, Sensitivitas 100%, dan Spesifisitas 92%.

Pengujian Sistem

Tahap pengujian dalam pembentukan suatu sistem merupakan salah satu hal yang wajib untuk dilakukan. Pengujian ini bertujuan untuk memastikan sistem yang dibuat untuk memastikan sistem berjalan sesuai yang diinginkan, dan layak untuk digunakan. Dalam penelitian ini peneliti menggunakan sebuah metode pengujian sistem dengan alur kerja melihat masukan dan keluaran dari sebuah sistem yaitu metode blackbox. Dengan kata lain metode ini tidak melakukan pengujian dengan mempertimbangkan hasil input dan output pada sistem apakah output dari sistem tersebut memberikan hasil yang sesuai.

Dalam melakukan pengujian sistem memerlukan beberapa langkah pengujian, langkah tersebut dilakukan untuk melihat hasil pengujian. Langkah dan hasil pengujian dapat dilihat di Table 4 .

Table 4 Langkah Dan Hasil Pengujian

Request	Langkah	Hasil Yang Diharapkan	Hasil
Tab Menu Home	User masuk pada tab menu home	Tampil halaman home	Sesuai
Tab Menu Panduan	User masuk pada tab menu panduan	Tampilan panduan penggunaan aplikasi	Sesuai
Tab Menu Training	User masuk pada tab menu Training	Tampilan Menu Data Training	Sesuai
Tab Menu Testing	User masuk pada tab menu Test	Tampilan Menu Data Test	Sesuai
Tab Menu Hitung	User masuk pada tab menu Training	Tampilan Menu Data Training	Sesuai
Input Data Training	Menginputkan File (Jika benar .CSV)	Menampilkan output dalam bentuk tabel	Sesuai
Input Data Training	Menginputkan File (Jika Bukan .CSV)	Tidak menampilkan hasil	Sesuai
Input Data Testing	Menginputkan File (Jika benar .CSV)	Menampilkan output dalam bentuk tabel	Sesuai
Input Data Testing	Menginputkan File (Jika Bukan .CSV)	Tidak menampilkan hasil	Sesuai
Hitung Prediksi	Menekan tombol mulai prediksi	Menampilkan hasil prediksi dengan algoritma Naïve Bayes	Sesuai
Hitung Prediksi	Menekan tombol mulai analisis	Menampilkan hasil analisis dengan algoritma Naïve Bayes	Sesuai

Kesimpulan

Dari penelitian yang telah dilakukan, dengan menggunakan pemodelan prediktif dengan algoritma naïve bayes terhadap data penerima dan bukan penerima bantuan PKH yang diolah berdasarkan konsep Data Mining dan perhitungan Naïve Bayes, ditemukan dua data Test dengan kode KK Test 24 dan 44 Dengan Pekerjaan Wiraswasta, Penghasilan Cukup, Tempat Tinggal Hak Milik, Tidak Mempunyai Anak Balita, Tidak Memiliki Anggota Keluarga Disabilitas, Memiliki Anak Sekolah Dan Tidak Memiliki Keluarga Lansia, yang memiliki status Penerima mendapat rekomendasi prediksi sebagai Bukan penerima. Berdasarkan percobaan yang dilakukan akurasi yang didapatkan algoritma Naïve Bayes sebesar 96%, Sensitivitas sebesar 1,000 dan Spesifisitas sebesar 0,9259.

Dari kesimpulan diatas dapat perancangan sistem dapat dikembangkan dimana untuk kedepanya proses data mining dapat menggunakan lebih dari satu algoritma, dengan tujuan untuk memaksimalkan proses prediksi dan analisis dengan menggunakan algoritma yang memiliki akurasi tertinggi.

References Bastian A Bakhtiar N P A Kemensos ; Rancang Bangun Aplikasi Sistem Pendukung Keputusan Penentuan Masyarakat Miskin Menurut Kriteria Studi Kasus: Kelurahan Tonjong). In Prosiding Industrial Research Workshop and National Seminar 2018 9 280 287 Https://Kemsos.Go.Id/ Program Keluarga Harapan PKH Purwanto S A Sumartono S Makmur M Implementasi Kebijakan Program Keluarga Harapan (PKH) Dalam Memutus Rantai Kemiskinan (Kajian di Kecamatan Mojosari Kabupaten Mojokerto). WACANA Jurnal Sosial dan Humaniora 2013 16 2 79 96 Fajar Astuti Hermawati Andi Offset Yogyakarta. 2013 Sari I M Hasibuan N A Silalahi N ; Implementasi Mining Underwear Metode Basket Pada Pt Suriatama Kencana Informasi dan Teknologi Ilmiah (INTI) 2017 5 1 Ridwan M Suyono H Sarosa M Penerapan Data Mining Untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes Classifier jurnal EECCIS 2013 7 1 59 64 Budi Santosa Data Mining, Teknik Pemanfaatan Data Untuk Keperluan Bisnis. Graha Ilmu Yogyakarta 2007 Fadlan Chairul Ningsih Selfia Windarto Agus Perdana PENERAPAN METODE NAÏVE BAYES DALAM KLASIFIKASI KELAYAKAN KELUARGA PENERIMA BERAS RASTRA Jurnal Teknik Informatika Musirawas (JUTIM) 2018 3 1 1 2541-1888, 2614-5782 Universitas Bina Insan 10.32767/jutim.v3i1.286 https://dx.doi.org/10.32767/jutim.v3i1.286 Rahman A A Kurniawan Y I Aplikasi Klasifikasi Penerima Kartu Indonesia Sehat Menggunakan Algoritma Naïve Bayes Classifier Jurnal Teknologi dan Manajemen Informatika 2018 4 1 Nusa D C P B S Optimasi Algoritma Naïve Bayes dengan Menggunakan Algoritma Genetika untuk Prediksi Kesuburan (Fertility). EVOLUSI: Jurnal Sains dan Manajemen 2016 4 Jumeilah Fithri Selva Klasifikasi Opini Masyarakat Terhadap Jasa Ekspedisi JNE dengan Naïve Bayes JURNAL SISTEM INFORMASI BISNIS 2018 8 92 92 2088-3587, 2502-2377 Diponegoro University 10.21456/vol8iss1pp92-98 https://dx.doi.org/10.21456/vol8iss1pp92-98 Bharata H K Sulistyowati H S Analisa Sentimen Reuni 212 Menggunakan Bahasa R Journal Informatics, Science & Technology 2018 8 2 Efvendi H Penerapan Arima Ensemble dalam Peramalan Kebutuhan Makanan Pokok di Kabupaten Jember (Doctoraldissertation UNIVERSITAS MUHAMMADIYAH JEMBER ) 2015 Dr Budiharto S Si M Kom Ro’fah Nur Rachmawati S Si M Si Pengantar Praktis Pemrograman R Untuk Ilmu Komputer 2013 Halaman Moeka Publishing Jakarta Barat