Abstract

Universitas Muhammadiyah Sidoarjo

http://ojs.umsida.ac.id/index.php/rechtsidee/about/submissions#authorGuidelines

UMSIDA Article Template 2 (Indonesian)

10.21070/jicte.v3i2.187

Research Paper

Sentiment Analysis on User Reviews Emina Cheeklit Blusher Pressed Using the Naive Bayes Method

Analisis Sentimen Pada Review Pengguna Emina Cheeklit Pressed Blush Dengan Menggunakan Metode Naive Bayes

Analisis Sentimen Pada Review Pengguna

Haliza

Silvyana Nur

1 Nuraini

Jamila Husna

milanuraini@student.telkomuniversity.ac.id 1 Andini

Rifqoh

1 Faradasya

Cantika Indah

1 Prasasti

Qory Andani

1 Telkom University, Manajemen Bisnis Telekomunikasi & Informatika, Fakultas Ekonomi dan Bisnis

3 10

2019

Abstract

Sociolla is a platform that is used to channel opinions and discuss various issues related to beauty. One of them is discussing beauty products. One of the products discussed is Emina Cheeklit Pressed Blush. Sentiment analysis is a way of comparing the opinions of many people. This study aims to determine the sentiment that occurs in every comment about Emina's Cheeklit Pressed Blush on the Sociolla platform. The sentiments used will be divided into 2 classes, positive and negative and using the Naïve Bayes Classifier as the algorithm. The results obtained an accuracy of 77.69%.

Abstract

Sociolla merupakan salah satu platform yang digunakan untuk menyalurkan opini dan membahas berbagai masalah yang berkaitan dengan kecantikan. Salah satunya adalah membahas mengenai produk kecantikan. Salah satu produk yang dibahas adalah Emina Cheeklit Pressed Blush. Analisis sentimen merupakan suatu cara untuk membandingkan pendapat banyak orang. Penelitian ini bertujuan untuk menentukan sentimen yang terjadi pada setiap komentar mengenai Emina Cheeklit Pressed Blush pada platform Sociolla. Sentimen yang digunakan akan dibagi menjadi 2 kelas, yaitu positif dan negatif serta menggunakan Naïve Bayes Classifier sebagai algoritmanya. Hasil penelitian diperoleh akurasi 77,69%.

Keywords Sentiment Analysis Naïve Bayes Classifier Keywords Analisis Sentimen Naïve Bayes Classifier Pendahuluan

Industri kecantikan berkembang begitu pesat dalam beberapa tahun ke belakang. Hal tersebut dapat dilihat dari berbagai macam tren kecantikan yang turut memengaruhi pola konsumen di Indonesia. Berdasarkan survei dari ZAP Beauty Index 2018 terhadap 17.889 perempuan di Indonesia secara online menemukan beberapa fakta soal industri kecantikan, yaitu diantaranya perempuan di Indonesia sudah mulai mengenal make up ketika usia mereka kurang dari 18 tahun (13-15 tahun) atau sekitar 41,9 persen dari hasil survei yang telah dilakukan. Dari hal tersebut dapat dilihat bahwa industri kecantikan mulai dikenal oleh anak-anak usia muda atau remaja, terutama pada Generasi Y dan Z [1]. Berdasarkan survey yang sudah dilakukan, terdapat top 5 most talked about brands on twitter. Didapatkan lima nama brand yang paling sering dibicarakan netizen dapat dilihat padaFigure 1

Figure 1 <italic id="e-ddcb61e72d15">Top 5 most talked about brands on twitter</italic>

Salah satu brand produk kecantikan dari Indonesia yang memiliki target pasar perempuan berusia remaja adalah Emina. Meski Emina masih tergolong produk baru dalam industri kosmetik lokal, tetapi emina sudah berhasil menduduki peringkat 5 besar. Hal tersebut menunjukkan bahwa para remaja memiliki ketertarikan pada produk Emina. Dari berbagai produk yang dimiliki oleh Emina, produk Emina Cheeklit Pressed Blush merupakan salah satu produk blush on yang paling digemari terutama oleh kaum remaja perempuan, dilihat berdasarkan review dari yang sudah pernah menjadi konsumen Emina Cheeklit Pressed Blush. Hal ini dapat dimanfaatkan untuk mengumpulkan informasi dan data dalam melakukan analisis sentimen. Data yang akan dikumpulkan pada penelitian ini merupakan review dari pengguna Emina Cheeklit Pressed Blush yang diambil dari web sociolla.com dengan menggunakan tools parsehub dan diolah menggunakan metode Naive Bayes Classifier.

Metode Penelitian Kerangka Pemikiran

Pada penelitian ini akan diberikan gambaran langkah-langkah dalam mendeteksi kelas sentimen menggunakan metode Naïve Bayes. Berikut gambaran dari proses mendeteksi kelas sentimen dengan metode Naïve Bayes yang akan digunakan dapat dilihat pada Figure 2

Figure 2 Flowchart Kerangka Pemikiran

Pada Figure 2 dapat dilihat bahwa Crawling data dari Sociolla review Emina Cheeklit Pressed Blush dengan menggunakan tools parsehub. Setelah mendapatkan hasil crawling data, dilakukan pre-processing secara manual untuk membersihkan data mentah menjadi data yang terstruktur. Lalu menentukan data training dan data testing yang sudah di pre-processing secara manual. Pada data training dilakukan klasifikasi data untuk menentukan sentimen1 . Langkah selanjutnya dilakukan pengujian Naïve Bayes Classifier terhadap data training yang sudah diklasifikasi dan data testing2 3 . Setelah mendapatkan hasil dari pengujian, hasil dari pengujian Naïve Bayes Classifier di Analisa4 .

Crawling Data

Crawling Data adalah suatu metode untuk mengumpulkan atau mengambil data dari suatu blog, sosial media atau situs lainnya5 . Dalam hal ini Sociolla menjadi website untuk pengambilan dataset. Crawling dilakukan dengan menggunakan tools parsehub terkait tentang review tingkat kepuasan konsumen terhadap produk Emina Cheeklit Pressed blush. Review yang diambil menggunakan Bahasa Indonesia, total data yang akan diambil sebanyak 1000 review. Contoh review hasil crawling ditampilkan pada Table 1 yang diambil secara acak dari data asli.

Table 1 Sample Data

No	Review
1.	Aku beli blush emina ini yg shade cotton candy. Bagus banget warna nya, pink2 natural gtu. Pigmentasi nya jg bagus banget, apalagi harganya jg terjangkau bgt. ❤❤❤
2.	Buat hari2 ok seh..imut n gampang dibawa2. Tp klo tuk acara2 pesta atau special kyaknya kurang mantul deh..heheh. Baru punya 1 shade. Mgkn lain x bisa beli shade yg lain. ☺☺❤
3.	Bentuknya kecil jadi ga banyak makan tempat, warnanya cantik gampang di aplikasikan jg aku pake yg marshmallow lady cocok buat yg punya kulit kuning langsat, ketahanannya jg oke recommend lah. 攼㹤愼❤

Preprocessing Data

Sebelum dilakukan pengolahan, data yang disimpan perlu di processing terlebih dahulu untuk “dibersihkan”6 . Pre-processing adalah tahapan dimana data atau informasi diatur dari data tekstual semi terstruktur dan tidak terstruktur menjadi sebuah format yang lebih terstruktur yang nantinya akan mempermudah pemakai. Kemudian data tersebut akan terbagi menjadi dua yaitu data training dan data testing7 .

Table 2 Preprocessing Data

No	Review
1.	Aku beli blush emina ini yg shade cotton candy. Bagus banget warna nya, pink2 natural gtu. Pigmentasi nya jg bagus banget, apalagi harganya jg terjangkau bgt.
2.	Buat hari2 ok seh..imut n gampang dibawa2. Tp klo tuk acara2 pesta atau special kyaknya kurang mantul deh..heheh. Baru punya 1 shade. Mgkn lain x bisa beli shade yg lain.
3.	Bentuknya kecil jadi ga banyak makan tempat, warnanya cantik gampang di aplikasikan jg aku pake yg marshmallow lady cocok buat yg punya kulit kuning langsat, ketahanannya jg oke recommend lah.

Berikut ini merupakan tahapan yang dilakukan pada preprocessing tweet pada Table 2 :

Tokenizing merupakan proses untuk memisahkan kalimat pada data menjadi beberapa kata.

Cleansing adalah proses pembersihan data teks yaitu dengan menghilangkan data yang tidak konsisten atau tidak relevan seperti emoticon, hashtag (#), username, url.

Normalization digunakan untuk menormalisasikan kalimat gaul menjadi kalimat yang sesuai dengan KBBI.

Case folding yaitu merubah bentuk kata yang memiliki imbuhan menjadi bentuk dasarnya.

<italic id="e-6e41a08c1832">Labelling</italic>

Pada proses labelling data yang sudah dilakukan proses preprosessing diberikan label secara manual8 . Label ini digunakan sebagai klasifikasi kelas pada setiap data. Kelas yang digunakan yaitu kelas positif dan kelas negatif. Table 3 dan Table 4 menunjukkan contoh data yang diambil secara acak pada data Emina Cheeklit Pressed blush sebelum dan sesudah diberikan label.

Table 3 Contoh Sample Data sebelum diberikan label

No	Review
1.	Aku beli blush emina ini yg shade cotton candy. Bagus banget warna nya, pink2 natural gtu. Pigmentasi nya jg bagus banget, apalagi harganya jg terjangkau bgt.
2.	Buat hari2 ok seh..imut n gampang dibawa2. Tp klo tuk acara2 pesta atau special kyaknya kurang mantul deh..heheh. Baru punya 1 shade. Mgkn lain x bisa beli shade yg lain.
3.	Bentuknya kecil jadi ga banyak makan tempat, warnanya cantik gampang di aplikasikan jg aku pake yg marshmallow lady cocok buat yg punya kulit kuning langsat, ketahanannya jg oke recommend lah.

Table 4 Contoh Sample Datasesudah diberikan label

No	Review	Sentimen
1.	Aku beli blush emina ini yg shade cotton candy. Bagus banget warna nya, pink2 natural gtu. Pigmentasi nya jg bagus banget, apalagi harganya jg terjangkau bgt.	Positif
2.	Buat hari2 ok seh..imut n gampang dibawa2. Tp klo tuk acara2 pesta atau special kyaknya kurang mantul deh..heheh. Baru punya 1 shade. Mgkn lain x bisa beli shade yg lain.	Positif
3.	Bentuknya kecil jadi ga banyak makan tempat, warnanya cantik gampang di aplikasikan jg aku pake yg marshmallow lady cocok buat yg punya kulit kuning langsat, ketahanannya jg oke recommend lah.	Positif

Hasil dan Pembahasan

Dari pengujian yang sudah dilakukan dalam mencari probabilitas, confusion matrix, akurasi, precission, recall, dan f-measure didapatkan nilai seperti berikut:

Hasil Pengujian Probabilitas

Table 5 Probabilits Data Training

Kelas	Banyak Data	Probabilitas Kelas
Positif	588	0,841
Negatif	111	0,158
Jumlah	699

Table 6 Probabilits Data Testing

Kelas	Banyak Data	Probabilitas Kelas
Positif	154	0,527
Negatif	138	0,472
Jumlah	292

Dari Table 5 dan Table 6 diatas, dapat disimpulkan bahwa Review Emina Cheeklit Pressed Blush pada data training mempunyai probabilitas positif sebesar 0,841 dan negatif sebesar 0,158, sedangkan pada data testing mempunyai probabilitas positif sebesar 0,527 dan negatif sebesar 0,472.

Hasil Pengujian Performansi

Table 7 Performansi Data Training

	True Positif	True Negatif
Pred. Positif	525	93
Pred. Negatif	63	18

Dari Table 7 dapat dihitung nilai akurasi, recall, precission dan f-measure berdasarkan sentimen positif dan hasilnya seperti terlihat pada Table 8 :

Table 8 Nilai Akurasi, Recall, Precision, F-Measure

	Emina Cheeklit Pressed Blush
Akurasi	77,69%
Recall	89,28%
Precision	84,95%
F-Measure	87,06%

Dari Table 7 , merupakan nilai akurasi, recall, precision, f-measure berdasarkan sentiment positifnya.

Dari Table 8 dapat disimpulkan bahwa Review Emina Cheeklit Pressed Blush pada data training mempunyai probabilitas positif sebesar 0,841 dan negatif sebesar 0,158, sedangkan pada data testing mempunyai probabilitas positif sebesar 0,527 dan negatif sebesar 0,472. Dari table diatas, merupakan nilai akurasi, recall, precision, f-measure berdasarkan sentiment positifnya.

Figure 3 Presentasi Proporsi Data Emina Cheeklit Pressed Blush Figure 4 Hasil Pengolahan WordCloud

Dapat dilihat pada Figure 3 , presentase sentimen positif sebesar 74%, dan sentimen negatif sebesar 26%. Hal tersebut dapat menjelaskan bahwa Emina Cheeklit Pressed Blush merupakan produk yang mendapatkan respon positif dari customer, hal ini didukung oleh berbagai faktor yaitu seperti warna blush yang bervariasi, pigmentasi produk sangat bagus, cocok digunakan untuk kulit perempuan Indonesia, hingga harganya yang dapat dikategorikan murah. Selain itu, kekurangan dari produk Emina Cheeklit Pressed Blush menurut Figure 4 yaitu pada packaging yang ringkih dan mudah pecah.

Kesimpulan

Dari analisis percobaan yang dilakukan terkait sentimen terhadap Emina Cheeklit Pressed Blush dari Sociolla dengan metode Naive Bayes. Maka dapat disimpulkan bahwa pada penelitian ini didapatkan akurasi sebesar 77,69% yang diperoleh dari pengujian data dengan menggunakan algoritma Naïve Bayes dengan tools RapidMiner. proses klasifikasi akan semakin akurat jika data training yang digunakan semakin banyak. proses pelabelan data menjadi dasar untuk membangun model yang lebih baik. Emina Cheeklit Pressed merupakan produk yang mendapatkan respon positif dari customer, hal ini didukung oleh berbagai faktor yaitu seperti warna blush yang bervariasi, pigmentasi produk sangat bagus, cocok digunakan untuk kulit perempuan Indonesia, hingga harganya yang dapat dikategorikan murah. Selain itu, kekurangan dari produk Emina Cheeklit Pressed Blush menurut data diatas yaitu pada packaging yang ringkih dan mudah pecah. Dari hasil pengolahan data tersebut, perusahaan juga dapat memperbaiki serta meningkatkan kualitas packaging pada produk Emina Cheeklit Pressed Blush agar lebih kuat, tidak ringkih serta tidak mudah pecah.

References

Pang

Lee

Lillian

B. Pang and L. Lee

Opinion Mining and Sentiment Analysis

Foundations and Trends® in Information Retrieval 2008 2 1–2 1 135 1554-0669, 1554-0677

10.1561/1500000011

Now Publishers

https://dx.doi.org/10.1561/1500000011

Prasetyo

Data Mining: Konsep dan Aplikasi Mengginakan Matlab. Yogyakarta: Penerbit Andi 2012

Pratiwi

Nugroho

Y S

Prediksi Rating Film Menggunakan Metode Naïve Bayes

Jurnal Teknik Elektro 2016 8 2 60 63

Nugroho

Y S

Setyawan

Klasifikasi Masa Studi Mahasiswa Fakultas Komunikasi Dan Informatika Universitas Muhammadiyah Surakarta Menggunakan Algoritma C4.5. KomuniTi 2014 VI

84 91

Saleh

Implementasi Metode Klasifikasi Naïve Bayes Dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga

Citec Journal 2015 2 3 207 217

Widiastuti

N A

Santosa

Supriyanto

AlgoritmaKlasifikasi Data Mining Naïve Bayes Berbasis Particle Swarm Particle Swarm Optimization Untuk Deteksi Penyakit Jantung

Jurnal Pseudocode 2014 1 11 14

Indraswari

Naisha Rahma

Kurniawan

Yogiek Indra

APLIKASI PREDIKSI USIA KELAHIRAN DENGAN METODE NAIVE BAYES

Simetris: Jurnal Teknik Mesin, Elektro dan Ilmu Komputer 2018 9 1 129 138 2252-4983, 2549-3108

10.24176/simet.v9i1.1827

Universitas Muria Kudus

https://dx.doi.org/10.24176/simet.v9i1.1827

Marlina

Aplikasi sistem pakar diagnosis penyakit ISPA Berbasis Speech Recognition Menggunakan Metode Naive Bayes Classifier

Jurnal Teknologi Informasi & Komunikasi Digital Zone 2017 8 58 70