Syntax Literate: Jurnal Ilmiah Indonesia p–ISSN: 2541-0849 e-ISSN: 2548-1398

Vol. 9, No. 2, Februari 2024

 

 

ANALISIS SENTIMEN TERHADAP TWEET MENGENAI PERISTIWA RUSSIA MELAWAN UKRAINA BERBASIS MACHINE LEARNING

 

Muhammad Husni Mubarok1, Jati Sasongko Wibowo2

Universitas Stikubank Semarang, Jawa Tengah, Indonesia

Email: [email protected]1, [email protected]2

 

Abstrak

Perang yang terjadi di Eropa antara Rusia - Ukraina berdampak langsung maupun tidak langsung diseluruh belahan dunia, termasuk Indonesia. Masyarakat banyak yang memberikan pendapat atas peristiwa tersebut, baik itu berupa pujian atau keluh kesah yang dipublikasikan pada media sosial, salah satunya adalah Twitter. Penelitian ini bertujuan untuk mengolah atau mengekstrak tanggapan masyarakat di media Twitter agar menjadi sebuah informasi dengan menggunakan analisis sentiment. Analisis sentiment dengan algoritma klasifikasi Support Vector Machine (SVM), Multinomial Naive Bayes (MNB), dan K-Nearest Neigbhor (KKN). Berdasarkan analisis sentimen memberikan gambaran bahwa tanggapan masyarakat Indonesia pengguna twitter pada tanggal 24 Februari 2022 tentang peristiwa perang Rusia - Ukraina didominasi dengan tweet bersentimen negatif (50,1%), kemudian netral (30,5%), dan positif (19,3%). Hasil performa tertinggi model machine learning didapat pada model beralgoritma SVM dengan akurasi 90%, diikuti oleh MNB (71%), dan KKN (48%). Masyarkat Indonesia banyak yang mengaitkan peristiwa perang Rusia vs Ukraina dengan peristiwa perang dunia.

Kata kunci : Analisis Sentimen; Twitter; Support Vector Machine; Multinomial Naïve Bayes; K-Nearest Neighbor

 

Abstract

The war that took place in Europe between Russia and Ukraine had a direct or indirect impact on all parts of the world, including Indonesia. Many people gave their opinion on the incident, whether it was in the form of praise or complaints published on social media, one of which was Twitter. This study aims to process or extract public responses on Twitter media to become information using sentiment analysis. Sentiment analysis using the classification algorithm Support Vector Machine (SVM), Multinomial Naive Bayes (MNB), and K-Nearest Neigbhor (KKN). Based on sentiment analysis, it illustrates that the response of the Indonesian public on Twitter users on February 24, 2022 about the events of the Russia-Ukraine war was dominated by tweets with negative sentiments (50.1%), then neutral (30.5%), and positive (19.3%). The highest performance results from the machine learning model were obtained on the SVM algorithm model with an accuracy of 90%, followed by MNB (71%), and KKN (48%). Many Indonesian people associate the events of the Russia vs Ukraine war with the events of the world war.

Keywords: Sentiment Analysis; Twitter; Support Vector Machines; Naïve Bayes Multinomial; K-Nearest Neighbor

 

 

 

Pendahuluan

Pada saat ini, perang yang terjadi di Eropa antara Rusia melawan Ukraina berdampak di berbagai negara dibelahan penjuru dunia, tak terkecuali negara Indonesia (Hutabarat, 2022). Sektor ekonomi merupakan sektor yang sangat berdampak akibat perang yang terjadi antara Rusia melawan Ukraina (Bakrie et al., 2022; Rubel & Hossain, 2022). Dampak yang terjadi ialah mulai dari nilai tukar rupiah yang turun terhadap Dollar AS, kehilangan pendapatan dari ekspor terhadap kedua negara tersebut, kenaikan harga impor bahan pokok hingga naiknya harga minyak dunia (Alfiansyah, 2022). Dari fenomena itu, masyarakat banyak yang memberikan berbagai macam pendapat baik itu pujian atau keluh kesah yang dipublikasikan di berbagai media sosial, salah satunya adalah Twitter (Pamungkas & Kharisudin, 2021). Dari berbagai tanggapan tersebut perlu digolongkan ke dalam bentuk tanggapan positif, netral atau negatif sehingga di dapatkan suatu informasi dari tanggapan-tanggapan tersebut.

Salah satu cara mengolah atau mengekstrak tanggapan agar menjadi sebuah informasi adalah menggunakan analisis sentimen (Vidyadhari, 2022). Analisis sentimen merupakan proses memahami, mengekstrak dan mengolah data tesktual secara otomatis untuk mendapat informasi (Pang & LillianLee, 2008). Dalam menerapkan analisis sentimen diperlukan adanya sebuah klasifikasi. Klasifikasi digunakan untuk mengelompokan tanggapan mana yang memiliki sentimen positif, sentiment netral, dan sentimen negative (Salam et al., 2018). Penelitian mengenai analisis sentimen di Indonesia telah banyak dilakukan dengan berbagai metode. (Setiawan et al., 2021) menyimpulkan bahwa multinomial naive bayes dapat digunakan untuk klasifikasi teks dengan akurasi yaitu sebesar 82%.  Namun dalam penelitian (Shofiya et al., 2020) menyimpulkan bahwa algoritma support vector machine memiliki nilai akurasi sebesar 82% sedangakan multinomial naive bayes memiliki nilai akurasi sebesar 64%. Sedangkan menurut (Rezwanul et al., 2017) dalam pengklasifikasian data tweet menyimpulkan bahwa algoritma K-nearest neighbor memiliki tingkat akurasi tertinggi dibandingkan dengan algoritma support vector machine.

Dalam penerapanya algoritma pada support vector machine memiliki keunggunalan dalam mengklasifikasikan data berbentuk teks, diantara Support Vector Machine, Multinomial Naive Bayes, serta K-Nearest Neigbhor algoritma mana yang paling tepat mengklasifikasikan data tanggapan masyarakat Indonesia pada media sosial twitter (Devi, 2023).

Pada penelitian ini akan melakukan analisis sentimen tanggapan masyarakat terhadap perang antara Rusia melawan Ukraina pada media sosial Twitter dengan algoritma klasifikasi Support Vector Machine, Multinomial Naive Bayes, serta K-Nearest Neigbhor.

 

Metode Penelitian

Pada tahapan yang pertama, penulis melakukan pembelajaran beberapa literatur yang ada (Creswell & Poth, 2016). Kemudian peneliti melakukan pengumpulan data, data yang dikumpulkan merupakan data yang berasal dari twitter yaitu data tweets. Setelah melalui tahapan pengumpulan data, peneliti melanjutkan ke tahap pre-processing data, pemberian bobot, visualisasi data, dan transformasi ke bentuk TF-IDF (Sugiyono, 2019). Setelah itu data yang telah didapatkan akan diolah menggunakan metode klasifikasi Support Vector Machine, K-Nearest Neighbor, dan Multinomial Naïve Bayes.

Pada tahap pengumpulan data peneliti mengumpulkan data berupa tweet dari media sosial yaitu twitter terkait dengan perang yaitu perang antara rusia vs ukraina dengan keyword “Rusia vs Ukraina”, “Russia”, “Rusia”, “Ukraina” ,“Ukraine”, “Putin”, dan “Zelensky”, “Kyiv”. Tweet yang dikumpulkan merupakan tweet berbahasa Indonesia dengan batasan tweet dibuat hanya pada tanggal 24 Februari 2022. Proses pencarian dan pengumpulan data dapat dilakukan dengan menggunakan fitur API twitter (application programming interface).

Setelah menyelesaikan tahap proses pengambilan dan pengumpulan data, peneliti selanjutnya melanjutkan ke tahap pre-processing data. Pada tahap pre-processing data menyiapkan data mentah yang diperoleh kembali dalam format yang sesuai atau data untuk melakukan analisis. Tahapan yang harus dilakukan saat melakukan pre-processing data adalah cleaning text, to lower case text, tokenize text, slang word transform, remove stopword, stemming, dan remove duplicates.

Pada tahap pemberian pembobotan, peneliti menentukan label dari tweet yang lolos pada tahap pre-processing sebelumnya. Peneliti menggunakan metode perhitungan berbasis lexicon untuk melakukan pelabelan yang mencakup negatif, netral, dan positif. Untuk menentukan sentimen positif atau negatif dari sebuah kalimat menggunakan teknik menghitung polarity score berdasarkan nilai-nilai sentimen dari kamus lexicon.

Setelah data sudah diberi pembobotan menggunakan metode lexicon, selanjutnya data akan diubah bentuknya kedalam bentuk TF-IDF untuk keperluan ekstraksi fitur. Setelah itu data akan digunakan untuk proses klasifikasi atau proses training model.. Proses ini dilakukan dengan tiga metode, yaitu Support Vector Machine, K-Nearest Neighbor, dan Multinomial Naïve Bayes. Setelah itu model di uji dengan data test serta menampilkan performance matrix dan confusion matrixnya.

 

Hasil dan Pembahasan

Data yang dicari dan digunakan untuk referensi terkait dengan perang yaitu perang antara rusia vs ukraina dengan kata “Rusia vs Ukraina”, “Russia”, “Rusia”, “Ukraina” ,“Ukraine”, “Putin”, dan “Zelensky”, “Kyiv”, dan hanya pada tweet yang dibuat pada tanggal 24 Februari 2022 saja bertepatan Rusia melakukan invasi terhadap Ukraina. Pengambilan data dilakukan dengan menggunakan fitur API twitter versi 2 yang didapatkan dengan mengajukan status academic research pada twitter. Untuk mengatasi perihal limit dalam pemanggilan API twitter, penelitian ini menggunakan library twarc2 agar dapat memudahkan dalam menyimpan data tweet yang didapat kedalam file CSV. Dengan keyword yang ada didapat data tweet sebanyak 78999 dapat dilihat pada Gambar 1.

 

Gambar 1. Data Mentah Hasi Pencarian dari Twarc2

 

Setelah menyelesaikan tahap proses pengambilan dan pengumpulan data, peneliti selanjutnya melanjutkan ke tahap pre-processing data. Pada tahap pre-processing data menyiapkan data mentah yang diperoleh kembali dalam format yang sesuai atau data untuk melakukan analisis. Dengan beberapa tahapan meliputi cleaning text, to lower case text, tokenize text, slang word transform, remove stopword, stemming, dan remove duplicates. Hasil dari proses dapat dilihat pada Gambar 2 dibawah ini. Dari data awal sebanyak 78999 setelah dilakukan preprocessing, data berkurang menjadi 73628.

 

Gambar 2. Hasil Preprocessing Data Mentah

 

Data hasil preprocessing akan diberi pembobotan yang bertujuan untuk menilai nilai sentiment dan memberi label yang terbagi menjadi positif, negatif, dan netral. Memberi bobot sentiment menggunakan metode perhitungan berbasis lexicon dengan konsep menghitung score per kata berdasarkan kamus lexicon dari InSet. Score pada kamus lexicon InSet memiliki range -5 sampai +5 dan kamus terdiri dari 3.609 kata positif dan 6.609 kata negatif. 

Setiap data tweet akan dihitung total polarity score-nya berdasarkan hasil jumlah nilai setiap kata pada tweet yang ada pada kamus lexicon dari InSet. Di sini S diartikan sebagai polarity score, jadi jika S lebih besar dari 0 maka S positif, jika S lebih kecil dari 0 maka S negatif dan jika S sama dengan 0 maka bersifat netral. Hasil dari proses ini dapat dilihat pada Gambar 3 dibawah ini.

 

Gambar 3. Hasil Pembobotan dan Pelabelan

 

Setelah dilakukan tahap preprocessing dan pelabelan, data mentah yang didapat dari API Twitter dapat dianggap sebagai dataset. Dalam tahap ini dataset akan diekstrak seluruh informasi sehingga dapat diketahui kata yang paling sering dibahas pada ulasan pengguna. Selain itu juga dapat memberikan gambaran tentang dominasi sentimen yang dipaparkan pengguna media sosial twitter terhadap peristiwa Rusia vs Ukraina.

 

Gambar 4. Visualisasi Bar Chart Dataset

 

Pada Gambar 4 dari total data sebanyak 73628 data, dapat terlihat bahwa data tweets yang memiliki sentiment negatif lebih banyak jika dibandingkan dengan data yang memiliki sentimen netral dan positif. Dengan rincian data yang memiliki sentiment negatif berjumlah sebanyak 36904 data tweets, kemudian untuk data yang memiliki sentiment netral berjumlah sebanyak 22492 data tweets, dan yang terakhir adalah data yang memiliki sentimen positif berjumlah sebanyak 14232 data tweets.

Gambar 5.  Visualisasi Pie Chart Dataset

 

Persentase kelas yang terdapat pada dataset dapat dilihat pada Gambar 5, dengan rincian data tweet bersentimen negatif memiliki persentase tertinggi yaitu 50.1%, posisi kedua ada pada data tweet bersentimen netral dengan persentase 30.5%, dan posisi ketiga ada pada data tweet bersentimen positif dengan persentase hanya 19.3%. Dari paparan diatas, menandakan bahwa dataset yang didapat merupakan dataset yang imbalance atau tidak seimbang. Selain itu dapat disimpulkan bahwa tanggapan pengguna media sosial twitter terhadap perang Rusia vs Ukraina didominasi dengan tanggapan bersentimen negatif.

Hasil preprocessing data membuat dataset dapat diexplore lebih dalam, salah satunya terkait dengan kata-kata pembentuk data tweet tersebut. Dengan menghitung frekuensi kata yang muncul, dapat digunakan untuk mendapatkan gambaran tentang apa saja keterkaitan yang dikaitkan dengan peristiwa perang Rusia vs Ukraina berdasarkan tweet pengguna media sosial twitter. Berikut Word Cloud dari kata yang sering muncul dari dataset dapat dilihat pada Gambar 6.

Gambar 6. Word Cloud Keseluruhan Dataset

 

Berdasarkan Gambar 6, tweet dari pengguna media sosial twitter terhadap peristiwa perang Rusia vs Ukraina dikaitkan dengan beberapa kata atau term. Kata atau term yang dikaitkan antara lain ‘perang dunia’, ‘world war’, ‘us’, ‘nato’, ‘belarus’, ‘china’, ‘uni soviet’, danindonesia’. Tidak secara langsung pengguna twitter mengkaitkan peristiwa perang Rusia vs Ukraina dengan peristiwa perang dunia. Selain itu terdapat pihak-pihak yang menurut tweet yang didapat, dikaitkan dengan peristiwa ini yaitu antara lain Rusia, Ukraina, NATO, Amerika, ,Uni Soviet, Belarus, China, dan Indonesia.

Word cloud juga dapat divisualisasikan secara terpisah berdasarkan data tweet bersentmen positif dan negatif. Dengan memisahkan data tweet berdasarkan sentimennya, dapat memberikan gambaran tentang apa saja yang sering muncul dari tweet pengguna media sosial twitter bersentimen positif maupun negative. Berikut word cloud sentimen positif dan negatif dari dataset dapat dilihap pada Gambar 7 dibawah ini.

 

Gambar 7. Word Cloud Dataset Bersentimen Positif dan Negatif

 

Proses selanjutnya adalah proses transformasi TF-IDF, proses ini dilakukan dengan beberapa proses. Tujuan proses ini adalah mengubah format dataset yang dapat dipelajari oleh algoritma machine learning. Konsep TF-IDF secara garis besar mengukur pentingnya atau relevansi representasi dari sebuah kata atau terms dalam dokumen atau kumpulan dokumen yang biasa dikenal sebagai corpus, dalam kasus ini corpus adalah representasi dari tweet. Sebelum ke proses transformasi TF-IDF, dataset dipecah terlebih dahulu menjadi data train dan data test. Data train berguna sebagai data untuk melatih model, sedangkan data test berguna sebagai data untuk menguji atau mengevaluasi model. Pembagian data train dan data test adalah 70:30, dimana data train berisi 70% (49330 data) dan data test berisi 30% (24298 data) dari total data di dataset. Pembagian data menggunakan fungsi train_test_split dari library sklearn agar pembagian data akan merata berdasarkan labelnya.

Untuk transformasi bentuk dataset menjadi bentuk TF-IDF, menggunakan fungsi TfidfVectorizer dari library sklearn bagian feature extraction. Dengan parameter max_feature bernilai 5000, yang berarti dimensi data yang dibuat adalah matrix berukuran n x 5000, dimana n adalah total corpus atau tweet. Pada fungsi TfidfVectorizer, max_feature merupakan limitasi total kata atau term dari frekuensi terbanyak, jika max_feature bernilai 5000 maka TF-IDF hanya memilih 5000 kata yang sering muncul pada keseluruhan corpus atau tweet sebagai fitur. Jadi setelah proses ekstraksi fitur TF-IDF, dimensi data train akan menjadi 49330 x 5000 dan dimensi data test akan menjadi 24298 x 5000. Hasil ekstraksi fitur menggunakan TF-IDF terhadap data train dapat dilihat pada Gambar 8.

 

Gambar 8.  Hasil Transformasi TF-IDF pada Data Train

 

Klasifikasi pada penelitian ini melakukan training pada model dengan data train yang berjumah 49330 data. Terdapat tiga metode yang digunakan pada  penelitian ini antara lain Support Vector Machine (SVM), K-Nearest Neighbor (KNN), dan Multinomial Naïve Bayes (MNB). Model akan ditrain dengan parameter default dari library yang digunakan yaitu sklearn. Setelah itu Model akan diuji menggunakan data test berjumlah 24298 data yang bertujuan untuk menebak label dari data test tersebut. Untuk menghitung performa, label data test akan kalkulasi dengan label hasil prediksi sehingga bisa mendapatkan metrik performa seperti recall, precision, f1-score dan accuracy.

Proses melatih model SVM dengan parameter default menggunakan data train sebanyak 49330 data memerlukan waktu 314 detik. Setelah model dilatih, model akan diuji untuk dapat memprediksi data, pada model SVM waktu uuntuk melakukan prediksi terhadap data test sebanyak 24298 data adalah 53 detik dapat dilihat pada Gambar 9.

Gambar 9. Metrik Performa Model SVM

 

Pada Gambar 9 memperlihatkan tentang hasil metrik performa yang diperoleh oleh model SVM dari pengujian dengan data test. Model SVM dapat memprediksi label dari ketiga kelas dengan akurasi 90%, bermakna 10% dari total 24298 data test telah terprediksi dengan label yang salah dan sisanya benar. Dengan detail untuk metrik performa f1-score yang dihasilkan dari perhitungan harmonic mean dari precision yang dan recall, dari label negatif bernilai 92%, netral 89%, dan positif 85%. Prediksi label negatif memiliki f-1 score tertinggi yaitu 92%, dan prediksi label positif memiliki f-1 score terendah yaitu 85%. Menandakan model SVM sangat bagus dalam memprediksi tweet bersentimen negatif dibanding tweet bersentimen positif maupun netral. Untuk detail hasil prediksi dari data test dapat dilihat dengan confusion matrix yang terdapat pada Gambar 10 dibawah ini.

Gambar 10. Confusion Matrix Model SVM

 

Pada Gambar 10 memperlihatkan detail nilai hasil prediksi yang terbukti benar dan yang salah dari model SVM. Dari 12120 data test berlabel negatif, model dapat memprediksi dengan benar sebanyak 11270 data, terprediksi salah sebagai label netral sebanyak 555 data, dan terprediksi salah sebagai label positif sebanyak 295 data. Dari 7510 data test berlabel netral, model dapat memprediksi dengan benar sebanyak 6749  data, terprediksi salah sebagai label negatif sebanyak 541 data, dan terprediksi salah sebagai label positif sebanyak 220 data. Dari 4668 data test berlabel positif, model dapat memprediksi dengan benar sebanyak 3803  data, terprediksi salah sebagai label negatif sebanyak 467 data, dan terprediksi salah sebagai label netral sebanyak 398 data.

Proses melatih model KNN dengan parameter default menggunakan data train sebanyak 49330 data memerlukan waktu 0.06 detik. Setelah model dilatih, model akan diuji untuk dapat memprediksi data, pada model KNN waktu uuntuk melakukan prediksi terhadap data test sebanyak 24298 data adalah 32 detik dapat dilihat pada Gambar 11.

 

Gambar 11. Metrik Performa Model KNN

 

Pada Gambar 11 memperlihatkan tentang hasil metrik performa yang diperoleh oleh model KNN dari pengujian dengan data test. Model KNN dapat memprediksi label dari ketiga kelas dengan akurasi 48%, bermakna 52% dari total 24298 data test telah terprediksi dengan label yang salah dan sisanya benar. Dengan detail untuk metrik performa f1-score yang dihasilkan dari perhitungan harmonic mean dari precision yang dan recall, dari label negatif bernilai 44%, netral 53%, dan positif 33%. Prediksi label netral memiliki f-1 score tertinggi yaitu 53%, dan prediksi label positif memiliki f-1 score terendah yaitu 33%. Menandakan model KNN sangat bagus dalam memprediksi tweet bersentimen netral dibanding tweet bersentimen positif maupun negatif. Untuk detail hasil prediksi dari data test dapat dilihat dengan confusion matrix yang terdapat pada Gambar 12 dibawah ini.

Gambar 12. Confusion Matrix Model KNN

 

Pada Gambar 12 memperlihatkan detail nilai hasil prediksi yang terbukti benar dan yang salah dari model KNN. Dari 12120 data test berlabel negatif, model dapat memprediksi dengan benar hanya sebanyak 3712 data, terprediksi salah sebagai label netral sebanyak 8190 data, dan terprediksi salah sebagai label positif sebanyak 218 data. Dari 7510 data test berlabel netral, model dapat memprediksi dengan benar sebanyak 6919  data, terprediksi salah sebagai label negatif sebanyak 498 data, dan terprediksi salah sebagai label positif sebanyak 93 data. Dari 4668 data test berlabel positif, model dapat memprediksi dengan benar hanya sebanyak 966  data, terprediksi salah sebagai label negatif sebanyak 371 data, dan terprediksi salah sebagai label netral sebanyak 3311 data.

Proses melatih model MNB dengan parameter default menggunakan data train sebanyak 49330 data memerlukan waktu 0.16 detik. Setelah model dilatih, model akan diuji untuk dapat memprediksi data, pada model MNB waktu uuntuk melakukan prediksi terhadap data test sebanyak 24298 data adalah 0.0004 detik dapat dilihat pada Gambar 13.

Gambar 13. Metrik Performa Model MNB

 

Pada Gambar 13 memperlihatkan tentang hasil metrik performa yang diperoleh oleh model MNB dari pengujian dengan data test. Model MNB dapat memprediksi label dari ketiga kelas dengan akurasi 71%, bermakna 29% dari total 24298 data test telah terprediksi dengan label yang salah dan sisanya benar. Dengan detail untuk metrik performa f1-score yang dihasilkan dari perhitungan harmonic mean dari precision yang dan recall, dari label negatif bernilai 78%, netral 69%, dan positif 39%. Prediksi label negatif memiliki f-1 score tertinggi yaitu 78%, dan prediksi label positif memiliki f-1 score terendah yaitu 33%. Menandakan model MNB sangat bagus dalam memprediksi tweet bersentimen negatif dibanding tweet bersentimen positif maupun netral. Untuk detail hasil prediksi dari data test dapat dilihat dengan confusion matrix yang terdapat pada Gambar 14 dibawah ini.

Gambar 14. Confusion Matrix Model MNB

 

Pada Gambar 14 memperlihatkan detail nilai hasil prediksi yang terbukti benar dan yang salah dari model MNB. Dari 12120 data test berlabel negatif, model dapat memprediksi dengan benar sebanyak 11311 data, terprediksi salah sebagai label netral sebanyak 746 data, dan terprediksi salah sebagai label positif sebanyak 63 data. Dari 7510 data test berlabel netral, model dapat memprediksi dengan benar sebanyak 4726  data, terprediksi salah sebagai label negatif sebanyak 2700 data, dan terprediksi salah sebagai label positif sebanyak 84 data. Dari 4668 data test berlabel positif, model dapat memprediksi dengan benar sebanyak 1122  data, terprediksi salah sebagai label negatif sebanyak 2794 data, dan terprediksi salah sebagai label netral sebanyak 752 data.

 

Pembahasan

Setelah melakukan penelitian serta analisis sentimen terhadap peristiwa perang Rusia vs Ukraina berbasis lexicon dan menggunakan metode machine learning Support Vector Machine (SVM), K-Nearest Neighbor (KNN), dan Multinomial Naïve Bayes (MNB), maka pada bagian yang terakhir ini, peneliti akan melakukan penjelasan tentang kesimpulan yang terkait dengan analisis sentimen yang telah dikerjakan.

Hasil berdasarkan analisis sentimen memberikan gambaran bahwa tanggapan masyarakat Indonesia pengguna twitter pada tanggal 24 Februari 2022 tentang peristiwa perang Rusia vs Ukraina didominasi dengan tweet bersentimen negatif (Aditya & Wibowo, 2022). Dengan tweet bersentimen negatif memiliki presentase terbanyak yaitu 50.1%, tweet bersentimen netral memiliki persentase 30.5%, dan tweet bersentimen positif memiliki persentase 19.3%. Hasil persentase sentimen diatas didapat dari perhitungan nilai sentimen berbasis lexicon dengan total data tweet terkumpul sebanyak 73628 data.

Dari data tweet yang didapat, masyarkat Indonesia banyak yang mengaitkan peristiwa perang Rusia vs Ukraina dengan peristiwa perang dunia.Terdapat juga beberapa pihak yang sering disebut pada tweet yang didapat, seperti Rusia, Ukraina, Amerika, Nato, Belarus, Uni Soviet, China dan Indonesia. Keterkaitan ini didapat dari hasil perhitungan setiap kata atau term yang ada pada keseluruhan data tweet. Sehingga subjek yang diduga dikaitkan dengan peristiwa ini merupakan kata atau term yang memiliki frekuensi tinggi dan tampil pada visualisasi word cloud.

Hasil performa tertinggi model machine learning didapat pada model beralgoritma SVM dengan akurasi 90%, posisi kedua didapat pada model MNB dengan akurasi 71%, dan diposisi terakhir didapat pada model KNN dengan akurasi hanya 48%. Hasil metrik performa khususnya akurasi didapat dari model yang sudah di train dengan data train dan diuji dengan data test. Data tersebut sebelumnya diolah dengan menggunakan beberapa preprocessing dan juga menerapkan ekstraksi fitur menggunakan TF-IDF (Gifari et al., 2022).

Dari waktu komputasi melatih model dengan menggunakan data train sebanyak 49330 data, model KNN memiliki waktu komputasi tercepat yaitu hanya 0.06 detik. Sedangkan model MNB memerlukan 0.16 detik dan model SVM memerlukan waktu terlama yaitu 314 detik. Sedangkan Dari waktu komputasi menguji model dengan menggunakan data test sebanyak 24298 data, model MNB memiliki waktu komputasi tercepat yaitu hanya 0.004 detik. Sedangkan model KNN memerlukan 32 detik dan model SVM memerlukan waktu terlama yaitu 53 detik.

 

 

 

Kesimpulan

Berdasarkan analisis sentimen terhadap peristiwa perang Rusia vs Ukraina berdasarkan data tweet dari masyarakat Indonesia pada tanggal 24 Februari 2022, hasil menunjukkan dominasi tweet bersentimen negatif dengan presentase tertinggi mencapai 50.1%, diikuti oleh tweet bersentimen netral (30.5%) dan positif (19.3%). Banyak masyarakat mengaitkan peristiwa tersebut dengan perang dunia, dan beberapa pihak seperti Rusia, Ukraina, Amerika, dan lainnya sering disebut dalam tweet. Model machine learning menunjukkan performa tertinggi pada SVM dengan akurasi 90%, disusul oleh MNB (71%), dan KNN (48%). Waktu komputasi tercepat untuk melatih model dimiliki oleh KNN (0.06 detik), sedangkan MNB (0.16 detik) dan SVM (314 detik) memerlukan waktu lebih lama. Untuk pengujian model, MNB juga memiliki waktu komputasi tercepat (0.004 detik), diikuti oleh SVM (53 detik) dan KNN (32 detik). Dengan demikian, kesimpulannya adalah model SVM memiliki kinerja terbaik dalam analisis sentimen terhadap peristiwa tersebut, meskipun waktu komputasinya lebih lama dibandingkan dengan model lainnya.

 

BIBLIOGRAFI

 

Aditya, A., & Wibowo, A. (2022). Analisis Sentimen Menggunakan Metode Naïve Bayes Berdasarkan Opini Masyarakat Dari Twitter Terhadap Perang Rusia dan Ukraina. Prosiding Seminar Nasional Mahasiswa Fakultas Teknologi Informasi (SENAFTI), 1(1), 551–558.

Alfiansyah, T. R. (2022). 5 Dampak Perang Rusia-Ukraina Bagi Indonesia. Kompas.Com.

Bakrie, C. R., Delanova, M. O., & Yani, Y. M. (2022). Pengaruh perang Rusia dan Ukraina terhadap perekonomian negara kawasan Asia Tenggara. Caraka Prabu: Jurnal Ilmu Pemerintahan, 6(1), 65–86.

Creswell, J. W., & Poth, C. N. (2016). Qualitative inquiry and research design: Choosing among five approaches. Sage publications.

Devi, R. F. (2023). Analisis Sentimen Terhadap Kinerja Pelayanan Di Pt Bank Rakyat Indonesia (Persero) Tbk. Menggunakan Metode Support Vector Machine, Naive Bayes, Dan K-Nearest Neighbors.

Gifari, O. I., Adha, M., Hendrawan, I. R., & Durrand, F. F. S. (2022). Analisis Sentimen Review Film Menggunakan TF-IDF dan Support Vector Machine. Journal of Information Technology, 2(1), 36–40.

Hutabarat, G. F. I. (2022). Arah Kebijakan Luar Negeri Indonesia Pasca Perang Rusia-Ukraina Berdasarkan Perspektif National Interest. Jurnal Al Azhar Indonesia Seri Ilmu Sosial E-ISSN, 2745, 5920.

Kusumawati, E. (2023). Kepemimpinan Digital dalam Pendidikan: Sebuah Analisis BibliometrikJournal of Education and Teaching (JET)4(2), 252-260.

Nandana, Y., Runturambi, A. J. S., & Daryanto, E. (2023). The Turmoil of Europe’s Economy, Food and Energy Stability: Will It Ends Western Sanctions on Russia?. International Journal of Social Service and Research3(5), 1290-1302.

Pamungkas, F. S., & Kharisudin, I. (2021). Analisis Sentimen dengan SVM, NAIVE BAYES dan KNN untuk Studi Tanggapan Masyarakat Indonesia Terhadap Pandemi Covid-19 pada Media Sosial Twitter. PRISMA, Prosiding Seminar Nasional Matematika, 4, 628–634.

Pang, B., & LillianLee. (2008). Opinion Mining and Sentiment Analysis. Foundations and Trends in Information Retrieval, 12(2), 1–135. https://doi.org/10.1561/1500000001

Rezwanul, M., Ali, A., & Rahman, A. (2017). Sentiment Analysis on Twitter Data using KNN and SVM. International Journal of Advanced Computer Science and Applications, 8(6), 19–25. https://doi.org/10.14569/ijacsa.2017.080603

Rubel, M., & Hossain, M. S. (2022). Analyze The Causes of The Russian-Ukraine War with Waltz's Three Images (Individual, Domestic Politics, International System). Journal of Social Science3(5), 1113-1121.

Salam, A., Zeniarja, J., & Khasanah, R. S. U. (2018). Analisis Sentimen Data Komentar Sosial Media Facebook Dengan k-Nearest Neighbor (Studi Kasus Pada Akun Jasa Ekspedisi Barang J&T Ekspress Indonesia).

Setiawan, A. R., Rintyama, B. S., & Cahyanto, T. A. (2021). Preferensi Konsumen Terhadap Produk by.U Dan MPWR Dengan Analisis Sentimen berbasis Multinominal Naive Bayes.

Shofiya, F., Arifianto, D., & Faruq, H. A. Al. (2020). Perbandingan Algoritma Support Vector Machine (SVM) Dan Multinominal Naive Bayes (MNB) Dalam Klasifikasi Abstrak Tugas Akhir.

Sugiyono. (2019). Metode Penelitian. CV Alfabeta.

Vidyadhari, D. C. (2022). Analisis Sentimen Konflik Rusia-Ukraina dalam Kanal Berita Online Indonesia Menggunakan Pendekatan Berbasis Lexicon.

 

                                                

Copyright holder:

Muhammad Husni Mubarok, Jati Sasongko Wibowo (2024)

 

First publication right:

Syntax Literate: Jurnal Ilmiah Indonesia

 

This article is licensed under: