Perbandingan Metode Support Vector Machine Dengan Metode Lexicon Dalam Analisis Sentimen Bahasa Indonesia

Muhammad Resa Arif Yudianto, Arham Rahim, Pristi Sukmasetya, Rofi Abul Hasani

Abstract


Berbagi informasi di era saat ini semakin mudah dengan adanya media sosial, salah satu yang populer adalah twitter. Media ini memang didesain khusus untuk mengutarakan pendapat dan mengekspresikan perasaan seseorang dengan jumlah karakter yang terbatas yaitu 280 karakter. Unggahan-unggahan dalam media tersebut memiliki isi yang menggambarkan permasalahan/perasaan seseorang yang mengandung pengetahuan yang tersembunyi. Oleh karena itu untuk mengetahui makna dari kalimat-kalimat tersebut harus dilakukan analisis sentimen. Terdapat beberapa metode yang dapat digunakan untuk menganalisis sentimen suatu kalimat seperti pendekatan lexicon based dan pendekatan knowledge based dengan algoritma Support Vector Machine (SVM). Kedua metode tersebut memiliki prinsip kerja yang berbeda dalam melakukan sentimen analisis. Penelitian ini membandingkan kemampuan dari pendekatan metode SVM dan lexicon based menggunakan dataset sentimen berbahasa Indonesia. Dari beberapa skenario percobaan terhadap 4000 dataset, didapatkan bahwa metode SVM lebih diunggulkan dalam mengklasifikasikan sentimen positif dan negatif dengan akurasi sebesar 98,5% dengan parameter ekstraksi fitur unigram dengan rasio dataset 80:20. Pendekatan berbasis lexicon based kurang baik dalam melakukan analisis sentimen dengan akurasi tertinggi sebesar 78,43%. Hal tersebut dikarenakan minimnya kamus kata positif yang jumlahnya adalah setengah dari jumlah kamus kata negatif, sehingga kata yang bernilai positif tidak dapat dikenali dengan baik. Kamus kata yang memiliki nilai pada setiap kata lebih akurat dalam menganalisis sentimen dibandingkan dengan kamus kata yang tidak memiliki nilai/skor.


Keywords


Lexicon Based;Support Vector Machine;Analisis Sentimen;Big Data

Full Text:

PDF

References


AHMAD, M., AFTAB, S., AND ALI, I., 2017. Sentiment Analysis of Tweets using SVM. Int. J. Comput. Appl., vol. 177, no. 5, hal. 25–29.

AL-SMADI, M., QAWASMEH, O., AL- AYYOUB, M., JARARWEH, Y., AND GUPTA, B., 2017. Deep Recurrent Neural Network vs. Support Vector Machine for Aspect-Based Sentiment Analysis of Arabic Hotels Reviews. J. Comput. Sci.

AGARWAL, A. AND TOSHNIWAL, D., 2018. Application of Lexicon Based Approach in Sentiment Analysis for short Tweets. Int. Conf. Adv. Comput. Commun. Eng., no. June, hal. 189–193.

AUNG, K. Z., AND MYO, N. N., 2017. Sentiment Analysis of Student’s Comment Using Lexicon Based Approach. IEEE/ACIS 16th Int. Conf. Comput. Inf. Sci., hal. 149–154.

AKTER, S. AND AZIZ, M. T., 2016. Sentiment Analysis On Facebook Group Using Lexicon Based Approach. 3rd Int. Conf. Electr. Eng. Inf. Commun. Technol., hal. 8–11.

ABUELENIN, S., ELMOUGY , S., AND NAGUIB, E., 2017. Twitter Sentiment Analysis for Arabic Tweets. in Proceedings of the International Conference on Advanced Intelligent Systems and Informatics, hal. 467– 476.

TIARA, SABARIAH, M. K., AND EFFENDY, V., 2015. Sentiment Analysis on Twitter Using the Combination of Lexicon- Based and Support V ector Machine for Assessing the Performance of a Television Program. 3rd Int. Conf. Inf. Commun. Technol. Sentim., hal. 386–390.

NASIM, Z., RAJPUT, Q., AND HAIDER, S., 2017. Sentiment Analysis of Student Feedback Using Machine Learning and Lexicon Based Approaches. Int. Conf. Res. Innov. Inf. Syst., hal. 1–6.

ALFINA, I., SIGMAWATY, D., NURHIDAYATI, F., AND A. HIDAYANTO, N., 2017. Utilizing Hashtags for Sentiment Analysis of Tweets in The Political Domain. ICMLC, hal. 43–47.

ANANDARAJAN, M., HILL, C., AND NOLAN, T., 2019. Practical Text Analytics: Maximizing the Value of Text Data. Springer, vol. 2.

CORTES, C., AND VAPNIK, V, 1995. Support vector machine. Machine learning, 20(3), 273-297.

ALMATARNEH, S. AND GAMALLO, P., 2018. A lexicon based method to search for extreme opinions. PLoS One, vol. 13, no. 5, hal. 1–19.

KOTO, F., RAHMANINGTYAS, G.Y., 2018 .Inset lexicon: Evaluation of a word list for Indonesian sentiment analysis in microblogs. Proceedings of the 2017 International Conference on Asian Language Processing, IALP 2017, 2018-January(December), hal. 391–394. doi: 10.1109/IALP.2017.8300625.

SAMMUT, C., WEBB, G.I., 2011. Encyclopedia of Machine Learning, Springer.

SOKOLOVA, M., & LAPALME, G., 2009. Information Processing and Management.A systematic analysis of performance measures for classification tasks, 427-437.

PATIL, N. M. AND NEMADE, M. U., 2017. Music Genre Classification Using MFCC , K- NN and SVM Classifier. Int. J. Comput. Appl., vol. 4, no. 2, hal. 43–47, 2017.




DOI: https://doi.org/10.36294/jurti.v6i1.2537

Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 (JurTI) Jurnal Teknologi Informasi

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.

JurTI (Jurnal Teknologi Informasi) terindex :

 

JurrTI (Jurnal Teknologi Informasi)

Program Studi Program Studi Teknik Informatika, Fakultas Teknik, Universitas Asahan.

Jl. Jend. Ahmad Yani, Kisaran – 21224  – Sumatera Utara

Telp/WA : 082370952109 - 081268777854

E-Mail : jurtischolar@gmail.com

JurTI (Jurnal Teknologi Informasi) s licensed under a Creative Commons Attribution-ShareAlike 4.0 International License