Evaluating machine learning models efficacy in sentiment analysis for Moroccan Darija: An exploration with MAC dataset

Journal Title

Journal ISSN

Volume Title

Publisher

Видавництво Львівської політехніки
Lviv Politechnic Publishing House

Abstract

Аналіз тональності є важливою технікою для класифікації та вилучення емоцій із наборів даних сервера. Хоча багато базових методів розрізняють негативні та позитивні емоції, просунуті підходи можуть враховувати додаткові категорії, такі як нейтральні емоції. Це стає дуже важливим і складним, коли нам потрібно мати справу з менш аналізованими мовами та діалектами, такими як мароканська Дарія. Наше дослідження висвітлює нюанси проведення аналізу тональності за допомогою набору даних MAC, який включає коментарі марокканською мовою Дарія. Наша головна мета провести порівняльні дослідження та дослідження моделей машинного навчання, які найчастіше використовуються для аналізу тональності на арабській мові, особливо SVM, NB та KNN. Ці моделі довели свою ефективність у класифікації та аналізі емоцій у таких широко вивчених мовах, як англійська та арабська. Завдяки цьому порівняльному аналізу намагаємося усвідомити їхню ефективність і адаптивність у контексті марокканського діалекту Дарія.
Sentiment analysis is an essential technique for classifying and extracting emotions from several data sets. While many basic methods distinguish between negative and positive emotions, advanced approaches may consider additional categories, such as neutral emotions. This becomes very important and difficult when we need to deal with less parsed languages and dialects, such as Moroccan Darija. Our study highlights the nuances of conducting sentiment analysis implementing the MAC dataset, which includes comments in Moroccan Darija. Our main target is to do comparative study and research of the most used machine learning models for Arabic sentiment analysis, especially SVM, NB and KNN. These models have proven their effectiveness in classifying and analyzing emotions in widely studied languages such as English and Arabic. Through this comparative analysis, we aim to realize their effectiveness and adaptability in the Moroccan Darija dialect context.

Description

Citation

Sakhi H. Evaluating machine learning models efficacy in sentiment analysis for Moroccan Darija: An exploration with MAC dataset / H. Sakhi, S. Elfilali // Mathematical Modeling and Computing. — Lviv : Lviv Politechnic Publishing House, 2024. — Vol 11. — No 2. — P. 539–545.

Endorsement

Review

Supplemented By

Referenced By