An Arabic question generation system based on a shared BERT-base encoder–decoder architecture

Loading...
Thumbnail Image

Journal Title

Journal ISSN

Volume Title

Publisher

Видавництво Львівської політехніки
Lviv Politechnic Publishing House

Abstract

Система генерації запитань (QGS) — це складна частина технології штучного інтелекту, призначена для автоматичного генерування запитань із певного тексту, документа чи контексту. Останнім часом ця технологія привернула значну увагу в різних сферах, включаючи освіту та створення контенту. Оскільки штучний інтелект продовжує розвиватися, ці системи, швидше за все, стануть ще більш досконалими та розглядатимуться як невід’ємна частина будь-якої сучасної системи електронного навчання чи оцінки знань. У цій дослідницькій роботі демонструється ефективність використання попередньо підготовлених контрольних точок для створення питань на арабській мові. Пропонується засновану на Transformer модель послідовностей, яка легко інтегрується із загальнодоступними попередньо навченими контрольними точками AraBERT. Наше дослідження зосереджено на оцінці переваг ініціалізації нашої моделі, що охоплює як кодер, так і декодер, за допомогою цих контрольних точок. Оскільки ресурси для арабської мови все ще обмежені, а загальнодоступні набори даних для систем генерування питань арабською мовою недоступні, зібрано набір даних для цього завдання з різних існуючих відповідей на запитання, які використані для навчання та тестування запропонованої моделі. Експериментальні результати показують, що продуктивність запропонованої моделі змогла перевершити існуючі моделі генерації запитань арабською мовою за оцінками BLEU та METEOR, досягнувши 20.29 бали для оцінки BLEU та 30.73 бали для METEOR. Накінець, оцінено здатність нашої моделі генерувати контекстуально відповідні запитання.
A Question Generation System (QGS) is a sophisticated piece of AI technology designed to automatically generate questions from a given text, document, or context. Recently, this technology has gained significant attention in various fields, including education, and content creation. As AI continues to evolve, these systems are likely to become even more advanced and viewed as aninherent part of any modern e-learning or knowledge assessment system. In this research paper, we showcase the effectiveness of leveraging pre-trained checkpoints for Arabic questions generation. We propose a Transformer-basedsequence-to sequence model that seamlessly integrates with publicly accessible pre-trained AraBERT checkpoints. Our study focuses on evaluating the advantages of initializing our model, encompassing both the encoder and decoder, with these checkpoints. As resources for Arabic language are still limited and the publicly datasets for question generation systems in Arabic are not available, we collected our dataset for this task from various existing question answering, we used this latter to train and test our model. The experimental results show that our model yields performance was able to outperform existing Arabic question generation models in terms of the BLEU and METEOR scores,by achieving 20.29 as BLEU score and 30.73 for METEOR. Finally, we assessed the capability of our model to generate contextually relevant questions.

Description

Citation

Lafkiar S. An Arabic question generation system based on a shared BERT-base encoder–decoder architecture / S. Lafkiar, N. En Nahnahi // Mathematical Modeling and Computing. — Lviv : Lviv Politechnic Publishing House, 2024. — Vol 11. — No 3. — P. 763–772.

Endorsement

Review

Supplemented By

Referenced By