Інформаційно-пошукова система україномовної дезінформації, фейків та пропаганди для формування датасетів

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет "Львівська політехніка"

Abstract

Проведене дослідження засвідчує, що проблема дезінформації має глобальний характер, однак для України вона є особливо критичною через постійний тиск з боку гібридних загроз. Хоча у світі вже існують ефективні технології для виявлення неправдивої інформації, в україномовному середовищі все ще відчувається нестача адаптованих інструментів та структурованих наборів даних. Це зумовлює потребу у створенні локалізованих рішень, які б враховували мовну специфіку, соціокультурний контекст та особливості інформаційного середовища. У межах дослідження було обґрунтовано доцільність розробки інформаційно-пошукової системи, призначеної для виявлення дезінформації, фейків та пропаганди саме в україномовному просторі. Системний аналіз, що передував її створенню, включав побудову UML-діаграм і визначення основних компонентів, що забезпечило комплексний підхід до проєктування. Завдяки цьому враховано не лише технічні аспекти, але й важливі чинники, пов’язані з медіаграмотністю, національною безпекою та інформаційною протидією. Розроблена концепція базується на сучасних методах обробки природної мови, технологіях машинного навчання та аналізі поведінкових характеристик інформаційного поширення. Це дало змогу сформувати якісні україномовні датасети та підготувати моделі, здатні ефективно розпізнавати дезінформаційні матеріали. Запропонована технологічна архітектура включає інструменти для збору, обробки, зберігання та візуалізації даних, що забезпечує високу точність, масштабованість і відповідність локальним умовам. У межах реалізації було створено прототип системи, яка здатна автоматично оновлювати базу фейкових повідомлень, обробляти великі обсяги текстової інформації та швидко реагувати на інформаційні вкиди. Інтерфейс, розроблений за допомогою Streamlit, робить систему доступною для широкого кола користувачів – від дослідників і викладачів до практиків у сфері інформаційної безпеки. У подальшому можливе розширення функціональності шляхом інтеграції з популярними платформами обміну повідомленнями, створення мобільних застосунків та впровадження підтримки багатьох мов. Варто підкреслити, що запропоноване рішення має не лише технічне, а й соціокультурне значення. Його застосування сприяє формуванню критичного мислення у суспільстві, навчає перевіряти джерела інформації та розуміти механізми поширення фейкових наративів. Це набуває особливої важливості в умовах інформаційного протистояння, коли оперативність реагування на маніпулятивні повідомлення є ключовим фактором. Інтеграція штучного інтелекту та аналізу великих даних у процес виявлення дезінформації дозволяє зменшити навантаження на фактчекінгові платформи, автоматизуючи типові процеси та забезпечуючи високу швидкість обробки даних. Система може використовуватися не лише як інструмент боротьби з фейками, але й як потужна аналітична платформа для журналістів, аналітиків, освітян та науковців, надаючи їм доступ до релевантної інформації та прогностичних моделей у сфері інформаційної безпеки. Таким чином, упровадження спеціалізованої системи виявлення україномовної дезінформації є не просто технічно можливим, а й вкрай необхідним із точки зору інформаційного захисту країни. Її розвиток та масштабування можуть стати ключовими чинниками підвищення інформаційної стійкості, формування здорового медіасередовища та стимулювання подальших досліджень у сфері цифрової безпеки й медіаграмотності.
The study confirms that disinformation is a serious global issue, which is particularly significant in the Ukrainian context due to the constant influence of hybrid threats. Although there are advanced technologies for detecting fake messages globally, the Ukrainian-speaking environment still lacks specialized systems and structured datasets. This creates the need for the development of localized tools that account for linguistic, cultural, and social specificities. The analysis substantiates the need for creating an information retrieval system designed to detect disinformation, fake news, and propaganda in the Ukrainian-speaking space. A comprehensive system analysis was conducted as part of the project, including the development of UML diagrams and the identification of key system components. This approach not only allows for the technical realization of the system but also considers broader factors related to media literacy, national security, and information defense. The developed concept combines modern methods of natural language processing, machine learning technologies, and behavioral pattern analysis, which ensures the creation of high-quality Ukrainian-language datasets and the effective training of models to recognize disinformation. The chosen technological architecture, which includes tools for data collection, processing, storage, and visualization, is optimal in terms of accuracy, scalability, and localization. As a result, a prototype system was created that is capable of automatically updating the fake news database, analyzing large volumes of text, and quickly responding to information threats. The interface, developed using Streamlit, makes the system accessible for a wide range of users – from researchers and educators to practitioners in the field of information security. In the future, further development may include integration with messaging platforms, the creation of mobile applications, and support for multilingualism. It is important to note that the proposed system has not only a technical but also a socio-cultural significance. Its use can contribute to the development of critical thinking among citizens, improve skills in verifying information, and foster a better understanding of the mechanisms behind the spread of fake news and manipulative content. This is especially relevant in the context of information warfare, where the speed of responding to false information is critically important. The integration of artificial intelligence and big data analysis into the process of disinformation detection reduces the workload of fact-checking organizations by automating routine tasks and speeding up the identification of information attacks. At the same time, such a system can be used as an analytical tool for media experts, researchers, journalists, and educators, providing them with access to relevant data, analytics, and forecasts related to information security. Based on the results obtained, it can be concluded that the implementation of a specialized information retrieval system for detecting Ukrainian-language disinformation is not only technically feasible but also socially necessary. Its full-scale implementation can strengthen Ukraine's information resilience, improve the quality of public discourse, and create a solid foundation for further research and development in the fields of digital security and media literacy.

Description

Keywords

Citation

Гнатишин Н. А. Інформаційно-пошукова система україномовної дезінформації, фейків та пропаганди для формування датасетів : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „3.126.00.00 — Інформаційні системи та технології (освітньо-наукова програма)“ / Назар Андрійович Гнатишин. — Львів, 2024. — 89 с.

Endorsement

Review

Supplemented By

Referenced By