Інтелектуальна система виявлення фейкових новин на основі глибинних нейронних мереж

Березовський, Максим Ігорович; Berezovskyi, Maksym Ihorovych

Інтелектуальна система виявлення фейкових новин на основі глибинних нейронних мереж

Files

Primary 2024_81240003_Berezovskyi_Maksym_Ihorovych_262196.pdf (1.88 MB)

Date

2024

Authors

Березовський, Максим Ігорович

Berezovskyi, Maksym Ihorovych

Publisher

Національний університет "Львівська політехніка"

Abstract

У даній роботі об'єкт дослідження - це процес поширення фейкових новин у цифровому середовищі, зокрема у соціальних мережах та новинних платформах, оскільки дезінформація, яка поширюється в таких середовищах, створює загрозу, яка може проявлятись різними способами. Предмет дослідження Предметом дослідження є виявлення фейкових новин за допомогою глибинних нейронних мереж. Мета роботи Метою роботи є розробка та впровадження інтелектуальної системи (розробка графічного інтерфейсу, розробка інструментів для агента та впровадження їх в алгоритм ReAct) на основі глибинних нейронних мереж для автоматичного виявлення фейкових новин. Основним результатом цієї роботи стане алгоритм, який складатиметься із декількох етапів, кожен з яких, аналізує різні аспекти фейковості новини та в результаті дає комбіновану оцінку фейковості новини та пояснення чому дана новина є фейком або не є фейком. Оскільки фейкова новина може бути представлена у різноманітних форматах, таких як: зображення, стаття, підробні дані тощо, виникають сумніви щодо можливості розробки однієї системи, яка зможе ефективно класифікувати усі форми фейкових новин. З цієї причини, дана робота фокусується на аналізі лише фейкових статтей, текстів або конкретних висловлювань чи тез із можливістю розширення функціональності в майбутньому. Слід також підмітити, що дана робота не ставить на меті розробку системи, яка зможе повноцінно замінити ручний процес факт-чекінгу, який проводить досвідчений спеціаліст, оскільки поточний етап розвитку систем штучного інтелекту не дозволяє даним системам повноцінно планувати, мислити та шукати інформацію так, як це може робити людина. У сучасному світі проблема поширення фейкових новин стає все більш актуальною та потребує ефективних рішень для її подолання. У рамках даної роботи було проведено комплексне дослідження та розроблено інтелектуальну систему для виявлення фейкових новин, яка поєднує найкращі існуючі підходи та впроваджує нові ідеї для досягнення високої точності та ефективності. В межах даної роботи був проведений огляд чотирьох існуючих підходів до класифікації фейкових новин, який включав у себе аналіз запропонованих принципів роботи та розбір сильних і слабких сторін кожного рішення. На основі цих даних було створене бачення ідеального рішення, яке зможе аналізувати не лише текст новинних заголовків, а й текст повноцінних новин. Рішення складається із аналізу тексту новини на наявність восьми ознак, які часто зустрічаються у фейкових новинах. Після цього відбувається процес факт-чекінгу, який використовує велику мовну модель та алгоритм ReAct. Після проведення факт-чекінгу система виконує алгоритм класифікації, який видає оцінку достовірності новини, яка потім конвертується в одну із трьох категорій – «фейк», «правда», «недостатньо інформації». Результати роботи впровадженого рішення проілюстровані за допомогою тестування графічного інтерфейсу та алгоритму класифікації, отримані такі метрики: · Точність: 80% · Влучність: 80% · Повнота: 80% · F-міра: 80% На тестувальному наборі у 10 новин, кожна із яких мала різну довжину. Дані метрики свідчать що система добре збалансована між тим, щоб не пропускати фейкові новини та не помилково позначати правдиві новини як фейкові. Окремо було розглянуто недоліки системи та запропоновано варіанти їх вирішення або пом’якшення їх впливу на кінцевий результат.
In this paper, the object of study is the process of spreading fake news in the digital environment, in particular on social media and news platforms, as disinformation spread in such environments poses a threat that can manifest itself in various ways. The subject of the study The subject of the study is fake news detection using deep neural networks. Purpose of the study The aim of the work is to develop and implement an intelligent system (development of a graphical interface, development of tools for the agent and their implementation in the ReAct algorithm) based on deep neural networks for automatic fake news detection. The main outcome of this work will be an algorithm consisting of several stages, each of which analyzes different aspects of fake news and, as a result, provides a combined assessment of fake news and an explanation of why the news is or is not fake. Since fake news can be presented in a variety of formats, such as an image, an article, fake data, etc., it is questionable whether it is possible to develop a single system that can effectively classify all forms of fake news. For this reason, this work focuses on analyzing only fake articles, texts or specific statements or talking points, with the possibility of expanding the functionality in the future. It should also be noted that this work does not aim to develop a system that can fully replace the manual process of fact-checking conducted by an experienced specialist, since the current stage of development of artificial intelligence systems does not allow these systems to fully plan, think and search for information in the same way as a human can. In today's world, the problem of fake news spreading is becoming increasingly relevant and requires effective solutions to overcome it. In this work, we conducted a comprehensive study and developed an intelligent system for detecting fake news that combines the best existing approaches and introduces new ideas to achieve high accuracy and efficiency. This work included a review of four existing approaches to fake news classification, which included an analysis of the proposed principles of operation and an analysis of the strengths and weaknesses of each solution. Based on this data, a vision of an ideal solution was created that would be able to analyze not only the text of news headlines, but also the text of full news stories. The solution consists of analyzing the news text for eight features that are often found in fake news. This is followed by a fact-checking process that uses a large language model and the ReAct algorithm. After fact-checking, the system executes a classification algorithm that gives an assessment of the news' credibility, which is then converted into one of three categories: “fake”, “true”, or “insufficient information”. The results of the implemented solution are illustrated by testing the graphical interface and the classification algorithm, and the following metrics were obtained: - Accuracy: 80% - Precision: 80% - Recall: 80% - F-score: 80% The test set had 10 news items, each of which had a different length. These metrics show that the system is well balanced between not missing fake news and not falsely labeling true news as fake. The shortcomings of the system were also discussed and options were proposed to address them or mitigate their impact on the final result.

Keywords

8.124.00.03, велика мовна модель, GPT-4, ReAct, фейкові новини

Citation

Березовський М. І. Інтелектуальна система виявлення фейкових новин на основі глибинних нейронних мереж : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „8.124.00.03 — Аналіз даних (Data Science)“ / Максим Ігорович Березовський. — Львів, 2024. — 124 с.

URI

https://ena.lpnu.ua/handle/ntb/63282

Collections

Магістерські роботи

Full item page

Інтелектуальна система виявлення фейкових новин на основі глибинних нейронних мереж

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By