Інтелектуальна система виявлення фейкових новин на основі глибинних нейронних мереж

dc.contributor.advisorПелещак, Роман Михайлович
dc.contributor.affiliationНаціональний університет "Львівська політехніка"
dc.contributor.authorБерезовський, Максим Ігорович
dc.contributor.authorBerezovskyi, Maksym Ihorovych
dc.coverage.placenameЛьвів
dc.date.accessioned2025-02-26T13:00:47Z
dc.date.created2024
dc.date.issued2024
dc.description.abstractУ даній роботі об'єкт дослідження - це процес поширення фейкових новин у цифровому середовищі, зокрема у соціальних мережах та новинних платформах, оскільки дезінформація, яка поширюється в таких середовищах, створює загрозу, яка може проявлятись різними способами. Предмет дослідження Предметом дослідження є виявлення фейкових новин за допомогою глибинних нейронних мереж. Мета роботи Метою роботи є розробка та впровадження інтелектуальної системи (розробка графічного інтерфейсу, розробка інструментів для агента та впровадження їх в алгоритм ReAct) на основі глибинних нейронних мереж для автоматичного виявлення фейкових новин. Основним результатом цієї роботи стане алгоритм, який складатиметься із декількох етапів, кожен з яких, аналізує різні аспекти фейковості новини та в результаті дає комбіновану оцінку фейковості новини та пояснення чому дана новина є фейком або не є фейком. Оскільки фейкова новина може бути представлена у різноманітних форматах, таких як: зображення, стаття, підробні дані тощо, виникають сумніви щодо можливості розробки однієї системи, яка зможе ефективно класифікувати усі форми фейкових новин. З цієї причини, дана робота фокусується на аналізі лише фейкових статтей, текстів або конкретних висловлювань чи тез із можливістю розширення функціональності в майбутньому. Слід також підмітити, що дана робота не ставить на меті розробку системи, яка зможе повноцінно замінити ручний процес факт-чекінгу, який проводить досвідчений спеціаліст, оскільки поточний етап розвитку систем штучного інтелекту не дозволяє даним системам повноцінно планувати, мислити та шукати інформацію так, як це може робити людина. У сучасному світі проблема поширення фейкових новин стає все більш актуальною та потребує ефективних рішень для її подолання. У рамках даної роботи було проведено комплексне дослідження та розроблено інтелектуальну систему для виявлення фейкових новин, яка поєднує найкращі існуючі підходи та впроваджує нові ідеї для досягнення високої точності та ефективності. В межах даної роботи був проведений огляд чотирьох існуючих підходів до класифікації фейкових новин, який включав у себе аналіз запропонованих принципів роботи та розбір сильних і слабких сторін кожного рішення. На основі цих даних було створене бачення ідеального рішення, яке зможе аналізувати не лише текст новинних заголовків, а й текст повноцінних новин. Рішення складається із аналізу тексту новини на наявність восьми ознак, які часто зустрічаються у фейкових новинах. Після цього відбувається процес факт-чекінгу, який використовує велику мовну модель та алгоритм ReAct. Після проведення факт-чекінгу система виконує алгоритм класифікації, який видає оцінку достовірності новини, яка потім конвертується в одну із трьох категорій – «фейк», «правда», «недостатньо інформації». Результати роботи впровадженого рішення проілюстровані за допомогою тестування графічного інтерфейсу та алгоритму класифікації, отримані такі метрики: · Точність: 80% · Влучність: 80% · Повнота: 80% · F-міра: 80% На тестувальному наборі у 10 новин, кожна із яких мала різну довжину. Дані метрики свідчать що система добре збалансована між тим, щоб не пропускати фейкові новини та не помилково позначати правдиві новини як фейкові. Окремо було розглянуто недоліки системи та запропоновано варіанти їх вирішення або пом’якшення їх впливу на кінцевий результат.
dc.description.abstractIn this paper, the object of study is the process of spreading fake news in the digital environment, in particular on social media and news platforms, as disinformation spread in such environments poses a threat that can manifest itself in various ways. The subject of the study The subject of the study is fake news detection using deep neural networks. Purpose of the study The aim of the work is to develop and implement an intelligent system (development of a graphical interface, development of tools for the agent and their implementation in the ReAct algorithm) based on deep neural networks for automatic fake news detection. The main outcome of this work will be an algorithm consisting of several stages, each of which analyzes different aspects of fake news and, as a result, provides a combined assessment of fake news and an explanation of why the news is or is not fake. Since fake news can be presented in a variety of formats, such as an image, an article, fake data, etc., it is questionable whether it is possible to develop a single system that can effectively classify all forms of fake news. For this reason, this work focuses on analyzing only fake articles, texts or specific statements or talking points, with the possibility of expanding the functionality in the future. It should also be noted that this work does not aim to develop a system that can fully replace the manual process of fact-checking conducted by an experienced specialist, since the current stage of development of artificial intelligence systems does not allow these systems to fully plan, think and search for information in the same way as a human can. In today's world, the problem of fake news spreading is becoming increasingly relevant and requires effective solutions to overcome it. In this work, we conducted a comprehensive study and developed an intelligent system for detecting fake news that combines the best existing approaches and introduces new ideas to achieve high accuracy and efficiency. This work included a review of four existing approaches to fake news classification, which included an analysis of the proposed principles of operation and an analysis of the strengths and weaknesses of each solution. Based on this data, a vision of an ideal solution was created that would be able to analyze not only the text of news headlines, but also the text of full news stories. The solution consists of analyzing the news text for eight features that are often found in fake news. This is followed by a fact-checking process that uses a large language model and the ReAct algorithm. After fact-checking, the system executes a classification algorithm that gives an assessment of the news' credibility, which is then converted into one of three categories: “fake”, “true”, or “insufficient information”. The results of the implemented solution are illustrated by testing the graphical interface and the classification algorithm, and the following metrics were obtained: - Accuracy: 80% - Precision: 80% - Recall: 80% - F-score: 80% The test set had 10 news items, each of which had a different length. These metrics show that the system is well balanced between not missing fake news and not falsely labeling true news as fake. The shortcomings of the system were also discussed and options were proposed to address them or mitigate their impact on the final result.
dc.format.pages124
dc.identifier.citationБерезовський М. І. Інтелектуальна система виявлення фейкових новин на основі глибинних нейронних мереж : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „8.124.00.03 — Аналіз даних (Data Science)“ / Максим Ігорович Березовський. — Львів, 2024. — 124 с.
dc.identifier.urihttps://ena.lpnu.ua/handle/ntb/63282
dc.language.isouk
dc.publisherНаціональний університет "Львівська політехніка"
dc.relation.referencesJiajun Zhang, Zhixun Li, Qiang Liu, Shu Wu, Liang Wang. Evolving to the Future: Unseen Event Adaptive Fake News Detection on Social Media
dc.relation.referencesElena Shushkevich 1, Mikhail Alexandrov 2and John Cardiff 1,* Improving Multiclass Classification of Fake News Using BERT-Based Models and ChatGPT-Augmented Data
dc.relation.referencesSrinivasa K, P Santhi Thilagam. Multi-layer perceptron-based fake news classification using knowledge base triples
dc.relation.referencesJing Ma, Wei Gao, Kam-Fai Wong. Rumor Detection on Twitter with Tree-structured Recursive Neural Networks
dc.relation.referencesShunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik Narasimhan, Yuan Cao. ReAct: Synergizing Reasoning and Acting in Language Models
dc.relation.referencesДокументація бібліотеки langchain https://www.langchain.com/
dc.relation.referencesДокументація бібліотеки Instructor https://python.useinstructor.com/
dc.relation.referencesAshish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin. Attention is All You Need
dc.relation.referencesOpenAI, Josh Achiam, Steven Adler, Sandhini Agarwal, Lama Ahmad та ін. GPT-4 Technical Report
dc.relation.referencesТехнічний звіт моделі LLama-3.1 https://ai.meta.com/blog/meta-llama-3-1/
dc.relation.referencesGemma Team, Google DeepMind. Gemma2
dc.rights.holder© Національний університет "Львівська політехніка", 2024
dc.rights.holder© Березовський, Максим Ігорович, 2024
dc.subject8.124.00.03
dc.subjectвелика мовна модель
dc.subjectGPT-4
dc.subjectReAct
dc.subjectфейкові новини
dc.titleІнтелектуальна система виявлення фейкових новин на основі глибинних нейронних мереж
dc.title.alternativeIntelligent System for Detecting Fake News Based on Deep Neural Networks
dc.typeStudents_diploma

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
2024_81240003_Berezovskyi_Maksym_Ihorovych_262196.pdf
Size:
1.88 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
2.91 KB
Format:
Plain Text
Description: