Інтелектуальна система виявлення дезінформації у новинах

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет "Львівська політехніка"

Abstract

Маленчак В.Б., Буров Є.В. (керівник). Інтелектуальна система виявлення дезінформації у новинах. Магістерська кваліфікаційна робота на отримання ступеня магістра напрямку 124 – Системний аналіз. – Національний університет “Львівська політехніка”. Проведено аналіз літературних джерел та ресурсів мережі Інтернет. Виокреслено основні визначення дезінформації. Під нею зазвичай розуміють метод психологічного впливу, що включає надання споживачам такої інформації, яка вводить їх в оману та створює спотворену реальність. Це поширення спотвореної, неповної або свідомо неправдивої інформації для агітаційних, військових (для введення ворогів в оману), комерційних або інших цілей. Проте немає єдиного однозначного означення, яке би враховувало складність явища фейкових новин повністю. Цей термін став дуже просторим, охоплюючи різні типи вмісту, різні мотиви для виробництва та різні методи розповсюдження контенту. Наведено основні типи фейкових новин та описано кожен з них. Зокрема це клікбейт та шокуючі заголовки (основним своїм завдання мають генерацію кліків для збільшення перегляду реклами, зазвичай такі новини є сильно перебільшеними або абсолютно помилковими), пропаганда та навмисне введення в оману (просування автором певних тверджень, фактів, теорій, чуток, світогляду з метою втілення їх у людську свідомість; зазвичай риторика таких новин є ненависною та запальною), коментар та думки (упереджені реакції автора на певні події; часто такі новини розповідають читачам як потрібно сприймати останні події), гумор та сатира (новини написані для розваг та не призначені для серйозного сприйняття). Проведено аналіз відомих засобів вирішення проблеми. Наведено приклади інтелектуальних систем, які класифікують новини за критерієм правдивості та є найбільш популярними на сьогоднішній день. Визначено переваги та недоліки кожної системи. На основі всього перечислено вище аналізу було окреслено мету та функції, сформовано основні концепції інтелектуальної системи. Вона має надавати користувачам перевірити будь-яку новину, яка є у мережі Інтернет за критерієм правдивості, отримати результат класифікації, аналізувати усі проведені перевірки та на їх основі надавати статистичні дані. Основними вимогами до інтелектуальної системи є швидкість роботи, висока точність класифікації новин, мінімалістичність та зручність інтерфейсу, наявність статистичних даних на основі перевірок новин. Проведено системний аналіз та обгрунтування проблеми. Побудовано дерево цілей, визначено генеральну ціль, її аспекти та підаспекти, а також сформовано основні критерії досягнення мети. Побудовано основні типи UML діаграм (діаграма варіантів використання, класів, кооперації, послідовності, станів, діяльності, компонентів, розгортання) та діаграма сутність зв’язок, що конкретизують функціонування системи, а саме: визначають систему та зовнішнє середовище, аналізують основні компоненти системи, описують потоки даних та основін бізнес-процеси. Як результат, розкрито основні можливості системи та варіанти її побудови, а також обгрунтовано доцільність реалізації обраного варіанту проектованої системи. Здійснено вибір та обгрунтування засобів розв’язання задачі, а також було описано їх технічні характеристики. Таким чином отримано оптимальні засоби, які будуть необхідними для реалізації інтелектуальної системи виявлення дезінформації у новинах. Для реалізації користувацького веб інтерфейсу буде застосовано фреймворк Vue.JS, для реалізації сервісів бекенду – мова програмування Python 3, фреймворк Flask, SQLAlchemy ORM, технології Git та Docker. У якості системи управління базами даних обрано PostgreSQL. Описані основні характеристики перерахованих вище засобів, їх переваги та недоліки. Основними програмними засобами є JetBrains PyCharm, Atom, Google Chrome та Github. Проведений аналіз їх основних функцій, технічних параметрів та можливостей. Під час виконання розділу розроблено інтелектуальну систему виявлення дезінформації у новинах. Було описано логічну структуру кожного сервісу (сервісу менеджменту користувачів, сервісу класифікацій, сервісу аналітичних даних та сервісу інтерфейсу користувача). Подано схему бази даних, описано призначення усіх таблиць та обгрунтовано обрану структуру. Визначено призначення, основні вимоги, функції та характеристики розробленої інтелектуальної системи. Зокрема сформовано вимоги програмних та технічних засобів, апаратного та програмного забезпечення, щодо питань технологічного та організаційного характеру. Створено інструкцію користувача, яка пояснює як користувач повинен взаємодіяти з інтелектуальною системою, щоб отримати необхідні результати. Під час виконання економічного обгрунтування доцільності проектного рішення було досліджено витрати на розробку та проектування програмного забезпечення інтелектуальної системи виявлення дезінформації у новинах. Проведено ряд необхідних досліджень, щоб проілюструвати ефективність прийнятого рішення. Згідно до результатів дослідження можна зробити висновок, що розроблена система є економічно ефективною та конкурентною на ринку. Тому розробка інтелектуальної системи є доцільною.
Malenchak V. B., Burov E.V. (supervisor). Intelligent system for detecting disinformation in the news. – Manuscript. Master’s qualification thesis for obtaining qualification of Master base direction 124 – System analysis. – National University “Lviv Polytechnic”, Lviv, 2021. The analysis of literature sources and resources of the Internet is carried out. The main definitions of misinformation are outlined. It is usually understood as a method of psychological influence, which includes providing consumers with information that misleads them and creates a distorted reality. It is the dissemination of distorted, incomplete or knowingly false information for propaganda, military (to mislead enemies), commercial or other purposes. However, there is no single unambiguous definition that would take into account the complexity of the phenomenon of fake news in full. This term has become very broad, covering different types of content, different motives for production and different methods of content distribution. The main types of fake news are given and each of them is described. These include clickbait and shocking headlines (the main task is to generate clicks to increase ad viewing, usually such news is greatly exaggerated or completely false), propaganda and deliberate misleading (promotion by the author of certain statements, facts, theories, rumors, worldview in order to their embodiment in human consciousness; usually the rhetoric of such news is hateful and inflammatory), commentary and thoughts (biased reactions of the author to certain events; often such news tells readers how to perceive recent events), humor and satire (news is written for entertainment and not intended) for serious perception). An analysis of known means of solving the problem. Examples of intelligent systems that classify news according to the criterion of truthfulness and are the most popular today are given. The advantages and disadvantages of each system are identified. Based on all the above analysis, the purpose and functions were outlined, the basic concepts of the intelligent system were formed. It should allow users to check any news available on the Internet on the basis of truthfulness, obtain the result of the classification, analyze all the checks carried out and provide statistics based on them. The main requirements for the intelligent system are speed, high accuracy of news classification, minimalism and user-friendliness of the interface, the availability of statistics based on news checks. A systematic analysis and justification of the problem. The tree of purposes is constructed, the general purpose, its aspects and subaspects are defined, and also the basic criteria of achievement of the purpose are formed. The main types of UML diagrams (diagram of use cases, classes, cooperation, sequence, states, activities, components, deployment) and the diagram are the essence of connections that specify the functioning of the system, namely: define the system and environment, analyze the main system components, describe data flows and the basics of business processes. As a result, the main features of the system and options for its construction are revealed, as well as the feasibility of implementing the selected version of the designed system is substantiated. The choice and substantiation of the means of solving the problem was made, as well as their technical characteristics were described. Thus, the optimal means are obtained that will be necessary for the implementation of an intelligent system for detecting misinformation in the news. The Vue.JS framework will be used to implement the web user interface, the Python 3 programming language, the Flask framework, SQLAlchemy ORM, Git and Docker technologies will be used to implement the backend services. PostgreSQL was chosen as the database management system. The main characteristics of the above tools, their advantages and disadvantages are described. The main software tools are JetBrains PyCharm, Atom, Google Chrome and Github. An analysis of their main functions, technical parameters and capabilities. During the execution of the section, an intelligent system for detecting misinformation in news was developed. The logical structure of each service (user management service, classification service, analytical data service and user interface service) was described. The scheme of the database is given, the purpose of all tables is described and the chosen structure is substantiated. The purpose, basic requirements, functions and characteristics of the developed intelligent system are determined. In particular, the requirements of software and hardware, hardware and software, on issues of technological and organizational nature. A user manual has been created that explains how the user should interact with the intelligent system to get the desired results. During the implementation of the economic justification of the feasibility of the project solution, the costs of software development and design of an intelligent system for detecting misinformation in the news were investigated. A number of necessary studies have been conducted to illustrate the effectiveness of the decision. According to the results of the study, it can be concluded that the developed system is cost-effective and competitive in the market. Therefore, the development of an intelligent system is appropriate.

Description

Keywords

Citation

Маленчак В. Б. Інтелектуальна система виявлення дезінформації у новинах : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „3.124.00.00 — Системний аналіз (освітньо-наукова програма)“ / Валентин Богданович Маленчак. — Львів, 2020. — 96 с.

Endorsement

Review

Supplemented By

Referenced By