Кафедра інформаційних систем та мереж

Permanent URI for this communityhttps://ena.lpnu.ua/handle/ntb/62340

Browse

Search Results

Now showing 1 - 1 of 1
  • Thumbnail Image
    Item
    Інтелектуальна інформаційна система виявлення плагіату в текстах з інформаційних технологій
    (Національний університет "Львівська політехніка", 2022) Геряк, Юрій Миколайович; Heriak, Yurii Mykolaiovych; Берко, Андрій Юліанович; Національний університет "Львівська політехніка"
    В сучасному інформаційному світі, де зростає кількість текстів, що публікуються в мережі Інтернет, зростає і ймовірність того, що деякі з цих текстів можуть містити плагіат. Поняття «плагіат» описується у науковій літературі наступними визначеннями: - «оприлюднення (опублікування) повністю або частково чужого твору під іменем особи, яка не є автором цього твору» [1]; - «привласнення авторства на чужий твір науки, літератури, мистецтва або на чуже відкриття, винахід чи раціоналізаторську пропозицію, а також використання у своїх працях чужого твору без посилання на автора»[2, 365-372]; - «вид порушення прав автора або винахідника, що полягає у незаконному використанні під своїм ім’ям чужого твору (наукового, літературного, музичного) або винаходу, раціоналізаторської пропозиції (повністю або частково) без вказівки джерела запозичення...» [3, 601]; До поняття плагіат також можна віднести неправомірні дії з примусом до співавторства[4]. Основна проблема полягає в тому, що плагіат стає все більш поширеним явищем, і він може мати негативний вплив на різні аспекти життя, включаючи науку, бізнес і освіту. При цьому виявлення плагіату залишається складною задачею, особливо якщо він маскується під авторський текст або відбувається в багатоавторних текстах. Розвиток інформаційних технологій надає можливості для розробки інтелектуальних інформаційних систем, які здатні виявляти плагіат у текстах шляхом порівняння їх з базою даних із відомими текстами. Такі системи можуть допомогти уникнути плагіату та зберегти авторські права на інтелектуальну власність. Однак, розробка такої системи є складною задачею, і потребує використання різноманітних методів машинного навчання, обробки природньої мови та інших сучасних інформаційних технологій. Об’єкт дослідження. Об’єктом дослідження можна виділити процес виявлення плагіату в текстах з інформаційних технологій та самі інформаційні тексти, які можуть містити елементи плагіату. Предмет дослідження. В свою чергу, предметом дослідження є інтелектуальна інформаційна система виявлення плагіату в текстах з інформаційних технологій, використовуючи засоби та методи машинного навчання. Мета дослідження. Метою дослідження є розробка та реалізація інтелектуальної інформаційної системи для виявлення плагіату в текстах з інформаційних технологій. Для досягнення мети необхідно вирішити наступні завдання: 1. Аналіз існуючих методів та підходів до виявлення плагіату в текстах з використанням інформаційних технологій. 2. Розробка алгоритмів та моделей машинного навчання для виявлення плагіату в текстах з інформаційних технологій. 3. Розробка та імплементація програмного забезпечення для побудови інтелектуальної інформаційної системи. 4. Експериментальне дослідження розробленої системи та порівняння її ефективності з існуючими методами виявлення плагіату. 5. Аналіз результатів дослідження та формулювання висновків щодо можливості використання розробленої системи в практичній діяльності для контролю за оригінальністю текстів у сфері інформаційних технологій. Аналіз певної кількості наукових статей та досліджень показав, що проблема виявлення плагіату є важливою в сучасному світі і вимагає постійної уваги та розробки нових методів та алгоритмів для її вирішення, а застосування машинного навчання для виявлення плагіату є актуальною та перспективною темою досліджень. У роботі розглянуто різні методи виявлення плагіату, включаючи метод векторного порівняння, який ґрунтується на використанні векторних представлень слів. Було проведено аналіз переваг та недоліків програмних та системних засобів вирішення проблеми та обрано мови програмування реалізації системи, набір допоміжних інструментів, інструмент автоматизованої збірки проектів, сервер розгортання. Для реалізації інтелектуальної складової системи використовується мова програмування Python, а також бібліотеки машинного навчання, зокрема Pandas, Flask та scikit-learn. Розроблена система здатна працювати з текстами різної довжини та форматування, що дозволяє застосовувати її у багатьох галузях, де важлива автентичність текстів. Результати дослідження свідчать про можливість використання даної системи для підвищення репутації авторів та видавництв, які дотримуються правил інтелектуальної власності. Основні завдання роботи полягали у вивченні теорії плагіату та методів його виявлення, виборі оптимального методу виявлення плагіату для застосування у розробленій системі, розробці імплементації алгоритму методу векторного порівняння та створенні інтерфейсу взаємодії з користувачем. Розроблена система може забезпечити ефективний та точний пошук плагіату в текстах з інформаційних технологій, що дозволить забезпечити більш високу якість контролю за оригінальністю текстів.