Кафедра комп'ютеризованих систем автоматики
Permanent URI for this communityhttps://ena.lpnu.ua/handle/ntb/62531
Browse
Item Динамічне ранжування контенту з використанням класифікації тексту(Національний університет "Львівська політехніка", 2024) Бешта, Ярослав Тарасович; Beshta, Yaroslav Tarasovych; Степаняк, Михайло Васильович; Національний університет "Львівська політехніка"Магістерська кваліфікаційна дипломна робота присвячена аналізу та дослідженню методів динамічного ранжування контенту з використанням адаптивної класифікації тексту. У дослідженні розглянуто широкий спектр питань, що включають класифікацію текстових даних, аналіз існуючих алгоритмів обробки та оцінку ефективності запропонованих методів у контексті оптимізації роботи інформаційних систем. Тема роботи охоплює важливі аспекти інтерактивної взаємодії користувачів із контентом, які спрямовані на забезпечення персоналізованих і релевантних результатів. Зібрані дані підкреслюють значення таких елементів, як адаптивна класифікація тексту, яка враховує зміни у вподобаннях користувачів, і алгоритми ранжування, які впроваджують контекстуальні та тематичні зв’язки. Ці методи мають вирішальне значення для функціонування сучасних інформаційних систем, включно з пошуковими платформами, новинними агрегаторами та соціальними мережами. Робота також акцентує увагу на важливості попередньої обробки текстових даних, яка включає токенізацію, лематизацію, виділення сутностей і визначення ключових слів. Цей етап є критично важливим для забезпечення точності і швидкості обчислень на наступних етапах класифікації та ранжування. Об'єктом дослідження є процеси динамічного ранжування контенту та обробки текстових даних у сучасних інформаційних системах. Предметом дослідження є алгоритми адаптивної класифікації тексту та методи ранжування, які забезпечують точність, релевантність і персоналізацію результатів для користувачів. Метою роботи є аналіз і розробка ефективного підходу до динамічного ранжування контенту з використанням адаптивних моделей для покращення роботи інформаційних систем у реальному часі. 8 У першому розділі, "Огляд і аналіз сучасних систем ранжування контенту", проведено детальний аналіз існуючих підходів до обробки даних у пошукових системах, новинних агрегаторах і соціальних мережах. Основну увагу приділено проблемам релевантності, контекстуальності й адаптивності систем, а також недолікам, пов'язаним із недостатньою персоналізацією, відсутністю багатомовної підтримки та маніпулятивним контентом. Аналіз показав, що традиційні методи ранжування не завжди враховують змінні потреби користувачів і виклики багатомовного середовища. Другий розділ, "Обґрунтування вибору методів і технологій", присвячено вибору ефективних інструментів і платформ для реалізації адаптивних алгоритмів класифікації тексту та динамічного ранжування контенту. Особливу увагу приділено вибору обчислювальних платформ, бібліотек для обробки тексту (таких як SpaCy і TensorFlow), а також методів інтеграції з великими базами даних і API. У розділі наведено обґрунтування вибору алгоритмів машинного навчання, які забезпечують адаптивність до змін користувацьких уподобань і поведінки. Третій розділ зосереджено на розробці та реалізації алгоритму динамічного ранжування контенту з урахуванням сучасних викликів. У ньому описано методологію побудови системи, зокрема її архітектуру, інтеграцію модулів обробки природної мови (NLP) і класифікації тексту, а також механізм адаптивного ранжування. Особливу увагу приділено зворотному зв’язку з користувачем, автоматичному інкрементальному навчання алгоритмів та інтеграції модерації для виявлення маніпулятивного або небажаного контенту. Результати досліджень показали ефективність запропонованих методів у контексті зменшення затримок обробки, підвищення точності класифікації та релевантності контенту. У межах експериментального тестування система продемонструвала на 15% вищу швидкість ранжування та на 12% точнішу класифікацію порівняно з аналогами. 9