Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі. – 2019. – Випуск 5

Permanent URI for this collection

Вісник Національного університету «Львівська політехніка»

Вісник Національного університету «Львівська політехніка» «Інформаційні системи та мережі» є правонаступником збірника наукових праць «Вісник Національного університету «Львівська політехніка». Серія: «Інформаційні системи та мережі» який започатковано у 1997 р. З врахуванням нумерації збірника наукових праць першому випуску нової серії було присвоєно черговий номер 315. У вступній статті до цього номеру (1997, № 315) нової серії збірника наукових праць відповідальний редактор доктор техн. наук, професор В. В. Пасічник задекларував місію видання: високофахово висвітлювати «прикладні аспекти інформатики, зокрема питання побудови iнформацiйних систем та мереж, якi ґрунтуються на новітніх iнформацiйних технологіях та передових методиках їx побудови». У ювілейному випуску місію видання було актуалізовано (2015, № 832). У журналі публікуються статті англійською та українською мовами. Вісник індексується в Google Scholar та Index Copernicus.

Вісник Національного університету «Львівська політехніка» «Інформаційні системи та мережі» / Національний університет "Львівська політехніка" ; відповідальний редактор В. В. Пасічник. – Львів : Видавництво Львівської політехніки, 2019. – № 5. – 132 с.

Вісник Національного університету "Львівська політехніка". Інформаційні системи та мережі

Зміст


3
14
26
40
53
62
70
78
90
101
116
125
134

Content


3
14
26
40
53
62
70
78
90
101
116
125
134

Browse

Recent Submissions

Now showing 1 - 13 of 13
  • Item
    Інформаційний сервіс рейтингування комерційного контенту
    (Видавництво Львівської політехніки, 2019-02-26) Верес, О. М.; Карпов, І. А.; Кісь, Я. П.; Рішняк, І. В.; Veres, Oleh; Karpov, Ihor; Kis, Yaroslav; Rishnyak, Ihor; Національний університет “Львівська політехніка”; Lviv Polytechnic National University
    Подано результати критичного аналізу чотирьох методів оцінювання рейтингу комерційного контенту інтернет-сервісу, а саме: “Просто плюс”; “Плюс/Мінус”; “Зірковий”; “Комбінований”. Підґрунтям розроблення моделі інформаційного сервісу обрано метод “Зірковий”, адже він надає розгорнуту оцінку із фіксованою шкалою значень. Побудовано та оптимізовано математичне забезпечення “Зіркового” методу для обчислення рейтингу контенту, в основі якого формула середнього арифметичного зваженого з врахуванням середньої кількості голосів та середнього рейтингу усіх електронних документів. Для можливості впливати на рейтинг введено контролюючий параметр k. Додано два неконтрольовані параметри: кількості продажів та завантажувань, які впливають на фактичний рейтинг контенту. Також, щоб позбутися залежності рейтингу між різними категоріями та через те, що величина рейтингу вийшла за межу у 5 зірок, було введено масштабування рейтингу для контенту, враховуючи максимальне значення рейтингу у відповідній категорії до інтервалу у 5 зірок. Введено відношення між рейтингом контенту та прибутком продавця і сервісу. Реалізовано задачу обчислення комісії за продаж контенту залежно від його рейтингу, що має мотивувати продавців підвищувати якість контенту, тим самим сервіс підвищуватиме рейтинг цього контенту. Метою рейтингування контенту є збільшення кількості продажів побудовою правдоподібних рейтингових списків. Розроблене програмне забезпечення для діючого проекту ehuub.com. Web-сервіс дає змогу швидко і просто продавати та формувати комерційний контент. Наведено приклади обчислення рейтингу та продемонстровано програмне забезпечення. Подальші дослідження будуть спрямовані на розвиток та вдосконалення інтелектуальної складової, що зменшить суб’єктивний вплив на формування значення контрольного параметра k.
  • Item
    Парсинг тексту термінологічних словників
    (Видавництво Львівської політехніки, 2019-02-26) Дорожинська, А. В.; Dorozhynska, Olena; Український мовно-інформаційний фонд НАНУ; Ukrainian Lingua-Information Fund of NAS of Ukraine
    Окреслено коло завдань, підходів і етапів розроблення технології парсинга тексту багатомовного тлумачного термінологічного словника. Дослідження проведено для “Словника української біологічної термінології”. Серед усього словникового розмаїття цей словник обрано тому, що термінологічні словники надають лексико-семантичну базу для подальшого створення систем інтелектуального опрацювання фахових текстів, у яких подається інформація з тих чи інших предметних галузей. Ця термінографічна праця обіймає нормативну загальнонаукову та широковживану термінологію біологічних наук, зафіксовану в сучасних енциклопедичних, загальномовних та спеціальних словниках, у науковій, науково-популярній, навчальній та інформативно-реферативній літературі. Дослідивши обраний словник, ми зможемо узагальнити модель його лексикографічної системи на інші предметні галузі, що створить передумови для формування цілісного багатогалузевого цифрового лексикографічного простору. Робота зі словниками, переведеними у комп’ютерні текстові формати, є дуже неефективною і потребує конвертування їх у формати лексикографічних баз даних, що є спеціальним завданням, не відомим класичній лексикографії. Це і складає зміст терміна “парсинг словників”. У процесі роботи побудовано модель лексикографічної системи, яку покладено в основу XML. Подальша робота із перетворення паперової версії словника на онлайн-систему будується на XML-файлі. Проаналізовано поліграфічне оформлення, організацію і структуру друкованого тексту словника з метою ідентифікації елементів концептуальної моделі Л-системи СУБТ. На основі концептуальної моделі побудовано структуру XML-документа, який пропонується використовувати як посередника між паперовою версією словника та його реалізацією як онлайнової лексикографічної системи. Надалі планується побудова універсальної процедури парсингу з удосконаленням структури XML-документа.
  • Item
    Мобільні інформаційні технології в задачах супроводу туриста під час екскурсії
    (Видавництво Львівської політехніки, 2019-02-26) Артеменко, О. І.; Кунанець, О. О.; Пасічник, Володимир Володимирович; Кунанець, Наталія Едуардівна; Artemenko, Olga; Kunanets, Oksana; Pasichnyk, Volodymyr; Kunanets, Nataliia; Буковинський університет м. Чернівці; Національний університет “Львівська політехніка”; Bukovinsky University of Chernivtsi; National Lviv Polytechnic University
    Проаналізовано особливості розроблення програмного забезпечення на платформі мобільних операційних систем для інформаційного супроводу туристів. Запропонована рекомендаційна система основана на використанні функціональних можливостей GPS-модулів смартфона з метою врахування поточного місця перебування користувача, а також актуальних відстаней до цільових об’єктів маршруту. Це, своєю чергою, є інформаційно-технологічним підґрунтям для реалізації функцій оптимізації екскурсійних маршрутів. Проаналізовано структуру і складові просторово-орієнтованих рекомендаційних систем, особливості їх використання при побудові екскурсійних маршрутів. Рекомендаційна система розпізнає серед множини показників важливі факти, вловлює схожість фактів, робить висновки з використанням індукції, аналогії, дедукції та оцінює результати своєї роботи. Алгоритм роботи рекомендаційної системи полягає в оптимізації екскурсійного маршруту засобами просторовоорієнтованих технологій. Автори провели типологічний поділ екскурсій, серед яких екскурсія, яка містить лише ті екскурсійні об’єкти, які відповідають сезону, багатотемна екскурсія історичного та сучасного спрямування, що передбачає огляд пам'яток історії та культури, будівель та споруд, природних об'єктів, місць знаменних подій, елементів благоустрою міста, промислових та сільськогосподарських виробництв, пам'ятних місць, пов'язаних з історичними подіями в житті нашого народу, розвитком суспільства і держави; огляд будівель та споруд, меморіальних пам'ятників, пов'язаних з життям і діяльністю видатних особистостей, творів архітектури і містобудування, будівель: житлових, громадських, промислових підприємств, культурного призначення, інженерних споруд (фортеці, мости, башти), мавзолев та ін. споруд, екскурсії природними об'єктами, такими як ліси, гаї, парки, річки, озера, ставки, заповідники, заказники, окремі дерева, реліктові рослини, перегляд експозицій державних і народних музеїв, картинних галерей, постійних і тимчасових виставок.
  • Item
    Process discovery method for distributed software systems with web interface
    (Видавництво Львівської політехніки, 2019-02-26) Батюк, А. Є.; Войтишин, В. В.; Batyuk, Anatolii; Voityshyn, Volodymyr; Національний університет “Львівська політехніка”; Lviv Polytechnic National University
    Як прикладна дисципліна, процес-майнинг виник два десятиліття тому, і упродовж останніх кількох років його методи отримують все ширше застосування на практиці. Ознакою, яка відрізняє процес-майнинг від класичного дата-майнигу, є фокусування на процесній природі оброблюваних даних. Активний розвиток ніші ринку програмного забезпечення процес-майнингу загострив актуальність задач, пов’язаних із підвищенням масштабованості його методів. Автори пропонують подальший розвиток методу Fuzzy Miner, що розширює його застосування до розподілених програмних системах з web-інтерфейсом. Для забезпечення вимог масштабованості розрахункові процедури реалізовано у різних частинах системи: найбільш ресурсоємні алгоритми виконуються на стороні сервера, тоді як менш ресурсоємні – на стороні web-клієнта. Своєю чергою, серверні компоненти належать до одного із логічних рівнів: даних або сервісів. Рівень даних відповідає за збереження даних у XES-форматі та збирання процесних метрик. Побудова графу процесу та взаємодія з клієнтською частиною забезпечується рівнем сервісів. Призначенням клієнтської web-програми є відбраження графу процесу, який будує сервер. Автоматична перевірка коректності реалізації розрахункової логіки забезпечується модульними та інтеграційними тестами. Рішення, реалізоване авторами, ґрунтується на відкритих програмних продуктах, що дає змогу знизити сумарну вартість програмної системи. На основі порівняння отриманих значень із результатами, одержаними за допомогою ProM 6.8 (було застосовано плагіни: Fuzzy Miner and Alpha++ Miner), зроблено висновок, що запропонована адаптація методу Fuzzy Miner забезпечує відображення поведінки, яка присутня в event-даних (що також успішно виконують відповідні ProM-плагіни). Своєю чергою, з погляду системної архітектури запропоноване рішення демонструє кращі характеристики масштабованості, тобто здатності нарощувати обчислювальні потужності з метою опрацювання більших обсягів event-даних порівняно із згаданими вище ProM-плагінами.
  • Item
    Analysis of the influence of sample rates on the Allan variance
    (Видавництво Львівської політехніки, 2019-02-26) Марусенкова, Т.; Marusenkova, Tetiana; НУ “Львівська політехніка”; Lviv Polytechnic National University
    Розглянуто проблематику інтерпретації графіка девіації Алана для сигналів сенсорів за умови, що частота дискретизації перевищує швидкість оновлення показів. Варіація Алана є стандартним інструментом аналізу шумових складових, неминуче присутніх у сигналах будь-яких інерційних сенсорів. Існує повністю визначений алгоритм розрахунку варіації Алана як для часової, так і для частотної областей. Після визначення варіації Алана як функції часу (або частоти) розраховують девіацію Алана (квадратний корінь варіації Алана) і будують її графік у логарифмічному форматі. Кожна ділянка цього графіка характеризує шум певного типу (білий шум, рожевий шум, випадкове блукання тощо). Очікується, що форма графіка девіації Алана загалом відповідає встановленому взірцю і може бути легко розпізнана. Однак на практиці форма графіка може істотно відрізнятися від книжкового шаблону. У такому випадку стає неочевидним, як інтерпретувати графік і чи він взагалі є придатним до використання. Ми спостерігали нетипові графіки девіації Алана для сигналів магнітометра, отриманих з частотою дискретизації, що перевищувала швидкість оновлення показів, завдяки чому виникла ідея про залежність форми графіка від частоти дискретизації. Метою статті є аналіз впливу частоти дискретизації на форму графіка девіації Алана та оцінювання придатності цього графіка за неправильно вибраної частоти дискретизації. Проведене нами імітаційне моделювання дало змогу якісно відтворити експериментальні результати. Показано, що частота дискретизації згенерованого білого шуму впливає на форму графіка. Цей самий висновок дозволяє зробити і фільтрування повторених точок вимірювання з реальних сигналів магнітометра. Наведено аналітичні розрахунки, що пояснюють і підтверджують вплив частоти дискретизації на форму графіка. Нами показано, що графік девіації Алана для сигналів, отриманих з частотою дискретизації, що перевищує швидкість оновлення показів, не придатний для застосування, якщо не фільтрували повторені точки вимірювання. Аналітичне пояснення цього факту підтверджено експериментально. Подано детальний опис процедури оцінювання придатності графіка девіації Алана за допомогою магнітометра.
  • Item
    Класифікація віброартрографічних сигналів з використанням хвилькового перетворення і технологій машинного навчання
    (Видавництво Львівської політехніки, 2019-02-26) Хома, Ю. В.; Khoma, Yurii; Національний університет “Львівська політехніка”; Lviv Polytechnic National University
    Віброартрографія як метод медичної діагностики призначений для об'єктивного оцінювання суглобової функції, зокрема артрокінематики колінного суглобу і базується на аналізі сигналу віброакустичної емісії. Віброартрографія хоч і поступається за ефективністю таким методам, як рентгенографія і магніторезонансна томографія (МРТ), безумовно, є достатньо чутливим методом для оцінювання ступеня дисфункції колінних суглобів. Наведено результати досліджень щодо побудови системи комп’ютерного опрацювання віброартрографічних сигналів. ВАГ-сигнали мають нестаціонарний характер, тому для їх аналізу у цьому дослідженні застосовано дискретне хвилькове перетворення, яке уможливлює не лише вивчення частотного вмісту сигналу, але і його локалізацію щодо часу. Новизна запропонованого підходу полягає у застосуванні дискретного діадичного хвилькового перетворення для очищення біосигналу від впливу дрейфу ізолінії і випадкових шумів, а також використання деталізуючих компонент для формування діагностично значущих ознак. Аналіз скалограми 6-рівневого хвилькового розкладу дав змогу виділити смугу від 78 до 780 Гц, де зосереджена корисна діагностично значуща інформація. Реконструкція сигналу у вказаній смузі забезпечила усунення дестабілізуючих впливів дрейфу ізолінії та високочастотних шумів. За результатами хвилькового перетворення було вибрано такі прості дескриптори, як стандартне відхилення, мода і середнє значення модуля окремих компонент сигналу, що відповідають рівням розкладу. Для класифікації сигналів застосовано один із найпростіших методів машинного навчання – лінійну регресію. Досліджено показники якості класифікації для випадку двох і п’яти класів дисфункції колінного суглоба. У випадку двох класів отримано такі результати: точність на рівні 94 %, чутливість 100 % і специфічність 88 %. Для п'яти класів точність становить 83 %, чутливість та специфічність 89 % і 62 % відповідно. Для двох груп одержано високу точність і чутливість класифікатора, а для п’яти класів результати класифікації були посередні. При цьому найбільше перекриття дескрипторів спостерігається для сусідніх класів. Основним обмеженням у цьому дослідженні була мала кількість сигналів – по 26 для кожного з класів. Тривалість кожного запису 6 секунд за частоти дискретизації 10 кГц. Розподіл записів на окремі класи відбувався на основі інформації з відповідних МРТ-знімків кожного пацієнта.
  • Item
    Ігровий метод кластеризації онтологій
    (Видавництво Львівської політехніки, 2019-02-26) Кравець, П. О.; Буров, Є. В.; Литвин, В. В.; Kravets, Petro; Burov, Evgeniy; Lytvyn, Vasyl; Національний університет “Львівська політехніка”; Lviv Polytechnic National University
    Розглянуто актуальну проблему кластеризації онтологій для оптимізації операцій інтелектуального опрацювання даних в умовах невизначеності, зумовленої неточністю або неповнотою даних про предметну область. Кластеризація онтологій – це процес автоматичного розділення множини онтологій на групи (кластери) на основі ступеня їхньої подібності. Для розв’язування задачі кластеризації необхідно задати міри близькості онтологій, вибрати або розробити алгоритм кластеризації та виконати змістовну інтерпретацію результатів кластеризації. Для кластеризації онтологій в умовах невизначеності запропоновано застосувати стохастичний ігровий метод. Повторювальна стохастична гра полягає у реалізації керованого випадкового процесу вибору кластерів онтологій. Для цього закріплені за онтологіями інтелектуальні агенти випадково, одночасно і незалежно вибирають один із кластерів у дискретні моменти часу. Для агентів, що обрали один кластер, обчислюють поточну міру подібності онтологій, яка може враховувати близькість концептів, атрибутів та відношень між концептами. Цю міру використовують для адаптивного перерахунку змішаних стратегій гравців. Збільшуються імовірності вибору тих кластерів, поточний склад яких призвів до зростання міри подібності онтологій. У ході повторювальної гри агенти сформують вектори змішаних стратегій, які забезпечать максимізацію усереднених мір подібності розділених на кластери онтологій. Для розв'язування задачі ігрової кластеризації онтологій розроблено адаптивний марківський рекурентний метод на основі стохастичної апроксимації модифікованої умови доповняльної нежорсткості, справедливої у точках рівноваги за Нешем. Запропонований ігровий метод має фільтрувальні властивості щодо викидів у вхідних даних і практично не залежить від закону розподілу випадкових завад. Комп'ютерне моделювання підтвердило можливість застосування моделі стохастичної гри для кластеризації онтологій із врахуванням факторів невизначеності. Збіжність ігрового методу забезпечується дотриманням фундаментальних умов та обмежень стохастичної оптимізації. Достовірність експериментальних досліджень підтверджується повторюваністю отриманих результатів для різних послідовностей випадкових величин. Результати роботи доцільно використати для розв'язування задач інтелектуального аналізу даних, усунення дублювання інформації в базах знань, зменшення невизначеності у межах кластера онтологій, виявлення новизни інформації, організації високорівневої семантичної взаємодії між агентами під час розв’язування ними спільної задачі.
  • Item
    Застосування різницевих колірних моделей із цілими і напівцілими коефіцієнтами для стиснення зображень у модифікованому графічному форматі JPEG
    (Видавництво Львівської політехніки, 2019-02-26) Шпортько, О. В.; Бомба, А. Я.; Янчук, П. С.; Шпортько, В. О.; Shportko, Alexander; Bomba, Andrey; Yanchuk, Peter; Shportko, Veronika; ПВНЗ “Міжнародний економіко-гуманітарний університет імені академіка Степана Дем’янчука”; Рівненський державний гуманітарний університет; Національний університет “Львівська політехніка”; Academician Stepan Demianchuk International University of Economics and Humanities; Rivne State Humanitarian University; Lviv Polytechnic National University
    Запропоновано спосіб та відповідні алгоритми зменшення розмірів стиснутих зображень та прискорення їх декодування в модифікованому форматі JPEG завдяки використанню замість колірної моделі YCbCr альтернативних різницевих колірних моделей як з цілими, так і з напівцілими коефіцієнтами. Із застосуванням запропонованих різницевих колірних моделей зменшуються розміри файлів окремих стиснутих зображень внаслідок міжкомпонентної декореляції та прискорюється їх декодування з використанням операцій із цілими числами та операцій побітового зсуву замість операцій з дійсними чи масштабованими цілими числами. Основні висновки за результатами дослідження: 1. Не існує універсальної колірної моделі, яка дала б змогу оптимально виконати міжкомпонентну декореляцію для всіх типів зображень. Навіть для зображень одного типу оптимальними (в сенсі декореляції) можуть виявитися різні колірні моделі. 2. У графічних форматах для стиснення окремих зображень замість колірних моделей із дійсними коефіцієнтами доцільно використовувати різницеві колірні моделі з цілими чи напівцілими коефіцієнтами, якщо вони прогнозовано зменшують коефіцієнт стиснення. Такі колірні моделі в середньому прискорюють декодування на 3 %. 3. Для стиснення зображень без втрат варто застосовувати різницеві колірні моделі з цілими коефіцієнтами, а при компресії зображень із втратами – різницеві колірні моделі з напівцілими коефіцієнтами. 4. При стисненні зображень із втратами колірні моделі із напівцілими коефіцієнтами не збільшують діапазон можливих значень окремих компонентів та суттєво не впливають на якість зображень. Якщо потрібно мінімізувати RMSE, то несучу компоненту в різницевій колірній моделі варто сформувати з напівсуми компонентів. Коли ж необхідно максимально прискорити декодування, то несучу компоненту в різницевій колірній моделі доцільно сформувати з однієї зі вхідних компонентів
  • Item
    Інтеграція та супровід проектними командами інформаційно- технологічних продуктів впродовж життєвого циклу
    (Видавництво Львівської політехніки, 2019-02-26) Верес, О. М.; Пасічник, Володимир Володимирович; Кунанець, Наталія Едуардівна; Veres, Oleg; Pasichnyk, Volodymyr; Kunanets, Nataliia; Національний університет “Львівська політехніка”; National University “Lviv Polytechnic”
    Підтверджено, що інтелектуальні системи розробляли із застосуванням єдиних науково-методичних принципів та низки вимог, формуванню яких передує ґрунтовний та всебічний системний аналіз суб’єктів діяльності. Проаналізовано історію формування автоматизованих систем управління вищим навчальним закладом у Національному університеті “Львівська політехніка”. Подано концепт DevOps як інноваційної парадигми формування та функціонування команд ІТ-проектів. Парадигму DevOps подають автори як комплекс інформаційних технологій, які в системному поєднанні забезпечують високоефективне функціонування інтегрованої команди ІТ-проекту – системних аналітиків, розробників, інтеграторів та експлуатаційників, що реалізує та підтримує його на всіх етапах життєвого циклу. DevOps – це набір комунікаційних практик, які сприяють швидкому і надійному створенню, тестуванню та впровадженню передових інформаційно-технологічних продуктів у промислову експлуатацію. Концепція DevOps основана на побудові ефективної культури комунікування, яка забезпечує продуктивну співпрацю між усіма членами команди проекту. Культура комунікування є одним з найважливіших факторів успіху втілення концепції DevOps. Формування та реалізація концепції спільної відповідальності, прозорості та швидшого зворотного зв'язку є надійним базисом функціонування високофахової команди DevOps. Команди, які працюють над інформаційно-технологічним проектом (ІТпроектом), доволі часто не дотримуються принципів внутрішньокомандного “системного мислення”. За внутрішньою природою комплекс інформаційних технологій DevOps передбачає використання саме такої методології “системного мислення”, що загалом позитивно впливає на загальну успішність роботи команди, яка реалізовує проект. Концепція DevOps усуває бар'єри між традиційно ізольованими групами розробників та фахівців, що експлуатують систему, об’єднуючи їх в єдину комплексну команду. Згідно з концепцією DevOps члени команди працюють з метою якнайповнішої оптимізації та підвищення продуктивності праці розробників, а також підвищення надійності продукту під час його промислової експлуатації.
  • Item
    Інформаційна система державного управління та актуальність її впровадження в Україні
    (Видавництво Львівської політехніки, 2019-02-26) Яцюк, С. В.; Кірюшатова, Т. Г.; Yatsiuk, Sergiy; Kiryushatova, Tetiana; Херсонський національний технічний університет; Kherson National Technical University
    Доведено важливість використання сучасних програмно-технічних засобів у житті громадянина і держави. Розглянуто питання інтеграції інформаційних технологій і досягнень комп’ютерної техніки у процеси діяльності державних органів у різних сферах, наведено приклади доступних громадянам України електронних ресурсів, що допомагають вирішувати питання взаємодії громадянина і держави, проаналізовано їхні переваги і недоліки. Визначено проблеми, які притаманні функціонуванню державних органів в Україні, які можуть бути повністю або частково вирішені за допомогою сучасних інформаційних технологій. Доведено необхідність створення інформаційної системи державного управління (ІСДУ) та обґрунтовано актуальність впровадження її в Україні, сформульовано перелік критеріїв, які система повинна задовольняти, і питань, які вона повинна вирішувати. Наведено загальну структуру ІСДУ, виділено її елементи та описано їхню взаємодію. Наведено перелік модулів, які можуть бути включені у систему. Розглянуто питання розгортання системи за вертикаллю і горизонталлю на максимально можливу кількість ланцюгів – елементів інфраструктури; описані приклади кінцевих ланцюгів розгорнутої системи. Досліджено питання інтеграції в ІСДУ модуля штучного інтелекту, визначено переваги його використання у державній сфері. Проаналізовано залежність людського фактору і прозорості управління. Розглянуто проблему цілісності й адекватності даних систем. Як підсистему контроля коректності роботи запропоновано додати модуль запобігання помилкам. Описано структуру, загальний принцип дії й алгоритм роботи системи реагування на запити громадян (СРЗГ); розглянуто питання і проблеми, які можуть виникнути під час її реалізації, а також шляхи їх вирішення. Досліджено питання доступу до СРЗГ. Визначено критерії до програмних інструментів, які можна використати для реалізації системи. Запропоновано реалізувати СРЗГ як вхідну точку для створення інформаційної системи державного управління.
  • Item
    Using transitivity information for morphological and syntactic disambiguation of pronouns in Ukrainian
    (Видавництво Львівської політехніки, 2019-02-26) Kotsyba, Natalia; Moskalevskyi, Bohdan; Samsung Research Poland; Institute for Ukrainian
    Наведено короткий опис декількох електронних ресурсів української мови, а саме два синтаксичні корпуси: Золотий стандарт (біля 130 тис. слів), анотований вручну деревами залежностей Universal Dependencies (https://universaldependencies.org/), що становить тренувальні дані для синтаксичного парсера, та великий (майже 3 мільярди слів) автоматично анотований Загальний синтаксичний корпус (Звідусіль), а також валентний словник українських дієслів. Ці мовні ресурси розробляються в Інституті Української, ГО від 2015 року та є доступні для некомерційного вживання під адресою установи https://mova.institute/. Також описано експериметальне використання валентного словника для покращення якості роботи синтаксичного парсера з використанням машинного навчання та ґрунтовної теоретико-лінгвістичної бази. Прикладом були конструкції особово-присвійних займенників “його”, “її”, “їх”, кожен з яких має понад 24 можливі морфологічні таги, у сполученні з ґерундієвими іменниковими формами, що також можуть мати різні граматичні інтерпретації (із ключовими семантичними ролями або без них). Вибір правильної інтерпретації у багатьох випадках вимагає ідентифікації семантичної ролі іменника, що його заступає у тексті займенник, і/або розв’язання кореференції (анафори). З одного боку, це ускладнює процес уоднозначнення; з іншого боку, ми отримуємо бонус для якісного автоматичного аналізу тексту, необхідного для багатьох застосувань в обробці природних мов (NLP). Проаналізовано типові помилки автоматичного парсингу для досліджуваної конструкції та подано практичні рекомендації до створення тренінгових даних для кращого навчання парсера у майбутньому. Стаття є практичним продовженням лінгвістичного дослідження (Kotsyba, Moskalevskyi 2018 [11]), де подано теоретичне обгрунтування рішення проблеми інтерпретації займенників та ґерундієвих іменників для української мови на тлі інших словянських мов.
  • Item
    Просування інтернет-ресурсів з використанням технологій голосового пошуку
    (Видавництво Львівської політехніки, 2019-02-26) Басюк, Т. М.; Василюк, А. С.; Basyuk, Taras; Vasyluk, Andrii; Національний університет “Львівська політехніка”; Lviv Polytechnic National University
    Розроблено методологічне підґрунтя для побудови системи підтримки прийняття рішень у галузі просування інтернет-ресурсів при використанні технологій голосового пошуку. Проаналізовано особливості пошукового просування інтернет-ресурсів із використанням технологій голосового пошуку (Voice Search SEO), у результаті якого виявилось, що сьогодні впровадження мобільних пристроїв та поширення широкосмугових мереж передавання даних потребує застосування нових підходів до просування інтернет-ресурсів з метою їх оптимізації під особливий тип пошуку – Voice Search SEO. Виявлено фактори, що найбільше впливають на голосове просування, що дало змогу здійснити їх структурування та навести рекомендації щодо застосування. Основними факторами, які безпосередньо впливають на відображення ресурсу в пошуковій видачі, є цифровий слід та розширений сніпет (нульова позиція). Розроблено алгоритм просування інтернет-ресурсів з використанням технологій голосового пошуку, що дало змогу описати основні кроки, які необхідно здійснити з метою популяризації веб-сайту. Основні дії: постановка цілей пошукового просування, аналіз інтернет-ресурсів конкурентів, формування семантичного ядра інтернет-ресурсу, внутрішня оптимізація сторінок ресурсу, публікація інтернет-ресурсу, зовнішня оптимізація сторінок ресурсу. Cформовано рекомендації, яких необхідно дотримуватись у процесі просування під голосові запити. Серед яких визначено: швидкість завантаження сторінки (оцінювати швидкість завантаження доцільно за допомогою сервісу PR-CY); безпека сторінки та з’єднання (встановлення SSL-сертифікату та використання захищеного протоколу з додатковим шаром шифрування/автентифікації HTTPS); читабельний контент (використання підібраного міжрядкового інтервалу, коротких речень та мінімальне використання заголовних букв); адаптація під мобільні платформи (оцінити відображення ресурсу доцільно за допомогою інструменту Google Search Console); використання мікроданих (доцільним є використання спеціалізованих сервісів Google My Business/Bing Places for Business, що дають змогу оптимізувати пошукові каталоги та задати необхідні параметри); структурування контенту (у коді ресурсу, який просувається, повинні міститись метадані, за якими пошукові боти зможуть зрозуміти, якого виду контент міститься на сторінках); використання voicefriendly фраз (передбачає включення в текстовий контент на сторінках сайту фраз, які можуть використовувати користувачі при пошуку за допомогою голосу, оцінювання можна здійснити з використанням статистичного сервісу Serpstat).