Інформаційна системи аналізу текстів програм на мові SVF

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет "Львівська політехніка"

Abstract

У першому розділі моєї дипломної роботи розглянуто класи інформаційних систем. Проведено аналіз поняття "інформаційна система", їх історії, а також розглянуто класифікацію інформаційних систем за різними критеріями, виокремивши типи цих систем. Класифікація інформаційних систем включає: - за ступенем автоматизації, - за сферою призначення, - за місцем діяльності ІС, - за функціональним призначенням. Аналіз розглядається як метод наукового дослідження, що базується на вивченні складових частин і елементів досліджуваної системи. Аналіз є необхідною стадією наукового дослідження, під час якої дослідник виявляє опис досліджуваного об'єкта, його будову, склад, властивості та ознаки. Також розглянуто аналіз тексту як процес отримання високоякісної інформації з тексту, зазвичай за допомогою статистичного навчання на основі шаблонів. У другому розділі дипломної роботи висвітлено задачу, поставлену перед парсером (або граббером), який визначається як програма для розділення текстової інформації на окремі значущі лексеми з метою проведення аналізу. Синтаксичний аналіз, або парсинг, у сфері інформатики — це процес аналізу вхідної послідовності символів з метою розбору граматичної структури відповідно до визначеної формальної граматики. Зазвичай результат роботи парсера зберігається в базі даних, але це не обов'язково: у простих випадках може використовуватися звичайний вивід на екран. У перспективі, на основі результатів програми, планується розробка рекомендацій для подальшого виправлення помилок. У третьому розділі дипломної роботи детально розглянуто Factory Method. Цей шаблон проектування надає підкласам інтерфейс для створення екземплярів конкретного класу, дозволяючи спадкоємцям визначати, який саме клас створювати. Перевагою є уникнення вбудовування в код залежностей від конкретних класів, але недолік полягає в зростанні кількості підкласів. Зазначаючи результати аналізу тексту, виявлено, що тема комп'ютерного аналізу тексту ще не отримала вичерпного вивчення, оскільки відсутнє конкретне визначення. Процес розробки комп'ютерного аналізу стикається з численними труднощами, які, хоча і вирішувані, відбуваються на сповільненому темпі. Отримані дані є новими у дослідженні аналізу текстів, і існують спроби систематизувати наявні знання та поєднати їх із новими. Переваги комп'ютерного аналізу порівняно з ручним дослідженням текстів, на мою думку, є очевидними, забезпечуючи ефективне структурування результатів у вигляді таблиць, графіків та визначень та заощаджуючи час.
In the first chapter of my thesis, classes of information systems are described. The concept of "information system" is analyzed, including its history, and the classification of information systems is traced. The types of these systems are identified based on criteria such as: - Degree of automation - Purpose area - Location of IS activity - Functional purpose Analysis is considered a method of scientific research involving the study of components and elements of the researched system. It is an integral part of any scientific investigation, typically constituting its initial stage, where the researcher identifies the description of the studied object, its structure, composition, properties, and features. Text analysis is the process of obtaining high-quality information from the text, usually using statistical learning based on templates: the input text is segmented using templates, and then data processing is performed. The concept of SVF (Serial Vector Format) is analyzed in my work. SVF is a file format containing boundary scan vectors for sending electronic circuits using the JTAG interface. Boundary scan vectors consist of data to be sent to the device and data expected to be sent back. SVF is designed to encourage the reuse of sequential vectors throughout the product life cycle, from the initial design phase to deployment in the field and all phases in between. The main commands in an SVF file are the transfer of data to the instruction register (SIR command) and the transfer to the data register (SDR command). The second chapter of my thesis begins with the formulation of the problem. A parser (or grabber) is a program designed to split textual information into individual meaningful lexemes for analysis. Syntactic analysis (parsing) in computer science is the process of analyzing an input sequence of symbols to parse the grammatical structure according to a specified formal grammar. The parser's results are typically stored in a database, but this is not mandatory; a simple output to the screen may suffice in a straightforward case. In the future, recommendations for further error correction will be generated based on the program's results. In the third chapter, I described the Factory Method. The Factory Method is a design pattern that provides subclasses with an interface for creating instances of a certain class. At the time of creation, descendants can determine which class to instantiate. Advantages include relieving the designer from embedding program-dependent classes in the code. However, a disadvantage is the emergence of an additional level of subclasses. Thus, in describing text analysis, it was found that the field of computer text analysis is not thoroughly studied due to the lack of a specific definition. It is evident that there are many challenges in the development of computer analysis, which, though solvable, occur at a slowed pace. The obtained data are novel in text analysis research. There are attempts to structure existing knowledge in this area and synthesize it with new information. The advantages of computer analysis over manual text research, in my opinion, are obvious. It enables time savings in structuring results, formatting them into tables, graphs, and definitions.

Description

Keywords

Citation

Данилюк Т. О. Інформаційна системи аналізу текстів програм на мові SVF : кваліфікаційна робота на здобуття освітнього ступеня магістр за спеціальністю „8.126.00.01 — Інформаційні системи та технології“ / Тарас Олександрович Данилюк. — Львів, 2023. — 114 с.

Endorsement

Review

Supplemented By

Referenced By