Статистика появи слів у природних і рандомних текстах

dc.citation.journalTitleВісник Національного університету «Львівська політехніка». Серія: Інформаційні системи та мережі
dc.contributor.affiliationЛьвівський національний університет імені Івана Франка
dc.contributor.affiliationПриродничий коледж Львівського національного університету імені Івана Франка
dc.contributor.authorКушнір, О. С.
dc.contributor.authorАльфавіцький, М. А.
dc.contributor.authorДзіковський, В. Є.
dc.contributor.authorІваніцький, Л. Б.
dc.contributor.authorРихлюк, С. В.
dc.contributor.authorСокульський, В. І.
dc.description.abstractЕкспериментально досліджено статистичні розподіли, що описують появу слів у кількох природних текстах, а також похідних від них рандомних текстах. Показано, що масова функція ймовірності відповідних інтервалів між словами є практично однаковою для природних і рандомних текстів і виявляє важкий вейбулівський хвіст, що не узгоджується із суто стохастичним характером цих інтервалів. Помітні відхилення динаміки зростання словника природних і рандомних текстів від динаміки, передбаченої степеневим законом Гіпса, а також кросовер у словнику одного з природних текстів підтверджують потребу в узагальненні цього закону.
dc.description.abstractWe study experimentally statistical distributions that describe the appearance of words in a number of natural texts, as well as in the random texts derived on their basis. It is shown that the probability mass function of the respective intervals between words is practically the same for the natural and random texts and manifests a fat tail, which is inconsistent with purely stochastic character of those intervals. Significant deviations of the vocabulary growth dynamics found for the natural and random texts from the dynamics predicted by the power Heaps’ law, together with a crossover found in the dictionary of one of the natural texts, confirm a need in generalization of that law.
dc.identifier.citationСтатистика появи слів у природних і рандомних текстах / О. С. Кушнір, М. А. Альфавіцький, В. Є. Дзіковський, Л. Б. Іваніцький, С. В. Рихлюк, В. І. Сокульський // Вісник Національного університету «Львівська політехніка». Серія: Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2017. — № 872. — С. 162–178.
dc.identifier.citationenStatistics of words occurrences in natural and random texts / O. S. Kushnir, M. A. Alfavitskyi, V. Ye. Dzikovskyi, L. B. Ivanitskyi, S. V. Rykhliuk, V. I. Sokulskyi // Visnyk Natsionalnoho universytetu "Lvivska politekhnika". Serie: Informatsiini systemy ta merezhi. — Lviv : Vydavnytstvo Lvivskoi politekhniky, 2017. — No 872. — P. 162–178.
dc.publisherВидавництво Львівської політехніки
dc.relation.ispartofВісник Національного університету «Львівська політехніка». Серія: Інформаційні системи та мережі, 872, 2017
dc.rights.holder© Національний університет „Львівська політехніка“, 2017
dc.rights.holder© Кушнір О. С., Альфавіцький М. А., Дзіковський В. Є., Іваніцький Л. Б., Рихлюк С. В., Сокульський В. І., 2017
dc.subjectприродні тексти
dc.subjectрандомні тексти
dc.subjectстатистичні закони лінгвістики
dc.subjectрозподіли з важким хвостом
dc.subjectnatural texts
dc.subjectrandom texts
dc.subjectstatistical laws of linguistics
dc.subjectfattailed distributions
dc.titleСтатистика появи слів у природних і рандомних текстах
dc.title.alternativeStatistics of words occurrences in natural and random texts


