Analysis of short unstructured documents using fuzzy significance scales and special procedures for economic information integration
Т. В. Какатунова
В статье предложен новый подход к автоматическому анализу коротких сообщений, поступающих на Интернет-порталы и электронную почту органов государственной власти.
Разработанная модель позволяет выполнять классификацию коротких неструктурированных текстовых документов при недостатке статистической информации и слабой степени пересечения тематических рубрик. Входными данными для алгоритма построения модели является множество рубрик и обучающая выборка, а его результатом являются нечеткие весовые коэффициенты значимых слов тезаурусов рубрик, что обеспечивает корректное представление характеристик документа и работу алгоритма рубрицирования (классификации).
Купить можно в магазинах:
ISBN-10: 5-04-225131-6
ISBN-13: 978-5-04-225131-3
Год выхода: 2019
Язык книги: en
Возрастные ограничения: 0+