Применение нечетких деревьев решений для рубрицирования неструктурированных текстовых документов небольшого размера

Ежедневно на Интернет-порталы органов государственной власти поступает большое количество электронных обращений (заявлений, предложений или жалоб), представленных в неструктурированном текстовом виде. Качество и скорость автоматической обработки указанных сообщений напрямую зависит от правильности их классификации (отнесения к конкретной предметной области), в основе которой лежат их отличительные особенности.
Однако специфика таких сообщений (небольшой размер, наличие ошибок, отсутствие четкой структуры и т.д.) не позволяет использовать известные методы рубрицирования текстовых документов. Авторами разработана модель рубрицирования электронных неструктурированных текстовых документов с учетом синтаксических связей и ролей слов в предложениях на основе нечеткого дерева решений. Построение дерева решений основано на анализе степени пересечений словарей рубрик, а также расстояний между рубриками в n-мерном пространстве признаков. Данная модель позволяет более точно рубрицировать электронные неструктурированные текстовые документы в условиях взаимосвязанных рубрик, а также повысить оперативность обработки поступивших документов.
- Авторы:М. И. Дли, О. В. Булыгина, П. Ю. Козлов
- Серия: Прикладная информатика: Научные статьи
- Жанр:Техническая литература
- Страницы: 11
- Формат: fb2, epub, pdf, txt
Советуем прочитать похожую литературу

Трёхуровневая нечеткая когнитивная модель для анализа процессов...

Способы интеграции информационных систем субъектов экономической...

Управление жизненным циклом экономической информационной системы с...

Формирование структуры интеллектуальной системы анализа и...

Developing the economic information system for automated analysis...
