Применение нечетких деревьев решений для рубрицирования неструктурированных текстовых документов небольшого размера

Ежедневно на Интернет-порталы органов государственной власти поступает большое количество электронных обращений (заявлений, предложений или жалоб), представленных в неструктурированном текстовом виде. Качество и скорость автоматической обработки указанных сообщений напрямую зависит от правильности их классификации (отнесения к конкретной предметной области), в основе которой лежат их отличительные особенности.
Однако специфика таких сообщений (небольшой размер, наличие ошибок, отсутствие четкой структуры и т.д.) не позволяет использовать известные методы рубрицирования текстовых документов. Авторами разработана модель рубрицирования электронных неструктурированных текстовых документов с учетом синтаксических связей и ролей слов в предложениях на основе нечеткого дерева решений. Построение дерева решений основано на анализе степени пересечений словарей рубрик, а также расстояний между рубриками в n-мерном пространстве признаков. Данная модель позволяет более точно рубрицировать электронные неструктурированные текстовые документы в условиях взаимосвязанных рубрик, а также повысить оперативность обработки поступивших документов.
- Авторы:М. И. Дли, О. В. Булыгина, П. Ю. Козлов
- Серия: Прикладная информатика: Научные статьи
- Жанр:Техническая литература
- Страницы: 11
- Формат: mp3, fb2, epub, pdf, txt
Советуем прочитать похожую литературу

Разработка моделей сорсинга информационно-технологических процессов...

Информационное обеспечение системы поддержки принятия решений на...

Моделирование издательских процессов в научной периодике

Повышение эффективности конструкторско-технологической подготовки...

Компьютерное конструирование неорганических соединений на основе...
