Формирование структуры интеллектуальной системы анализа и рубрицирования неструктурированной текстовой информации в различных ситуациях

Анализ электронных текстовых документов, написанных на естественном языке, является одной из важнейших задач, реализуемых в системах автоматизированного анализа лингвистической информации. Известно, что такие документы могут характеризоваться различными параметрами: размер, наличие структуры, частота упоминания ключевых слов и т. п. Проведенный анализ показал невозможность построения единой модели для рубрицирования неструктурированных текстовых документов в различных ситуациях.
Для решения указанной проблемы предложен мультимодельный подход к рубрицированию, отличающийся комбинированным использованием интеллектуальных и вероятностно-статистических методов анализа текстовых документов. Конкретная модель выбирается с использованием нечетко-логических алгоритмов на основе предложенных характеристик. Его применение позволит повысить точность отнесения электронных текстовых документов к конкретным рубрикам с учетом их специфики и различных целей практического применения в организации.
- Авторы:М. И. Дли, О. В. Булыгина, П. Ю. Козлов
- Серия: Прикладная информатика: Научные статьи
- Жанр:Техническая литература
- Страницы: 13
- Формат: mp3, fb2, epub, pdf, txt
Советуем прочитать похожую литературу

Мемуары гидростроителя. Воспоминания о детстве, юности, учебе,...

Электрические строки. Сборник публикаций

Основные магистральные самолёты авиакомпаний России. Особенности...

Особенности работы лоуд-мастера грузового самолета

Персональные видеорегистраторы для личной безопасности. Обзор,...
