Формирование структуры интеллектуальной системы анализа и рубрицирования неструктурированной текстовой информации в различных ситуациях

Анализ электронных текстовых документов, написанных на естественном языке, является одной из важнейших задач, реализуемых в системах автоматизированного анализа лингвистической информации. Известно, что такие документы могут характеризоваться различными параметрами: размер, наличие структуры, частота упоминания ключевых слов и т. п. Проведенный анализ показал невозможность построения единой модели для рубрицирования неструктурированных текстовых документов в различных ситуациях.
Для решения указанной проблемы предложен мультимодельный подход к рубрицированию, отличающийся комбинированным использованием интеллектуальных и вероятностно-статистических методов анализа текстовых документов. Конкретная модель выбирается с использованием нечетко-логических алгоритмов на основе предложенных характеристик. Его применение позволит повысить точность отнесения электронных текстовых документов к конкретным рубрикам с учетом их специфики и различных целей практического применения в организации.
- Авторы:М. И. Дли, О. В. Булыгина, П. Ю. Козлов
- Серия: Прикладная информатика: Научные статьи
- Жанр:Техническая литература
- Страницы: 13
- Формат: fb2, epub, pdf, txt
Советуем прочитать похожую литературу

Трёхуровневая нечеткая когнитивная модель для анализа процессов...

Способы интеграции информационных систем субъектов экономической...

Управление жизненным циклом экономической информационной системы с...

Developing the economic information system for automated analysis...

Алгоритмы формирования изображений состояний объектов для их...
