Рубрицирование текстовой информации на основе голосования интеллектуальных классификаторов

Одним из приоритетов государственной политики России выступает практическая реализация концепции электронного правительства. Важным элементом этой концепции является организация эффективного взаимодействия органов власти и граждан, которая, помимо оказания государственных услуг, должна включать в себя обработку электронных обращений (заявлений, жалоб, предложений и т.п.). Исследования показывали, что скорость и оперативность обработки обращений в значительной степени зависит от качества определения тематических рубрик, т.е. решения задачи рубрицирования. Проведенный анализ обращений граждан, поступающих на электронную почту и официальные сайты различных органов власти, выявил ряд специфических особенностей (небольшой размер, наличие ошибок в тексте, свободный стиль изложения, рассмотрение нескольких проблем), которые не позволяют успешно применять традиционные подходы к их рубрицированию. Для решения указанной проблемы было предложено использовать различные методы интеллектуального анализа неструктурированных текстовых данных (в частности, нечетко-логические алгоритмы, нечеткие деревья решений, нечеткие пирамидальные сети, нейро-нечеткие классификаторы, сверточные и рекуррентные нейронные сети). В статье описаны условия применимости шести интеллектуальных классификаторов, предложенных для рубрицирования электронных обращений граждан. В их основе лежат такие факторы, как размер документа, степень пересечения тематических рубрик, динамичность их тезаурусов и объемом накопленной статистической информации. Для ситуации, когда конкретная модель не может произвести однозначный выбор тематической рубрики, предложено использовать метод голосования классификаторов, который позволяет существенно снизить вероятность ошибок рубрицирования на основе взвешенного агрегирования решений, полученных несколькими моделями, отобранными с помощью нечетко-логического вывода.
- Авторы:М. И. Дли, О. В. Булыгина, Андрей Максимович Соколов
- Серия: Прикладная информатика: Научные статьи
- Жанр:Техническая литература
- Страницы: 8
- Формат: fb2, epub, pdf, txt
Советуем прочитать похожую литературу

Разработка моделей сорсинга информационно-технологических процессов...

Информационное обеспечение системы поддержки принятия решений на...

Моделирование издательских процессов в научной периодике

Повышение эффективности конструкторско-технологической подготовки...

Компьютерное конструирование неорганических соединений на основе...
