Авторы |
Владимир Николаевич Клячкин, доктор технических наук, доцент, профессор кафедры прикладной математики и информатики, Ульяновский государственный технический университет (Россия, г. Ульяновск, ул. Северный Венец, 32), E-mail: v_kl@mail.ru
Ирина Николаевна Карпунина, кандидат технических наук, доцент кафедры общепрофессиональных дисциплин, Ульяновский институт гражданской авиации (Россия, г. Ульяновск, ул. Можайского, 8/8), E-mail: karpunina53l@yandex.ru
|
Аннотация |
Актуальность и цель. Постоянно растущие требования по обеспечению безопасности и надежности технических систем приводят к необходимости более точной диагностики состояния объекта в условиях эксплуатации по результатам мониторинга показателей функционирования этого объекта. Иногда необходимо состояние объекта описать с помощью нескольких возможных вариантов. В этом случае проводится мультиклассовая классификация, при которой возможные состояния объекта подразделяются на несколько классов, например, по виду отказа. При этом могут эффективно использоваться методы машинного обучения. Особенности рассматриваемой задачи – ограниченный объем выборочных данных, а также несбалансированность обучающей выборки: информации о показателях функционирования при неработоспособных состояниях объекта, как правило, гораздо меньше, чем при работоспособных. Цель исследования – разработка технологии диагностики состояния технического объекта по заданным показателям его функционирования с учетом этих особенностей. Материалы и методы. Среди используемых методов машинного обучения для мультиклассовой классификации следует отметить как стандартные статистические, так и специальные: нейронные сети, композиционные модели, агрегированные классификаторы. В данной работе для мультиклассовой классификации применен метод Random Forest («случайный лес»), показавший высокое качество при решении различных задач машинного обучения. Результаты и выводы. Разработана технология мультиклассовой диагностики технических систем с применением «случайного леса» в системе Statistica. На примере диагностики компьютерной системы показано, что использование этого метода обеспечивает достаточно высокую точность классификации. В случае несбалансированности классов в качестве критерия классификации вместо доли ошибок используется F-мера. При необходимости количество показателей функционирования может быть сокращено с учетом их значимости.
|
Ключевые слова
|
техническая диагностика, показатели функционирования, машинное обучение, случайный лес, система Statistica
|