СТОХАСТИЧЕСКАЯ РОЕВАЯ КЛАСТЕРИЗАЦИЯ В ЗАДАЧАХ АВТОМАТИЗИРОВАННОЙ ОБРАБОТКИ ДАННЫХ, ПРЕДСТАВЛЕННЫХ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
ЮРЬЕВ Г.А., ФГБОУ ВО МГППУ, Москва, Россия,
e-mail: g.a.yuryev@gmail.com
ВЕРХОВСКАЯ Е.К., ФГБОУ ВО МГППУ, Москва, Россия,
e-mail: katrin636bmw@yandex.ru
ЮРЬЕВА Н.Е., ФГБОУ ВО МГППУ, Москва, Россия,
e-mail: yurieva.ne@gmail.com
Рассматривается метод обработки данных, представленных на естественном языке, использующий стохастический алгоритм нелинейного снижения размерности многомерных данных, учитывающий дискриминирующую силу найденного решения для заданных значений категориальной переменной, связанной с каждым наблюдением. Для поиска характеристик, обеспечивающих наилучшее разделение наблюдений в смысле заданного функционала качества, предлагается использовать численную процедуру, основанную на методе оптимизации, известном как «Метод роя частиц». В основе оценки качества решения лежит чистота кластеров, полученных в найденном пространстве методом k-средних, либо с использованием самоорганизующихся карт Кохонена.
Ключевые слова: обработка данных, представленных на естественном языке, комбинаторная оптимизация, оптимизация методом роя частиц, нелинейное снижение размерности.
Финансирование
Работа выполнена при финансовой поддержке Министерства образования и науки Российской Федерации в рамках Соглашения о предоставлении субсидии от «26» сентября 2017 г. No 14.576.21.0092 (Уникальный идентификатор соглашения RFMEFI57617X0092) на выполнение прикладных научных исследований по теме: «Разработка нейросетевой системы прогнозирования авиапроисшествий и управления рисками безопасности полетов на основе ретроспективных данных, включающих множество параметров и текстовых описаний событий».
КОЛИЧЕСТВЕННЫЕ КРИТЕРИИ ДЛЯ РАСПОЗНАВАНИЯ НЕКОРРЕКТНОГО ПОВЕДЕНИЯ ПОЛЬЗОВАТЕЛЕЙ КОМПЬЮТЕРНЫХ СЕТЕЙ
КУРАВСКИЙ Л.С., ФГБОУ ВО МГППУ, Москва, Россия,
e-mail: l.s.kuravsky@gmail.com
ЮРЬЕВ Г.А.*, ФГБОУ ВО МГППУ, Москва, Россия,
e-mail: g.a.yuryev@gmail.com
СКРИБЦОВ П.В., компания «Павлин Техно» Москва, Россия,
e-mail: pvs@pawlin.ru
ЧЕРВОНЕНКИС М.А., компания «Павлин Техно» Москва, Россия,
e-mail: chervonenkis@yandex.ru
КОНСТАНТИНОВСКИЙ А.А., ФГБОУ ВО МГППУ, Москва, Россия,
e-mail: sanekkonst@gmail.com
ШЕВЧЕНКО А.А., ФГБОУ ВО МГППУ, Москва, Россия,
e-mail: apokend@gmail.com
ИСАКОВ С.С., ФГБОУ ВО МГППУ, Москва, Россия,
e-mail: phebra@yandex.ru
Представлены два критерия для выявления отклонений в поведении пользователей при диагностике сетевых угроз. Первый из них опирается на технику проверки статистических гипотез и использует в качестве инструмента для формирования целевой статистики самоорганизующиеся карты признаков (сети Кохонена), представляющие один из видов самообучающихся нейронных сетей. Второй критерий определяет категории пользователей с отклонениями в поведении по выполненным последовательностям типовых действий, используя для представления динамики их поведения марковские процессы с дискретными состояниями и дискретным временем (цепи Маркова).
Ключевые слова: сетевые угрозы, поведение пользователей компьютерных сетей, самоорганизующиеся карты признаков, нейронные сети, цепи Маркова.
Финансирование
Работа выполнена при финансовой поддержке Министерства образования и науки Российской федерации в рамках соглашения о предоставлении субсидии от «26» сентября 2017 г. No 14.579.21.0155 (Уникальный идентификатор соглашения — RFMEFI57917X0155) на выполнение прикладных научных исследований и экспериментальных разработок по теме: «Разработка интеллектуальных алгоритмов выявления сетевых угроз в облачной вычислительной среде и методов защиты от них, основанных на анализе динамики трафика и определении отклонений в поведении пользователей».