본문 바로가기

Experience/SKADA

[SKADA] 통신 Core 장비에 대한 이상 징후 감지 (5)

📁 LSTM 모델을 활용한 이상 징후 감지

 

📌 RNN 기반 딥러닝 모델

  • RNN(Recurrent Neural Network) 순환 신경망
  • 반복적이고 순차적인 데이터 학습에 특화된 인공신경망의 한 종류
  • 순환 구조를 이용하여 과거의 학습을 가중치를 통해 현재 학습에 반영

 

📌  CNN vs RNN

  CNN RNN
설명 합성곱 계층을 통해 추출된 특징들을 기반으로 분류하는 딥러닝 분석모델 데이터 순서정보를 반영하는 재귀구조의 딥러닝 분석모델
장점 지엽적 정보 추출에 탁월 시계열 정보 반영 가능
입-출력 개수에 따른 다양한 모델 구성 가능
단점 전역적 정보 파악이 어려움 입력 데이터 전처리 필수
네트워크 가중치 소실 문제
주요분야 이미지 분류
영상 인식
텍스트 분류 및 번역 시계열 예측

 

📌  RNN 구조

  • 시퀀스 길이에 관계없이 인풋과 아웃풋을 받아들일 수 있는 네트워크 구조
  • 태스크에 맞게끔 다양하고 유연하게 구조를 만들 수 있음

 

📌  LSTM과 GRU

  • 기울기 소실 gradient vanishing 문제
  • RNN은 관련 정보와 그 정보를 사용하는 지점 사이 거리가 멀 경우 역전파 시 미분 값이 점차 줄어 학습 능력이 크게 저하됨
  • LSTM 구조: 기울기 소실 문제 해결을 위해 RNN의 hidden-state에 cell-state 추가
  • LSTM 구성요소 4개: input gates, forget gate, cell state, output gate
  • 단일 변수로 학습
    • 하나의 변수로 이루어져 있는 데이터
    • 단일 변수의 변화량 만을 분석하는 가장 간단한 형태의 분석 기법
  • 다중 변수로 학습
    • 하나 이상의 변수로 이루어져 있는 데이터
    • 다 변량 분석법으로, 2개 이상의 변수 간의 관계를 분석
    • 예측할 변수의 과거 데이터 및 데이터 간의 의존성을 고려해야 함
  • LSTM과 GRU
    • GRU: LSTM과 같이 RNN의 기울기 소실 문제를 해결하기 위해 고안됨
    • GRU 구성요소
      • LSTM보다 메모리 효율적인 구조(Reset gate와 update gate)로 구성
      • RNN의 input gate와 forget gate → Reset gate
      • RNN의 out gate → update gate

 

📌  LSTM 모델을 통한 이상 징후 감지

  • ARIMA 모델을 사용하여 이상 징후를 감지한 것과 동일하게 특정 임계값을 벗어나면 이상치라 정의
  • 설정한 임계 값보다 모델의 테스트 loss가 클 경우 이상치로 정의
  • 이상 징후 감지 순서
    • 훈련과 테스트 데이터 설정
    • 데이터 표준 정규화(Standard Scaler) 진행
      • 분석 시, 변수들의 스케일이 다른 경우 정상적인 학습 및 예측을 위해 진행
      • 데이터 표준화: 데이터가 표준정규분포의 속성을 갖도록 피처를 재조정하는 것
      • 표준 정규화: 평균 0 분산 1
    • Multivariate LSTM을 이용하여 주어진 데이터 학습 및 이상치 탐지