[SKADA] DRAM 내부 회로의 파형 예측 (3)

Window size: 하나의 data sequence를 구성하는 시간별 데이터의 개수
데이터의 전처리
- window size를 조절하여 sequence의 길이 조절
- interval를 조절하여 window 내 데이터 사이 시간 간격 조절
- stride를 조절하여 window 간 시간 간격 조절

Sequence가 길어지면 예전 데이터를 잘 기억하지 못함
- Short-term memory problem
- Gradient vanishing problem

3개 변수
- Cell state $(C_i)$: $i$ 시간까지 기억하고 있는 기억 메모리
- Hidden state $(H_i)$: $i$ 시간에서의 모델 출력 값
- Input $(X_i)$ : $i$ 시간에서의 입력 값
3개 게이트
- Forget gate
  - $F_{t-1}=C_{t-1}\times sigmoid(f_i(X_t, h_{t-1}))$
  - 0: 이전 기억을 지워라
  - 1: 이전 기억을 유지해라
- Input gate
  - $I_t=sigmoid(f_2(X_t, h_{t-1}))\times tanh(f_3(X_t, h_{t-1}))$
  - 0: 새로운 데이터를 지워라
  - 1: 새로운 데이터를 반영해라
- Cell state update
  - $C_t=F_{t+1}+I_t$
  - 이전 기억과 새로운 데이터의 조합
- Output gate
  - $h_t=sigmoid(f_4(X_t, h_{t-1}))\times tanh(C_t)$
  - $t$ 에서의 출력 값으로 중요하면 1, 중요하지 않으면 0

Reset gate
- $R_t=sigmoid(f_1(X_t, h_{t-1}))\times h_{t-1}$
- 이전 기억에서 지워야 할 부분을 결정
Update gate
- LSTM의 forget gate와 input gate의 역할과 유사
- 이전 기억에서 지워야 할 부분이 새로운 데이터에서 가져와야 할 부분과 같다는 intuition
- $z_t=sigmoid(f_2(X_t, h_{t-1}))$
- $h_t=(1-z_t)\times h_{t-1}+z_t\times tanh(f_3(R_t,X_t))$

단정한 마음