본문 바로가기

Experience/SKADA

(10)
[SKADA] 통신 Core 장비에 대한 이상 징후 감지 (2) 📌 PandasPython에서 데이터 분석을 위한 라이브러리사용이 쉬운 데이터 구조와 여러 도구를 갖추고 있으며, 다른 라이브러리와의 연동으로 유용성을 높인 분석 툴DataFrame: 2차원 데이터 구조로써 관계형 데이터 베이스의 테이블 구조와 비슷, Series의 집합Data: DataFrame에 저장할 데이터Index: 행(row) 이름으로써 기본 값 0부터 1씩 증가하는 정수columns: 열(column) 이름, 기본 값 0부터 1씩 증가하는 정수Missing value: 결측값으로 NaN으로 표기Axis: 행 방향(axis=0) 열 방향(axis=1) 📌 DataFrame 결측치 기준결측치 비율 10% 미만: 데이터 제거 or 다양한 imputation결측치 비율 10%~20%: 모델 기반 ..
[SKADA] 통신 Core 장비에 대한 이상 징후 감지 (1) 📌 시계열(time series) 데이터시간에 걸쳐 순차적으로 기록되고 배열된 데이터의 한 종류시간의 흐름에 따라 불규칙적으로 변동되는 자료들을 분석하기 위해 필수적‘과거’가 ‘미래’에 어떤 영향을 주는지 분석을 통해 예측 가능최근 새롭게 등장한 기계학습과 딥러닝을 사용하여 복잡한 데이터를 예측시계열 분해법을 통해 체계적 성분과 불규칙적 성분으로 분리대표적 시계열 데이터: 주식 수익률 데이터, 재무 데이터, 정당 지지율 등 📌 시계열 구성요소(Components)추세 trend: 장기간 데이터의 일반적인 경향시간의 흐름에 따른 시계열 자료들의 상승경향이나 하강경향의 상태를 의미계절성 seasonal variations: 1년 미만의 기간에 걸쳐 나타나는 변동순환 cyclic variations: 1년..