본문 바로가기

Experience/LG AI aimers

[LG AI aimers] 머신러닝 - 분류(1)

📌 분류

주어진 입력 값이 어떤 클래스에 속할 지에 대한 결과 값을 도출하는 알고리즘

다양한 분류 알고리즘이 존재하며, 예측 목표와 데이터 유형에 따라 적용

 

 

 

📌 분류 문제에 회귀 알고리즘 적용하기

일반적인 회귀 알고리즘은 분류 문제에 그대로 사용할 수 없음

→ 이유: 선형회귀는 $-∞$ ~ $+∞$의 값을 가질 수 있기 때문

 

해결 방안

해당 클래스에 속할 확률인 0 또는 1 사이의 값만 내보낼 수 있도록 선형 회귀 알고리즘 수정

이처럼 분류 문제에 적용하기 위해 출력 값의 범위를 수정한 회귀를 로지스틱 회귀(Logistic Regression) 라고 함

 

 

 

📌 분류 문제를 위한 회귀, Logistic Regression

이진 분류(Binary Classification) 문제를 해결하기 위한 모델

최소값 0, 최대값 1로 결과값을 수렴시키기 위해 Sigmoid(logistic) 함수 사용

 

 

Sigmoid(Logistic) 함수

  • S자형 곡선을 갖는 함수
  • $x$값이 커질 경우 $g(x)$ 값은 점점 1에 수렴
  • $x$값이 작아질 경우 $g(x)$ 값은 점점 0에 수렴
  • 대부분의 값이 0 또는 1에 매우 가깝게 출력되기 때문에 분류에 용이

 

확률 결과값 판별 방법, 결정 경계(Decision Boundary)

  • 결정 경계: 데이터를 분류하는 기준값
  • 일반적으로 출력값(확률) 0.5를 기준으로 판별

 

로지스틱 회귀 특징

  • 주로 2개 값 분류(이진 분류)를 위해 사용
  • 선형 회귀를 응용한 분류 알고리즘이기 때문에 선형 회귀의 특징 보유