ML Task별 output 양상과 activation function(활성화 함수)

AI/AI 개념

ML Task별 output 양상과 activation function(활성화 함수)

땅어 2021. 10. 7. 16:20

728x90

ML로 해결하려는 task에서 기본적인 것은 분류, 회귀이다. 대부분의 task들은 사실 이 둘의 컴포넌트로 구분이 가능하다.(object detection과 같이 분류와 회귀가 섞인 task들도 있다.) 분류의 경우 이진분류(binary classification), 다중분류(multi-class classification)으로 나눌 수 있다. 그럼 각각에서 output layer의 양상은 어떠한지, 사용하는 activation function은 무엇인지 알아보자.

종류	output #(output layer의 unit 갯수)	activation function
이진분류(binary classification)	1개	sigmoid
다중분류(multi-class classification)	n개(class 갯수)	softmax
회귀(regression)	1개	none

하나씩 살펴보자. 이진분류의 예로는 IMDB의 영화리뷰 데이터셋을 분류하는 문제를 들 수 있다. 해당 리뷰가 긍정인지 부정인지를 판별하는 것이 목표다. 그럼 output이 긍정/부정을 나타내기 위해 2개여야 할 것 같은데 왜 1개만 할까? 간단하다. 만약 동전 뒤집기 같이 2개의 case가 있는 상황에서 하나의 확률이 p라면 다른 하나의 확률은 1-p이기 때문이다.

회귀에선 왜 activation function을 사용하지 않을까? 이는 회귀의 정의를 살펴보면 된다. 회귀란 기본적으로 불연속적인 스칼라값을 예측하는 문제이다. 예컨대, 어떤 특정 지역의 여러 요소들을 기반으로 해당 지역의 집값을 예측하는 문제를 들 수 있다. 이 경우 집값에 대한 예측 결과값은 50000$과 같이 특정 값으로 나오기 때문에 활성화 함수를 별도로 사용하지 않아도 되는 것이다.

728x90

저작자표시 (새창열림)