머신러닝 2일차 공부!
새롭게 공부하는 내용이다보니 다소 어려운 부분도있고 생소한부분도있고
아무튼 어려운 공부같다.
너무 어려우면 머신러닝 말고 휴먼러닝을 보완하는 공부를 하라고 하는데..
그것도 그거고 이것도 공부는 해야겠어서 우선 실습보다는
이론을 적어보고 이해하는 시간을 갖도록 하려고한다.
이론부터 이해해야 실습도 가능하다고 생각하니깐!
화.이.팅!
머신러닝의 회귀와 분류
머신러닝에서 문제를 풀때, 해답을 내는 방법을 크게 회귀 또는 분류로 나눌 수 있다고 한다.
분류(Classification)와 회귀(Regression)는 지도학습(Supervised Learning)의 목적이라 할 수 있다.
회귀와 분류를 쉽게 구별하려면, 출력 값에 연속성이 있는가를 생각하면 됩니다
- 연속성이 있다 → 회귀 문제 (Data 바탕으로 소득을 예측하는 경우 400만, 399만, 401만을 예측하는 경우의 큰 차이가 없다.)
- 연속성이 없다 → 클래스의 레이블별로 다른 정보를 의미합니다. (사과와 바나나, 오렌지 같이 사이에 중간값이 없다.)
참조 : https://www.slideshare.net/ssuser163469/ndc-2016-61452271
참조 : https://opentutorials.org/module/4916/28942
회귀(Regression) 란?
참조 : https://youtu.be/qT8SxIBx-dE
회귀(regression) 는 예측하고자 하는 타겟값이 실수, 즉 숫자인 경우 이다. 그리고 회귀는 예측 결과가 연속성을 지닌다. 여기서 연속성이란, 말그대로 연속하는 값을 말한다. 예를 들면, 1.2, 1.201, 1.2001 처럼 연속성을 지닌는 것을 뜻한다. 회귀를 통해 손해액, 매출량,거래량, 파산할 확률 등을 예측할 수 있다. 즉, 회귀문제란 실수형 변수를 통해 예측하여 예측 결과값이 연속성을 지니고 있는 경우 회귀문제라고 할 수 있다.
분류(Classification) 란?
참조 : https://youtu.be/7lRkauI2OIc
분류(classification) 는 예측하고자 하는 타겟값이 범주형 변수인 경우 이다. 회귀와는 다르게 분류는 예측 결과가 연속성을 지니지 않는다. 연속성을 지니는 연속값이 아닌 이산값을 가지고 있다. 여기서 이산값이란, 0과1로 처리할 수 있는 값으로써 연속적이 아닌 단속적인 값을 뜻한다. 분류를 통해 부도 여부(yes/no), 여신 승인 여부, 동물 분류(dog/cat) 등을 예측할 수 있다. 분류의 종류에는 이진분류와 다중분류가 있다. 이진분류(binary Classification)는 Yes/ No처럼 두가지의 답으로 분류하는 것을 뜻한다. 다중분류(multiclass Classification)는 이진분류에서 답의 갯수만 증가한 분류의 형태이다. 즉, 분류문제란 범주형 변수를 통해 예측하여 예측 결과값이 이산값을 지니고 있는 경우 분류문제라고 할 수 있다.
회귀와 분류에대해서 알아보는 시간을 가졌다.
원격 강의에서도 많은 내용을 자세히 알려주지만 따로 찾아보고 알가는 시간을 가져보니깐
회귀와 분류를 어떻게 이해하면될지 가닥이 잡힌거같다.
'Sparta Coding Club > Today I Learned [TIL]' 카테고리의 다른 글
[TIL] #DAY - 029 - OpenCV, YOLO! (내일배움캠프AI 3기) (0) | 2022.10.13 |
---|---|
[TIL] #DAY - 028 - 프로젝트 매니지먼트! (내일배움캠프AI 3기) (0) | 2022.10.13 |
[TIL] #DAY - 026 - 머신러닝이란? (내일배움캠프AI 3기) (1) | 2022.10.10 |
[TIL] #DAY - 025 - 프로젝트 완료! (5) (내일배움캠프AI 3기) (1) | 2022.10.06 |