본문 바로가기

Machine Learning/머신러닝 온라인 강의

CH01-01. 머신러닝이란


1. 머신러닝의 정의

 

기계가 일일이 코드로 명시하지 않은 동작을 데이터로 부터 학습하여

실행할 수 있도록 하는 알고리즘을 개발하는 연구분야


2. 머신러닝의 3요소

 

현재 내가 살고있는집을 팔려고 합니다.
얼마가 적절한 가격일까요?

 

풀고자 하는 문제  --> 적절한 가격

 

집의 가격을 결정하기 위해 주변의 다른 집들의 가격들을 확인해 보았습니다.
그리고 집의 가격을 결정하는 몇 가지 요인을 찾을 수 있었습니다.

(역에서 가까운지?, 집이 오래 되었는지?, 주차장이 넓은지?)

조사한 요인들을 이용해 다음과 같이 집의 가격을 알수있게 되었습니다.

 

 

알고리즘


문제를 풀기 위한 의사결정과정
집이낡았음-> 주차장이좁음-> 역에서가까움-> 5억원!

 

데이터


주관적인 기준이 아닌 수치에 근거한 객관적인 기준

가깝다-> 10km 이내
오래되었다-> 10년이넘었다
주차장이크다-> 주차장이100𝑚!보다크다

 

학습
수치에 들어갈 값을 컴퓨터가 스스로찾는다!

 

다시정리 하자면, 

 

1.알고리즘
문제를 풀기위한 의사결정과정

2.데이터
객관적인 기준을 위한 정답과 요인들


3.학습
데이터로부터 최적의 값을 찾는 과정

 

앞에서 나왔던 머신러닝에 대한 정의를 좀더 쉽게 해석해 보자면

 

'기계가 일일이 코드로 명시하지 않은 동작을 데이터로부터 학습하여
실행할 수 있도록 하는 알고리즘을 개발하는 연구분야' 라는 정의를

 

'머신러닝이란 풀고자 하는 문제의 정답과 데이터를 주고
기계를 학습시켜서 정답을 맞추게 하는 것입니다.' 으로 해석할 수 있다.

 


3. 머신러닝의 종류

 

1. 지도학습(Supervised Learning)
- 정답이 있는 문제를 풀 경우


2. 비지도학습(Unsupervised Learning)
- 정답이 없는 문제를 풀 경우

 

정답의 종류에 따른 지도학습


1. 회귀(Regression)
- 정답이 연속형 변수일 때

- 연속형이란?
- 값이 정수처럼 명확하지 않음
- eg) 키, 몸무게, …
- 회귀분석문제
- 키를 이용해 몸무게를 예측하기

 

회귀 단어의 유래
- 회귀(regress)의 원래 의미는 옛날상태로 돌아가는 것을 의미한다.
- 영국의 유전학자 프랜시스 골턴
- 부모의 키와 아이들의 키사이의 연관관계에 대해 연구

 

'부모와 자녀의 키 사이에는 선형적인 관계가 있고 키가 커지거나 작아지는 것 보다는
전체 키 평균으로 돌아가려는 경향이 있다는 가설' <- 이를 분석하는 방법을"회귀분석"이라고 하였다.

 


2. 분류(Classification)
-정답이 비연속형(범주형)변수일 때

- 범주형변수란?
- 값이 정수처럼 명확함
- eg) 성별, 도시, …
- 분류문제
- 키와 몸무게를 이용해 성별을 맞추기

 

아이리스라는 꽃의 성별을 나누기 위해 수술과 암술을 통해 분류하는 예시이다.

 

 

비지도 학습의 종류


1. 군집분석(Clustering)

주어진 데이터가 어떻게 구성되었는지 알아내려는 분석방법

 

 


2. 강화학습(Reinforcement Learning)

행동에 따른 보상을 최대화 시키는 학습방법

 

 

머신러닝에 대해 최종적으로 정리하면 아래와 같다.

 

최종 정리