일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 파이썬기초
- 코딩
- 리스트함수
- 리스트
- 부채
- 난수배열
- 재무제표
- 파이썬
- 딕셔너리
- pop함수
- index
- Key
- INDEX함수
- 파이썬독학
- IFRS
- dictionary
- jupyternotebook
- Python
- 파이썬강의
- 인덱스
- 코딩배우기
- 다항식회귀분석
- 계속기업
- 기계분석
- value
- 다중회귀분석
- 자산
- 머신러닝
- 자본
- 빅데이터
- Today
- Total
코인시던스의 기록
[머신러닝의 기초] 회귀분석법 본문
머신러닝의 알고리즘 중 하나인 선형회귀법(Linear Regression) 에 대해서 알아보겠습니다. 선형회귀법은 기계학습 전체에서 중요한 위치를 차지하고 있습니다. 기계학습의 가장 기본이 되는 지도학습 내에서도 가장 쉽고 기초가 되는 알고리즘으로 원하는 값을 예측할 수 있는 알고리즘이죠.
회귀분석은 엑셀에서 많이 사용해보셨을 것입니다. 아래와 같이 운동부 학생들의 키, 몸무게 데이터를 알고 있다면 추세선을 그어서 신입생 A 의 몸무게를 예상할 수 있겠죠. (추세선 = Regression)
회귀분석법은 광고료를 얼마나 지불했을 때, 얼만큼의 상품을 팔 수 있는가를 예측할 때도 사용할 수 있는데, 실제로 마켓 분석에서 굉장히 많이 사용되고 있습니다. '예측'이라는 것은 기존 데이터를 바탕으로 하기 때문에 이전에 광고를 집행했던 데이터가 있어야겠죠? 오른쪽 아래의 데이터를 보시면 광고료를 100만원 써도 판매량이 항상 같지 않습니다. 우리가 통제할 수 없는 혹은 관찰할 수 없는 외부 변인들이 많기 때문이죠. 이러한 외부 변인들을 제외하고 광고료에 대해서만 판매량을 예측하는, 데이터를 가장 잘 설명하는 선을 찾는 것이 회귀 분석법입니다. N : 데이터의 개수, X : Input , Y : Output 라는 변수는 꼭 익혀두시기 바랍니다.
많은 기계학습 모델에서는 모델을 블랙박스로 정의합니다. 블랙박스는 어떻게 동작하는지는 모르나 Input 을 넣었을 때 Output 이 나온다는 의미입니다.
위의 광고료-판매량 데이터에서 광고 예산과 판매량이 선형적인 관계를 가진다고 가정하면 데이터를 가장 잘 설명하는 기울(베타0) 와 절편(베타1) 을 구하는 것이 단순선형 회귀법의 목표가 되는 것이죠.
'머신러닝' 카테고리의 다른 글
[머신러닝 기초] 다중 선형 회귀 분석 (0) | 2021.01.01 |
---|---|
[머신러닝의 기초] 다항식 회귀분석 (0) | 2020.12.31 |