본문 바로가기
카테고리 없음

회귀분석

by 별토끼. 2019. 7. 4.
반응형

회귀분석이란 ? 영향을 미치는 원인과 결과 관계

-독립변수 : 연구 조사할때 영향을 미치는 변수. 독립적으로 움직임.

-종속변수 : 다른 변수로부터 영향을 받음.

1. 단순회귀분석

독립변수 X가 종속변수 Y에 미치는 영향을 회귀방정식을 이용해 분석하는 방법.

목적 : X를 원인으로 하여 Y가 어떻게 될 것인지 추정하는 설명

EX) 매출액과 광고비에 대한 자료. 상관관계를 살펴본 결과, 양의 상관관계. 그렇다면 광고비에 따른 2016년 매출액을 미리 예상할 수 있을까? (표 2001~2015년까지)

[자연과학 / 사회과학 예시]

자연과학 : 1:1로 f(x)=b0+b1x1

사회과학 :

E(Y|X)=b0+b1X1 (하나의 직선으로 표현되지않고 분포로 표시) , 선을 그어 회귀방정식이라고 함. 조건부평균으로 표시.

y변화랑/x변화량 = b1

*잔차

Y = B0+B1X1 + ( e ) ===> (입실론) 잔차

*최소자승법 혹은 최소제곱법

-개념

실제 데이터를 측정하다 보면 독립변수에 따라 종속변수의 변화 정도가 다르게 나타나는 경우가 있는데, 이러한 개별 측정치들 간에 차이

모회귀식 : Yi = B0 + BiX1

표본 회귀식 : Y^ = B0^ + B1^ * Xi  ; 가장 잘 뽑은 회귀식 = B^ -> B 이라 할 수 있다.

Y^ = B0^ + B1^ * Xi + ei^(잔차) --> 잔차를 최소로 만들면 모회귀식과 동일해진다.

- 잔차의 제곱합을 최소로 하는 방법

제곱을 하는 이유? +, - 값들이 0이 되므로 제곱 한 뒤 값을 구한다.

제곱이된 합이 최소가 된다면 추정하는 직선에 대한 표본회귀식은 잘 추정된 표본회귀식이라고 할 수 있다.

*최대우도법

최대한 모수를 갖는 함수로 접근하도록 하는 방법. 측정치를 염두해두고 측정치를 잘 설명할 수 있는 갖

우도(likelihood) ? 측정치를 아주 잘 설명할 수 있도록 하는 가능성

즉, 최대로 우도를 끌어올린다.

 

반응형

댓글