'통계분석(Statistics)/SPSS'에 해당되는 글 1건

  1. 2018.03.30 신뢰구간(Confidence Interval : CI), 신뢰수준(Confidence Level : CL)
posted by 권오성의 Biomedical Engineering 2018. 3. 30. 10:27

신뢰구간이라는 것은 말 그대로 믿을 수 있는 구간을 의미한다. 

보통 모수중에서도 모평균을 알고자 할 때 자주 쓰인다.


예를 들어 대한민국 20대 남자의 평균키를 알고 싶다고 가정했을 경우, 우리가 궁극적으로 알고 싶은 것은 우리나라의 모든 20대 남자들의 키를 조사한 다음 그 값들을 평균한 값, 즉 모평균을 알고 싶을 것입니다.

그러나, 현실적으로 모집단 전체에 대해 조사를 못하고 표본을 가지고 조사합니다. 그러므로 우리가 얻을 수 있는 값은 표본의 평균이기 때문에 모평균과 차이가 발생됩니다. 그래서 나온 것이 구간추정이고, 이것의 핵심이 바로 신뢰구간입니다.


위와 같이 해서 만약 얻어진 값이 70cm ~ 300cm 라는 구간이라면 이 구간안에는 아마 대한민국의 20대 남자들이 포함이 될 것입니다. 즉, 키가 3 m 를 넘는 남자도 없고 70 cm 보다 작은 사람도 없겠죠. 그래서 이 구간은 100% 신뢰구간이 됩니다. 즉, 이 구간안에는 모집단의 모평균이 100 % 들어있게 되는 것이죠. 

여기서 중요한 것은 구간안에 모수(모평균)가 포함되어 있을 확률을 의미합니다. 


그럼 95% 신뢰구간은 결국 그 구간안에 모수가 포함되어 있을 확률이 0.95인 95%가 될 것입니다. 좀더 정확한 개념으로 말하면 우리는 하나의 표본의 구해서 어떤 신뢰구간을 구할 것입니다. 그 구간은 a1 ~ b1 이라고 하면 이 구간안에 모수가 포함이 되어 있을 수도 있고 포함이 되지 않을 수도 있습니다. 마찬가지 방법으로 똑같은 모집단에서 같은 방법으로 또다른 표본을 추출하고 그 표본에서도 어떤 신뢰구간을 구합니다. 그 구간을 a2 ~ b2 라고 하면 역시 이 구간에도 모수가 포함이 될 수도 아닐 수도 있습니다.

위와 같은 방법으로 100 개의 표본을 뽑는다면 각 표본마다 구간이 나올 것입니다.


             a1    ~ b1

             a2    ~ b2

             a3    ~ b3

              :         :

              :         :

             a100 ~ b100


위와 같이 구간이 100 개가 나오고 이 구간들은 서로 다를 것입니다. 또한 그 구간안에 모수가 포함될 수도 아닐 수도 있습니다. 여기에서 최소한 모수가 포함된 구간이 95개 있을 경우에 이 구간을 95% 신뢰구간이라고 합니다. 좀더 정확히 말하면 신뢰수준이 95%인 신뢰구간이다라고 말합니다.


그러므로, 신뢰구간과 신뢰수준은 서로 비슷한 용어이면서 공생하는 개념입니다. 신뢰수준은 믿을 수 있는 정도를 의미하고 신뢰구간은 신뢰수준에 바탕을 둔 어떤 모수의 믿을 수 있는 구간을 의미하는 것입니다.


펌 : http://www.statedu.com/?document_srl=7360&mid=term&sort_index=readed_count&order_type=desc