"표본평균과 표본분산"의 두 판 사이의 차이

2013년 1월 2일 (수) 03:32 판

개요

여론조사 에 응용되는 통계의 기초 개념

유한모집단, 비복원추출의 경우

크기가 N인 유한모집단 $\{x_1,\cdots, x_N\}$의 모평균이 $\mu$, 모분산이 $\sigma^2$ 이라고 가정하자.
- 여론조사는, 모집단의 $\mu$와 $\sigma^2$를 알지 못하는 상태에서, 하나의 표본을 통하여 이를 추정하는 문제에 해당한다.
크기가 n인 표본 $\{y_1,\cdots,y_n\}\subseteq \{x_1,\cdots, x_N\}$ 을 모집단에서 추출했다고 하면, 이로부터 표본평균 $\bar{y}$과 표본분산 $s^2$을 다음과 같이 정의한다 :

\[\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_{i}\] \[s^2=\frac{1}{n-1}\sum_{i=1}^{n}(y_{i}-\bar{y})^2\]

$\bar{y}$와 $s^2$ 는 모두 새로운 확률변수로 이해할 수 있으며, 이 확률변수의 평균과 분산을 모평균 $\mu$, 모분산 $\sigma^2$를 통하여 표현할 수 있다.
확률변수 $\bar{y}$의 경우

\[E(\bar{y})=\mu,\] \[V(\bar{y})=\frac{\sigma^2}{n}(\frac{N-n}{N-1})\]

확률변수 $s^2$의 경우

\[E(s^2)=\frac{N}{N-1}\sigma^2\]

모평균과 모분산의 추정

평균이 $\mu$인 모집단에서 n 개의 표본 $y_1,\cdots,y_n$ 을 추출할 때 표본평균 $\bar{y}$는 $\mu$의 불편추정량이다. 즉
$E(\bar{y})=\mu$ 이 성립한다.
평균이 $\mu$, 분산 $\sigma^2$ 인 크기가 N인 모집단에서 n개의 표본 $y_1,\cdots,y_n$을 추출할 때 표본분산 $s^2$은 $\frac{N}{N-1}\sigma^2$의 불편추정량이다. 즉
$E(s^2)=\frac{N}{N-1}\sigma^2$ 이 성립한다.
모평균 $\mu$은 표본평균 $\bar{y}$ 로 추정할 수 있다
표본평균의 분산 $V(\bar{y})$은 표본분산 $s^2$를 이용하여 $\frac{s^2}{n}(\frac{N-n}{N})$ 로 추정할 수 있다

예

모집단이 $\{1,2,3,4,5,6\}$ 주어진 경우를 생각하자
- 평균 $\mu=\frac{1+2+3+4+5+6}{6}=\frac{7}{2}$

표본의 크기가 2인 경우

\begin{array}{c|c|c|c} i & \text{sample }i & \bar{y}_i & s_i^2 \\ 1 & \{1,2\} & \frac{3}{2} & \frac{1}{4} \\ 2 & \{1,3\} & 2 & 1 \\ 3 & \{1,4\} & \frac{5}{2} & \frac{9}{4} \\ 4 & \{1,5\} & 3 & 4 \\ 5 & \{1,6\} & \frac{7}{2} & \frac{25}{4} \\ 6 & \{2,3\} & \frac{5}{2} & \frac{1}{4} \\ 7 & \{2,4\} & 3 & 1 \\ 8 & \{2,5\} & \frac{7}{2} & \frac{9}{4} \\ 9 & \{2,6\} & 4 & 4 \\ 10 & \{3,4\} & \frac{7}{2} & \frac{1}{4} \\ 11 & \{3,5\} & 4 & 1 \\ 12 & \{3,6\} & \frac{9}{2} & \frac{9}{4} \\ 13 & \{4,5\} & \frac{9}{2} & \frac{1}{4} \\ 14 & \{4,6\} & 5 & 1 \\ 15 & \{5,6\} & \frac{11}{2} & \frac{1}{4} \\ \end{array}

표본평균 $\bar{y}$은 $\left\{\frac{3}{2},2,\frac{5}{2},3,\frac{7}{2},\frac{5}{2},3,\frac{7}{2},4,\frac{7}{2},4,\frac{9}{2},\frac{9}{2},5,\frac{11}{2}\right\}$ 을 모집단으로 하며, 이들의 평균 $E(\bar{y})$과 분산 $V(\bar{y})$ 는 다음과 같이 계산된다 $$ E(\bar{y})=\frac{\sum \bar{y}_i}{15}=\frac{\frac{3}{2}+2+\frac{5}{2}+3+\frac{7}{2}+\frac{5}{2}+3+\frac{7}{2}+4+\frac{7}{2}+4+\frac{9}{2}+\frac{9}{2}+5+\frac{11}{2}}{15}=\frac{7}{2}=\mu $$

표본평균

표본분산

n-1로 나누기 vs n으로 나누기
n-1 로 나누는 경우, 비편향분산이라고 불리기도 하며, 모집단의 분산에 대한 불편추정량이 되는 좋은 성질을 갖는다.
http://en.wikipedia.org/wiki/Variance#Population_variance_and_sample_variance
http://en.wikipedia.org/wiki/Bessel%27s_correction
Bessel's correction yields an unbiased estimator of the population variance
http://www.minitab.com/support/documentation/answers/Why%20is%20S2%20the%20unbiased%20estimator.pdf
편향분산

역사

메모

Math Overflow http://mathoverflow.net/search?q=

매스매티카 파일 및 계산 리소스

수학용어번역

한국통계학회 통계학 용어 온라인 대조표
- population 모집단
- sampling without replacement 비복원표집, 비복원추출

@@ 1번째 줄: / 1번째 줄: @@
-==이 항목의 수학노트 원문주소==
-* [[표본평균과 표본분산]]
 ==개요==
+* [[여론조사와 수학|여론조사]] 에 응용되는 통계의 기초 개념
-* [[여론조사와 수학|여론조사]] 에 응용되는 통계의 개념
 ==유한모집단, 비복원추출의 경우==
+* 크기가 N인 유한모집단 $\{x_1,\cdots, x_N\}$의 모평균이 <math>\mu</math>, 모분산이 <math>\sigma^2</math> 이라고 가정하자.
+** 여론조사는, 모집단의 <math>\mu</math>와 <math>\sigma^2</math>를 알지 못하는 상태에서, 하나의 표본을 통하여 이를 추정하는 문제에 해당한다.
+* 크기가 n인 표본 $\{y_1,\cdots,y_n\}\subseteq \{x_1,\cdots, x_N\}$ 을 모집단에서 추출했다고 하면, 이로부터 표본평균 <math>\bar{y}</math>과 표본분산 <math>s^2</math>을 다음과 같이 정의한다 :
+:<math>\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_{i}</math>
+:<math>s^2=\frac{1}{n-1}\sum_{i=1}^{n}(y_{i}-\bar{y})^2</math>
+* <math>\bar{y}</math>와 <math>s^2</math> 는 모두 새로운 확률변수로 이해할 수 있으며, 이 확률변수의 평균과 분산을 모평균 <math>\mu</math>, 모분산 <math>\sigma^2</math>를 통하여 표현할 수 있다.
+* 확률변수 <math>\bar{y}</math>의 경우
+:<math>E(\bar{y})=\mu,</math>
+:<math>V(\bar{y})=\frac{\sigma^2}{n}(\frac{N-n}{N-1})</math>
+* 확률변수 <math>s^2</math>의 경우
+:<math>E(s^2)=\frac{N}{N-1}\sigma^2</math>
-크기가 N인 유한모집단의 모평균이 <math>\mu</math>, 모분산이 <math>\sigma^2</math> 이라고 가정하자.
-여론조사는, 모집단의 <math>\mu</math>와 <math>\sigma^2</math>를 알지 못하는 상태에서, 하나의 표본을 통하여 이를 추정하는 문제에 해당한다.
-크기가 n인 표본 <math>y_1,\cdots,y_n</math> 을 모집단에서 추출했다고 하면, 이로부터 표본평균 <math>\bar{y}</math>과 표본분산 <math>s^2</math>을 다음과 같이 얻는다.
-<math>\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_{i}</math>
-<math>s^2=\frac{1}{n-1}\sum_{i=1}^{n}(y_{i}-\bar{y})^2</math>
-<math>\bar{y}</math>와 <math>s^2</math> 는 모두 새로운 확률변수로 이해할 수 있으며, 이 확률변수의 평균과 분산을 모평균 <math>\mu</math>, 모분산 <math>\sigma^2</math>를 통하여 표현할 수 있다.
-확률변수 <math>\bar{y}</math>의 경우
-<math>E(\bar{y})=\mu</math>, <math>V(\bar{y})=\frac{\sigma^2}{n}(\frac{N-n}{N-1})</math>
-확률변수 <math>s^2</math>의 경우
-<math>E(s^2)=\frac{N}{N-1}\sigma^2</math>
-모평균과 모분산의 추정
+===모평균과 모분산의 추정===
 *  평균이 <math>\mu</math>인 모집단에서 n 개의 표본 <math>y_1,\cdots,y_n</math> 을 추출할 때 표본평균 <math>\bar{y}</math>는 <math>\mu</math>의 불편추정량이다. 즉<br><math>E(\bar{y})=\mu</math> 이 성립한다.<br>
 *  평균이 <math>\mu</math>, 분산  <math>\sigma^2</math> 인 크기가 N인 모집단에서 n개의 표본  <math>y_1,\cdots,y_n</math>을 추출할 때 표본분산  <math>s^2</math>은  <math>\frac{N}{N-1}\sigma^2</math>의 불편추정량이다. 즉<br><math>E(s^2)=\frac{N}{N-1}\sigma^2</math> 이 성립한다.<br>
@@ 54번째 줄: / 25번째 줄: @@
+==예==
+* 모집단이 $\{1,2,3,4,5,6\}$ 주어진 경우를 생각하자
+** 평균 $\mu=\frac{1+2+3+4+5+6}{6}=\frac{7}{2}$
+===표본의 크기가 2인 경우===
+\begin{array}{c|c|c|c}
+i & \text{sample }i  & \bar{y}_i & s_i^2 \\
+& \{1,2\} & \frac{3}{2} & \frac{1}{4} \\
+& \{1,3\} & 2 & 1 \\
+& \{1,4\} & \frac{5}{2} & \frac{9}{4} \\
+& \{1,5\} & 3 & 4 \\
+& \{1,6\} & \frac{7}{2} & \frac{25}{4} \\
+& \{2,3\} & \frac{5}{2} & \frac{1}{4} \\
+& \{2,4\} & 3 & 1 \\
+& \{2,5\} & \frac{7}{2} & \frac{9}{4} \\
+& \{2,6\} & 4 & 4 \\
+& \{3,4\} & \frac{7}{2} & \frac{1}{4} \\
+& \{3,5\} & 4 & 1 \\
+& \{3,6\} & \frac{9}{2} & \frac{9}{4} \\
+& \{4,5\} & \frac{9}{2} & \frac{1}{4} \\
+& \{4,6\} & 5 & 1 \\
+& \{5,6\} & \frac{11}{2} & \frac{1}{4} \\
+\end{array}
-==예==
+표본평균 $\bar{y}$은 $\left\{\frac{3}{2},2,\frac{5}{2},3,\frac{7}{2},\frac{5}{2},3,\frac{7}{2},4,\frac{7}{2},4,\frac{9}{2},\frac{9}{2},5,\frac{11}{2}\right\}$ 을 모집단으로 하며, 이들의 평균 $E(\bar{y})$과 분산 $V(\bar{y})$ 는 다음과 같이 계산된다
+$$
+E(\bar{y})=\frac{\sum \bar{y}_i}{15}=\frac{\frac{3}{2}+2+\frac{5}{2}+3+\frac{7}{2}+\frac{5}{2}+3+\frac{7}{2}+4+\frac{7}{2}+4+\frac{9}{2}+\frac{9}{2}+5+\frac{11}{2}}{15}=\frac{7}{2}=\mu
+$$
-* 모집단이

"표본평균과 표본분산"의 두 판 사이의 차이

2013년 1월 2일 (수) 03:32 판

목차

개요

유한모집단, 비복원추출의 경우

모평균과 모분산의 추정

예

표본의 크기가 2인 경우

표본평균

표본분산

역사

메모

관련된 항목들

매스매티카 파일 및 계산 리소스

수학용어번역

사전 형태의 자료

리뷰논문, 에세이, 강의노트

관련도서

둘러보기 메뉴

검색