"표본평균과 표본분산"의 두 판 사이의 차이
Pythagoras0 (토론 | 기여) 잔글 (찾아 바꾸기 – “==관련논문== * http://www.jstor.org/action/doBasicSearch?Query= * http://www.ams.org/mathscinet * http://dx.doi.org/” 문자열을 “” 문자열로) |
Pythagoras0 (토론 | 기여) |
||
1번째 줄: | 1번째 줄: | ||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
==개요== | ==개요== | ||
+ | * [[여론조사와 수학|여론조사]] 에 응용되는 통계의 기초 개념 | ||
− | |||
− | |||
− | |||
− | |||
− | |||
==유한모집단, 비복원추출의 경우== | ==유한모집단, 비복원추출의 경우== | ||
+ | * 크기가 N인 유한모집단 $\{x_1,\cdots, x_N\}$의 모평균이 <math>\mu</math>, 모분산이 <math>\sigma^2</math> 이라고 가정하자. | ||
+ | ** 여론조사는, 모집단의 <math>\mu</math>와 <math>\sigma^2</math>를 알지 못하는 상태에서, 하나의 표본을 통하여 이를 추정하는 문제에 해당한다. | ||
+ | * 크기가 n인 표본 $\{y_1,\cdots,y_n\}\subseteq \{x_1,\cdots, x_N\}$ 을 모집단에서 추출했다고 하면, 이로부터 표본평균 <math>\bar{y}</math>과 표본분산 <math>s^2</math>을 다음과 같이 정의한다 : | ||
+ | :<math>\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_{i}</math> | ||
+ | :<math>s^2=\frac{1}{n-1}\sum_{i=1}^{n}(y_{i}-\bar{y})^2</math> | ||
+ | * <math>\bar{y}</math>와 <math>s^2</math> 는 모두 새로운 확률변수로 이해할 수 있으며, 이 확률변수의 평균과 분산을 모평균 <math>\mu</math>, 모분산 <math>\sigma^2</math>를 통하여 표현할 수 있다. | ||
+ | * 확률변수 <math>\bar{y}</math>의 경우 | ||
+ | :<math>E(\bar{y})=\mu,</math> | ||
+ | :<math>V(\bar{y})=\frac{\sigma^2}{n}(\frac{N-n}{N-1})</math> | ||
+ | * 확률변수 <math>s^2</math>의 경우 | ||
+ | :<math>E(s^2)=\frac{N}{N-1}\sigma^2</math> | ||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
+ | ===모평균과 모분산의 추정=== | ||
* 평균이 <math>\mu</math>인 모집단에서 n 개의 표본 <math>y_1,\cdots,y_n</math> 을 추출할 때 표본평균 <math>\bar{y}</math>는 <math>\mu</math>의 불편추정량이다. 즉<br><math>E(\bar{y})=\mu</math> 이 성립한다.<br> | * 평균이 <math>\mu</math>인 모집단에서 n 개의 표본 <math>y_1,\cdots,y_n</math> 을 추출할 때 표본평균 <math>\bar{y}</math>는 <math>\mu</math>의 불편추정량이다. 즉<br><math>E(\bar{y})=\mu</math> 이 성립한다.<br> | ||
* 평균이 <math>\mu</math>, 분산 <math>\sigma^2</math> 인 크기가 N인 모집단에서 n개의 표본 <math>y_1,\cdots,y_n</math>을 추출할 때 표본분산 <math>s^2</math>은 <math>\frac{N}{N-1}\sigma^2</math>의 불편추정량이다. 즉<br><math>E(s^2)=\frac{N}{N-1}\sigma^2</math> 이 성립한다.<br> | * 평균이 <math>\mu</math>, 분산 <math>\sigma^2</math> 인 크기가 N인 모집단에서 n개의 표본 <math>y_1,\cdots,y_n</math>을 추출할 때 표본분산 <math>s^2</math>은 <math>\frac{N}{N-1}\sigma^2</math>의 불편추정량이다. 즉<br><math>E(s^2)=\frac{N}{N-1}\sigma^2</math> 이 성립한다.<br> | ||
54번째 줄: | 25번째 줄: | ||
− | + | ==예== | |
+ | * 모집단이 $\{1,2,3,4,5,6\}$ 주어진 경우를 생각하자 | ||
+ | ** 평균 $\mu=\frac{1+2+3+4+5+6}{6}=\frac{7}{2}$ | ||
− | + | ===표본의 크기가 2인 경우=== | |
+ | \begin{array}{c|c|c|c} | ||
+ | i & \text{sample }i & \bar{y}_i & s_i^2 \\ | ||
+ | 1 & \{1,2\} & \frac{3}{2} & \frac{1}{4} \\ | ||
+ | 2 & \{1,3\} & 2 & 1 \\ | ||
+ | 3 & \{1,4\} & \frac{5}{2} & \frac{9}{4} \\ | ||
+ | 4 & \{1,5\} & 3 & 4 \\ | ||
+ | 5 & \{1,6\} & \frac{7}{2} & \frac{25}{4} \\ | ||
+ | 6 & \{2,3\} & \frac{5}{2} & \frac{1}{4} \\ | ||
+ | 7 & \{2,4\} & 3 & 1 \\ | ||
+ | 8 & \{2,5\} & \frac{7}{2} & \frac{9}{4} \\ | ||
+ | 9 & \{2,6\} & 4 & 4 \\ | ||
+ | 10 & \{3,4\} & \frac{7}{2} & \frac{1}{4} \\ | ||
+ | 11 & \{3,5\} & 4 & 1 \\ | ||
+ | 12 & \{3,6\} & \frac{9}{2} & \frac{9}{4} \\ | ||
+ | 13 & \{4,5\} & \frac{9}{2} & \frac{1}{4} \\ | ||
+ | 14 & \{4,6\} & 5 & 1 \\ | ||
+ | 15 & \{5,6\} & \frac{11}{2} & \frac{1}{4} \\ | ||
+ | \end{array} | ||
− | == | + | 표본평균 $\bar{y}$은 $\left\{\frac{3}{2},2,\frac{5}{2},3,\frac{7}{2},\frac{5}{2},3,\frac{7}{2},4,\frac{7}{2},4,\frac{9}{2},\frac{9}{2},5,\frac{11}{2}\right\}$ 을 모집단으로 하며, 이들의 평균 $E(\bar{y})$과 분산 $V(\bar{y})$ 는 다음과 같이 계산된다 |
+ | $$ | ||
+ | E(\bar{y})=\frac{\sum \bar{y}_i}{15}=\frac{\frac{3}{2}+2+\frac{5}{2}+3+\frac{7}{2}+\frac{5}{2}+3+\frac{7}{2}+4+\frac{7}{2}+4+\frac{9}{2}+\frac{9}{2}+5+\frac{11}{2}}{15}=\frac{7}{2}=\mu | ||
+ | $$ | ||
− | |||
− | |||
2013년 1월 2일 (수) 03:32 판
개요
- 여론조사 에 응용되는 통계의 기초 개념
유한모집단, 비복원추출의 경우
- 크기가 N인 유한모집단 $\{x_1,\cdots, x_N\}$의 모평균이 \(\mu\), 모분산이 \(\sigma^2\) 이라고 가정하자.
- 여론조사는, 모집단의 \(\mu\)와 \(\sigma^2\)를 알지 못하는 상태에서, 하나의 표본을 통하여 이를 추정하는 문제에 해당한다.
- 크기가 n인 표본 $\{y_1,\cdots,y_n\}\subseteq \{x_1,\cdots, x_N\}$ 을 모집단에서 추출했다고 하면, 이로부터 표본평균 \(\bar{y}\)과 표본분산 \(s^2\)을 다음과 같이 정의한다 :
\[\bar{y}=\frac{1}{n}\sum_{i=1}^{n}y_{i}\] \[s^2=\frac{1}{n-1}\sum_{i=1}^{n}(y_{i}-\bar{y})^2\]
- \(\bar{y}\)와 \(s^2\) 는 모두 새로운 확률변수로 이해할 수 있으며, 이 확률변수의 평균과 분산을 모평균 \(\mu\), 모분산 \(\sigma^2\)를 통하여 표현할 수 있다.
- 확률변수 \(\bar{y}\)의 경우
\[E(\bar{y})=\mu,\] \[V(\bar{y})=\frac{\sigma^2}{n}(\frac{N-n}{N-1})\]
- 확률변수 \(s^2\)의 경우
\[E(s^2)=\frac{N}{N-1}\sigma^2\]
모평균과 모분산의 추정
- 평균이 \(\mu\)인 모집단에서 n 개의 표본 \(y_1,\cdots,y_n\) 을 추출할 때 표본평균 \(\bar{y}\)는 \(\mu\)의 불편추정량이다. 즉
\(E(\bar{y})=\mu\) 이 성립한다. - 평균이 \(\mu\), 분산 \(\sigma^2\) 인 크기가 N인 모집단에서 n개의 표본 \(y_1,\cdots,y_n\)을 추출할 때 표본분산 \(s^2\)은 \(\frac{N}{N-1}\sigma^2\)의 불편추정량이다. 즉
\(E(s^2)=\frac{N}{N-1}\sigma^2\) 이 성립한다. - 모평균 \(\mu\)은 표본평균 \(\bar{y}\) 로 추정할 수 있다
- 표본평균의 분산 \(V(\bar{y})\)은 표본분산 \(s^2\)를 이용하여 \(\frac{s^2}{n}(\frac{N-n}{N})\) 로 추정할 수 있다
예
- 모집단이 $\{1,2,3,4,5,6\}$ 주어진 경우를 생각하자
- 평균 $\mu=\frac{1+2+3+4+5+6}{6}=\frac{7}{2}$
표본의 크기가 2인 경우
\begin{array}{c|c|c|c} i & \text{sample }i & \bar{y}_i & s_i^2 \\ 1 & \{1,2\} & \frac{3}{2} & \frac{1}{4} \\ 2 & \{1,3\} & 2 & 1 \\ 3 & \{1,4\} & \frac{5}{2} & \frac{9}{4} \\ 4 & \{1,5\} & 3 & 4 \\ 5 & \{1,6\} & \frac{7}{2} & \frac{25}{4} \\ 6 & \{2,3\} & \frac{5}{2} & \frac{1}{4} \\ 7 & \{2,4\} & 3 & 1 \\ 8 & \{2,5\} & \frac{7}{2} & \frac{9}{4} \\ 9 & \{2,6\} & 4 & 4 \\ 10 & \{3,4\} & \frac{7}{2} & \frac{1}{4} \\ 11 & \{3,5\} & 4 & 1 \\ 12 & \{3,6\} & \frac{9}{2} & \frac{9}{4} \\ 13 & \{4,5\} & \frac{9}{2} & \frac{1}{4} \\ 14 & \{4,6\} & 5 & 1 \\ 15 & \{5,6\} & \frac{11}{2} & \frac{1}{4} \\ \end{array}
표본평균 $\bar{y}$은 $\left\{\frac{3}{2},2,\frac{5}{2},3,\frac{7}{2},\frac{5}{2},3,\frac{7}{2},4,\frac{7}{2},4,\frac{9}{2},\frac{9}{2},5,\frac{11}{2}\right\}$ 을 모집단으로 하며, 이들의 평균 $E(\bar{y})$과 분산 $V(\bar{y})$ 는 다음과 같이 계산된다 $$ E(\bar{y})=\frac{\sum \bar{y}_i}{15}=\frac{\frac{3}{2}+2+\frac{5}{2}+3+\frac{7}{2}+\frac{5}{2}+3+\frac{7}{2}+4+\frac{7}{2}+4+\frac{9}{2}+\frac{9}{2}+5+\frac{11}{2}}{15}=\frac{7}{2}=\mu $$
표본평균
표본분산
- n-1로 나누기 vs n으로 나누기
- n-1 로 나누는 경우, 비편향분산이라고 불리기도 하며, 모집단의 분산에 대한 불편추정량이 되는 좋은 성질을 갖는다.
- http://en.wikipedia.org/wiki/Variance#Population_variance_and_sample_variance
- http://en.wikipedia.org/wiki/Bessel%27s_correction
- Bessel's correction yields an unbiased estimator of the population variance
- http://www.minitab.com/support/documentation/answers/Why%20is%20S2%20the%20unbiased%20estimator.pdf
- 편향분산
역사
메모
- Math Overflow http://mathoverflow.net/search?q=
관련된 항목들
매스매티카 파일 및 계산 리소스
- https://docs.google.com/leaf?id=0B8XXo8Tve1cxYjgwMWFmOTUtMGFmMi00YzE2LThjMWQtZDNkMTEwZGFlYjU5&sort=name&layout=list&num=50
- http://www.wolframalpha.com/input/?i=
- http://functions.wolfram.com/
- NIST Digital Library of Mathematical Functions
- Abramowitz and Stegun Handbook of mathematical functions
- The On-Line Encyclopedia of Integer Sequences
- Numbers, constants and computation
- 매스매티카 파일 목록
수학용어번역
- 한국통계학회 통계학 용어 온라인 대조표
- population 모집단
- sampling without replacement 비복원표집, 비복원추출
사전 형태의 자료
- http://ko.wikipedia.org/wiki/
- http://en.wikipedia.org/wiki/
- The Online Encyclopaedia of Mathematics
- NIST Digital Library of Mathematical Functions
- The World of Mathematical Equations
리뷰논문, 에세이, 강의노트