"벤포드의 법칙"의 두 판 사이의 차이
6번째 줄: | 6번째 줄: | ||
하지만 그렇게 많은 사람이 한 토픽에 관심을 가지지는 않을 것 같기도 하고... 음 잘 모르겠네요. :D | 하지만 그렇게 많은 사람이 한 토픽에 관심을 가지지는 않을 것 같기도 하고... 음 잘 모르겠네요. :D | ||
+ | |||
+ | 일단 그냥 각자 작업을 | ||
72번째 줄: | 74번째 줄: | ||
| <math>0.04578</math> | | <math>0.04578</math> | ||
|} | |} | ||
+ | |||
+ | (출처 필요) | ||
79번째 줄: | 83번째 줄: | ||
1938 년 미국 GE 의 물리학자 Frank Benford 가, 위의 Newcomb 가 발견한 것과 정확히 같은 양상 - 즉 곧 첫 유효숫자의 분포는 <math>\log(1 + 1/d)</math> 와 같이 나타난다 - 을 재발견했다. | 1938 년 미국 GE 의 물리학자 Frank Benford 가, 위의 Newcomb 가 발견한 것과 정확히 같은 양상 - 즉 곧 첫 유효숫자의 분포는 <math>\log(1 + 1/d)</math> 와 같이 나타난다 - 을 재발견했다. | ||
− | 벤포드는 경험적 검증을 위해, 강의 넓이, 사망률, 야구 통계 등 전혀 무관한 임의의 20000 여개의 숫자들를 분석했다. 결과는 경험 법칙을 지지하는 방향으로 나타났다. | + | 벤포드는 경험적 검증을 위해, 강의 넓이, 사망률, 야구 통계 등 전혀 무관한 임의의 20000 여개의 숫자들를 분석했다. 결과는 경험 법칙을 지지하는 방향으로 나타났다. (출처 필요) |
91번째 줄: | 95번째 줄: | ||
− | + | 어떤 분포를 임의로 골라서, 이 분포들에서 임의로 자료를 모으면, 각 분포들 자체는 그렇지 않더라도, 이렇게 결합된 자료는 벤포드 법칙을 따른다는 것을 1996년 힐이 보였다. (출처 필요)<br> | |
+ | |||
+ | '''[4]''' | ||
+ | |||
+ | 단위 불변성은 벤포드 법칙을 함축한다. | ||
+ | |||
+ | |||
+ | |||
+ | '''[5]''' | ||
+ | |||
+ | 벤포드 법칙을 통해 숫자들의 패턴을 분석하면, 숫자 조작, 사기, 오류, 자료에 내재된 편견 등을 검증할 수 있다. |
2009년 7월 8일 (수) 02:17 판
3780379 와 관련된 내용. 제가 아는 것은 여기에 정리합니다.
편집자 노트에서, 한 토픽에 여러 사람이 관여하는 경우에는, 사람-토픽 대신 토픽-사람 배열의 효과적일 수 있을 것 같습니다.
하지만 그렇게 많은 사람이 한 토픽에 관심을 가지지는 않을 것 같기도 하고... 음 잘 모르겠네요. :D
일단 그냥 각자 작업을
벤포드 법칙
[1]
미국의 수학자이자 천문학자인 Simon Newcomb 은, 다른 사람과 함께 쓰던 로그책에서 책의 앞부분이 훨씬 낡아 있는 것을 눈치채었다.
로그표는 수가 커지는 순서대로 배열되어 있다. 그러므로 위 결과는, 실제 계산에서는 맨 앞자리수가 큰 숫자보다, 맨 앞자리수가 작은 수가 더 많이 쓰인다는 사실을 말해 준다.
통상의 계산에서, 계산량이 많아지면 모든 크기의 수가 고르게 사용될텐데, 왜 이 수들의 최대 유효숫자는 이렇지 않을까?
Newcomb 은 다음과 같은 경험법칙을 얻는다.
- 첫 유효숫자 \(d\) 로 시작하는 수의 비율은, (10진법에서) 1/9 가 아니라 \(\log(1 + 1/d)\) 와 같이 나타난다
이 사실을 그는 American Journal of Mathematics 에 간략하게 실었으나, 수학적 분석이 없었으므로 별 주목을 받지 못했음. (1881)
(실제로 AJM 에서 저널을 검색해 볼 수 있으면 좋겠습니다)
\(d\) | 직관적 확률 | 경험적 확률 |
---|---|---|
\(1\) | \(0.111\cdots\) | \(0.30103\) |
\(2\) | \(0.111\cdots\) | \(0.17609\) |
\(3\) | \(0.111\cdots\) | \(0.12494\) |
\(4\) | \(0.111\cdots\) | \(0.09691\) |
\(5\) | \(0.111\cdots\) | \(0.07918\) |
\(6\) | \(0.111\cdots\) | \(0.06695\) |
\(7\) | \(0.111\cdots\) | \(0.05799\) |
\(8\) | \(0.111\cdots\) | \(0.05115\) |
\(9\) | \(0.111\cdots\) | \(0.04578\) |
(출처 필요)
[2]
1938 년 미국 GE 의 물리학자 Frank Benford 가, 위의 Newcomb 가 발견한 것과 정확히 같은 양상 - 즉 곧 첫 유효숫자의 분포는 \(\log(1 + 1/d)\) 와 같이 나타난다 - 을 재발견했다.
벤포드는 경험적 검증을 위해, 강의 넓이, 사망률, 야구 통계 등 전혀 무관한 임의의 20000 여개의 숫자들를 분석했다. 결과는 경험 법칙을 지지하는 방향으로 나타났다. (출처 필요)
[3]
많은 숫자의 나열이 벤포드 법칙을 따르지는 않는다. 극도로 임의적이거나, 정규분포나 균일 분포를 따르는 숫자의 나열이 그러하다.
자료가 벤포드 법칙을 따르려면 꼭 들어맞는 구조를 갖추어야 할 것으로 보인다.
어떤 분포를 임의로 골라서, 이 분포들에서 임의로 자료를 모으면, 각 분포들 자체는 그렇지 않더라도, 이렇게 결합된 자료는 벤포드 법칙을 따른다는 것을 1996년 힐이 보였다. (출처 필요)
[4]
단위 불변성은 벤포드 법칙을 함축한다.
[5]
벤포드 법칙을 통해 숫자들의 패턴을 분석하면, 숫자 조작, 사기, 오류, 자료에 내재된 편견 등을 검증할 수 있다.