"2012년 대선 개표와 로지스틱 곡선"의 두 판 사이의 차이
둘러보기로 가기
검색하러 가기
Pythagoras0 (토론 | 기여) |
Pythagoras0 (토론 | 기여) |
||
(같은 사용자의 중간 판 38개는 보이지 않습니다) | |||
1번째 줄: | 1번째 줄: | ||
− | == | + | ==개요== |
− | * | + | * 다음 아고라를 중심으로 2012년 대선 개표에 부정이 있다는 주장을 담은 글들이 올라옴 |
− | * | + | * 특히 '그루터기추억'이 작성한 글들은 대선 개표와 로지스틱 함수를 연관시켜 화제가 되고 주목을 받음 |
− | * | + | ** 여러 글에 걸쳐 있을 수 없는 일이 일어났다는 식의 주장을 내놓고, 그에 대한 근거라며 이러저러한 계산 결과와 수치들을 제시함 |
− | * | + | * 검토 후 판단 |
− | * | + | ** 개표 부정이라며 제시하는 현상이 수학/통계에 훈련된 사람이라면 대개 자연스럽다거나 또는 특별할 것이 없다고 여기는 것들 |
− | * | + | ** 아무런 의미가 없거나(로지스틱 확률함수 <math>p</math>), 놀라울 게 없는 계산(다항식을 이용한 보간 등)을 해놓고 엄청난 일처럼 이야기를 함 |
+ | ** 수학/통계에 대한 이해가 별로 없는 사람들에게 개표 부정에 대한 불안감을 증폭시키고 있으니 주의를 요망함 | ||
− | ==가장 화제가 된 글의 삽질== | + | =='그루터기추억' 글 중에서도 가장 화제가 된 글의 삽질== |
* 여러 글 중에서도 [http://bbs1.agora.media.daum.net/gaia/do/debate/read?bbsId=D115&articleId=2235846 로지스틱함수에 의해 사전에 계산된 ... 박근혜 후보의 득표수!!] 는 많은 조회수와 답변을 기록 | * 여러 글 중에서도 [http://bbs1.agora.media.daum.net/gaia/do/debate/read?bbsId=D115&articleId=2235846 로지스틱함수에 의해 사전에 계산된 ... 박근혜 후보의 득표수!!] 는 많은 조회수와 답변을 기록 | ||
− | * 시간대별 로지스틱 확률함수 | + | * 시간대별 로지스틱 확률함수 <math>p(t)</math>라는 것을 제시하고, 그로부터 시간대별 누적득표수를 정확히 계산할 수 있다는 주장을 해서 많은 사람들을 충격과 공포에 빠뜨림. |
+ | * <math>p</math>라는 것이 어떻게 얻어진 것인지를 이 글에서는 제시하지 않았기 때문에 고개를 갸우뚱하게 함 | ||
+ | ** 이에 대한 계산 과정은 논란 이후에 또다른 글 [http://bbs1.agora.media.daum.net/gaia/do/debate/read?bbsId=D115&articleId=2236975 누적득표량에 대한 로지스틱곡선들이 ... 알려주는 중요한 것들] 에서 그루터기추억이 밝혀 놓음 | ||
+ | * 아래에서는 논리를 재구성하여 무엇이 뻘 계산인지를 밝히려 함 | ||
− | ===그루터기추억의 | + | ===그루터기추억의 <math>p</math>와 <math>f</math>=== |
− | * 집합 | + | * 집합 <math>\{1,2,\cdots, 21\}</math> 를 정의역으로 하는 두 함수 <math>f,g</math>에 대하여, 함수 <math>p</math>를 다음과 같이 정의하자 |
− | + | :<math> | |
p(t):=\frac{f(1) f(t) g(t)}{f(1) (g(t)-1)+f(t)} | p(t):=\frac{f(1) f(t) g(t)}{f(1) (g(t)-1)+f(t)} | ||
− | + | </math> | |
* 이 정의로부터 다음을 얻는다 (일명 그루터기추억의 항등식) | * 이 정의로부터 다음을 얻는다 (일명 그루터기추억의 항등식) | ||
− | + | :<math>\label{fep} | |
f(t)=\frac{p(1) (1-g(t)) p(t)}{p(t)-p(1) g(t)} | f(t)=\frac{p(1) (1-g(t)) p(t)}{p(t)-p(1) g(t)} | ||
− | + | </math> | |
− | * 중요한 점은 함수 | + | * 중요한 점은 함수 <math>g</math>가 주어져 있기만 한다면 그게 '''무엇이든 상관없이''' <math>f</math>로부터 <math>p</math>를 계산할 수 있고, 마찬가지로 <math>p</math>로부터 <math>f</math>를 계산할 수 있다는 사실. |
− | * 이 글에서 | + | * 이 글에서 <math>f(t)</math>는 박근혜 후보의 시간 <math>t</math>에서의 누적득표수의 비율로 다음 표로 제시됨 |
− | * | + | [[파일:박근혜 후보의 시간대별 득표수와 비율.gif]] |
+ | * <math>g(t)=e^t</math> 가 사용되었고, 여기서 로지스틱 확률함수라고 부르는 <math>p(t)</math>가 계산된 것임. | ||
+ | * <math>g(t)=e^t</math> 의 선택 때문에 <math>p</math>의 그래프가 로지스틱 곡선과 비슷하게 나타남. | ||
− | === | + | ===로지스틱 음모가 아니라 혹시 사인 음모론은 아닌가=== |
− | * | + | * <math>g</math>를 다른 함수로 선택하면, <math>p</math> 역시 다른 함수가 될 것임. |
− | * 가령 | + | * 가령 <math>g(t)=\sin t</math>로 두면, <math>p</math>의 (적당한 내삽을 거쳐) 그래프는 다음과 같이 주어짐 |
[[파일:2012년 대선 개표와 로지스틱 곡선1.gif]] | [[파일:2012년 대선 개표와 로지스틱 곡선1.gif]] | ||
− | * 물론 이 | + | * 물론 이 <math>p(t)</math>를 가지고도, 그루터기추억의 항등식 \ref{fep}을 사용하여 박근혜 후보의 시간대별 누적득표수를 '''완벽하게 계산'''할 수 있음 |
* 그러면 이것은 로지스틱 음모론이 아니라 사인 음모론인가? | * 그러면 이것은 로지스틱 음모론이 아니라 사인 음모론인가? | ||
+ | |||
===요약정리=== | ===요약정리=== | ||
− | * 이 글에서 제시된 시간대별 로지스틱 확률함수 | + | * 이 글에서 제시된 시간대별 로지스틱 확률함수 <math>p(t)</math>라는 것은 <math>g</math>가 지수함수이기 때문에 로지스틱 곡선의 모양을 하게 된 것뿐임 |
− | * 가령, | + | * 가령, <math>g</math>를 사인함수로 선택하면, <math>p</math>는 사인곡선 모양을 함 |
− | * | + | * '''거창하게 로지스틱 확률함수 <math>p</math>라고 이름을 붙였으나, <math>g</math>와 <math>p</math>는 아무런 쓸모가 없는 무의미한 것들''' |
+ | * 뒤로 932미터, 앞으로 932미터 열심히 움직이고 났더니 제자리라며 놀라서 숫자 932에서 의미를 찾는 수준의, '''뻘 계산을 담고 있는 헛소리임''' | ||
+ | |||
+ | |||
+ | ==시간-누적득표 곡선이 S자 형태가 되는 것은 놀라운 일인가== | ||
+ | * 결론부터 말하면 별로 놀라울 것이 없음 | ||
+ | |||
+ | |||
+ | |||
+ | ===S자 곡선에 대한 직관적인 이해=== | ||
+ | * 수식을 쓰지 않아도, 이를 이해하는 것은 크게 어렵지 않음 | ||
+ | * 개표작업이 시간에 따라 어떻게 변하는지를 이해하기 | ||
+ | ** 개표가 시작되기 전에는 기울기가 0인 직선 | ||
+ | ** 개표소에 따라 차이를 갖고 개표 작업이 시작되면서 기울기가 점차 증가하기 시작함 | ||
+ | ** 모든 개표소의 작업이 궤도에 오르면 기울기는 상당히 안정된 범위에 들어가게 됨 | ||
+ | ** 개표소에 따라 개표가 점차 마무리 단계에 접어들면 기울기가 줄어들기 시작함 | ||
+ | ** 개표가 끝난 후에는 기울기가 0 | ||
+ | * 이러한 조건을 만족시키는 가장 간단하고 직관적인 곡선이라면 S자 형태의 로지스틱 곡선이 될 것임 | ||
+ | |||
+ | ===곡선 접합(curve fitting)의 계산=== | ||
+ | * 수학이나 통계용 소프트웨어를 사용하면 데이터에 대한 곡선 접합을 어렵지 않게 얻을 수 있음 | ||
+ | ** 가령 [http://aleph.sagemath.org/?q=2e2e666c-bbd4-4e72-b818-83077cc7708c&lang=sage sage cell 을 이용한 계산] 에서 확인해 볼 수 있음 | ||
+ | * 시간-누적득표 곡선은 직관대로 그럴듯한 로지스틱 곡선 접합을 찾을 수 있음 | ||
+ | [[파일:2012년 대선 개표와 로지스틱 곡선3.gif]] | ||
+ | * 하지만 그것이 '''수학적으로 완벽한 로지스틱 곡선이라는 주장의 상당 부분은 위에서 검토한 그루터기추억의 뻘 계산에서 온 오해''' | ||
+ | * 위에 <math>f</math>로 제시된 시간에 따른 누적득표 비율은, 개표가 거의 마무리된 단계, 즉 기울기가 0에 가까운 부분들이 많이 포함되어 있어 더 좋은 로지스틱 곡선 접합이 얻어짐 | ||
+ | * 기울기가 안정된 가운데 부분들만 놓고 본다면 좋은 선형성을 가짐 | ||
+ | [[파일:2012년 대선 개표와 로지스틱 곡선2.gif]] | ||
+ | |||
+ | |||
+ | ==관련된 항목들== | ||
+ | * [[로지스틱 미분방정식]] | ||
+ | * [[보간법 (interpolation)]] | ||
+ | * [[표본평균과 표본분산]] | ||
+ | |||
+ | |||
+ | ==계산 리소스== | ||
+ | * https://docs.google.com/file/d/0B8XXo8Tve1cxOTJjMkFqdWVkaVU/edit | ||
+ | * [http://aleph.sagemath.org/?q=2e2e666c-bbd4-4e72-b818-83077cc7708c&lang=sage sage cell 을 이용한 로지스틱 곡선 접합의 계산] | ||
+ | |||
+ | |||
+ | ==관련 기사 및 보도자료== | ||
+ | * 2013년 1월 1일, 중앙선관위, [http://www.nec.go.kr/nec_new2009/BoardCotBySeq.do 보도자료 - 대선결과 불복에 대한 입장] | ||
+ | |||
+ | |||
+ | |||
+ | ==다음 아고라의 글== | ||
+ | * [http://agora.media.daum.net/nsearch/total?query=%EB%A1%9C%EC%A7%80%EC%8A%A4%ED%8B%B1&sort_type=1&board_id=&user_id=&user_name=&recent_date=&start_date=&end_date=&page_no=1 '로지스틱' 이 들어가는 글] | ||
+ | ===그루터기추억의 글=== | ||
+ | * [http://agora.media.daum.net/my/list?key=.tMmGFb2X6Y0&group_id=1 '그루터기추억'이 작성한 글 검색] | ||
+ | * [http://bbs1.agora.media.daum.net/gaia/do/debate/read?bbsId=D115&articleId=2233336 이번 대선 득표율 그래프는 ... 정확히 로지스틱곡선에 해당된다] | ||
+ | * [http://bbs1.agora.media.daum.net/gaia/do/debate/read?bbsId=D115&articleId=2236975 누적득표량에 대한 로지스틱곡선들이 ... 알려주는 중요한 것들] | ||
+ | * [http://bbs1.agora.media.daum.net/gaia/do/debate/read?bbsId=D115&articleId=2235846 로지스틱함수에 의해 사전에 계산된 ... 박근혜 후보의 득표수!!] | ||
+ | * [http://bbs1.agora.media.daum.net/gaia/do/debate/read?bbsId=D115&articleId=2239553 로지스틱 곡선형태의 대선 득표수에 대한 합리적인 의심과 의문!] | ||
+ | * [http://bbs1.agora.media.daum.net/gaia/do/debate/read?bbsId=D115&articleId=2234009 로지스틱곡선에 의한, 간단한 당선 유력 발표시점 산출 방법] | ||
+ | |||
+ | |||
+ | |||
+ | ==메모== | ||
+ | * David Arnold, [http://home2.fvcc.edu/~dhicketh/DiffEqns/Activities/logistic.pdf Fitting a Logistic Curve to Data], February 24, 2002 | ||
+ | * Kumar, K. 1998. “82.44 Fitting of Sigmoidal Growth Curves.” The Mathematical Gazette 82 (494) (July 1): 306–309. doi:10.2307/3620427. | ||
+ | * Cavallini, Fabio. 1993. “Fitting a Logistic Curve to Data.” The College Mathematics Journal 24 (3) (May 1): 247–253. doi:10.2307/2686488. |
2020년 11월 12일 (목) 01:17 기준 최신판
개요
- 다음 아고라를 중심으로 2012년 대선 개표에 부정이 있다는 주장을 담은 글들이 올라옴
- 특히 '그루터기추억'이 작성한 글들은 대선 개표와 로지스틱 함수를 연관시켜 화제가 되고 주목을 받음
- 여러 글에 걸쳐 있을 수 없는 일이 일어났다는 식의 주장을 내놓고, 그에 대한 근거라며 이러저러한 계산 결과와 수치들을 제시함
- 검토 후 판단
- 개표 부정이라며 제시하는 현상이 수학/통계에 훈련된 사람이라면 대개 자연스럽다거나 또는 특별할 것이 없다고 여기는 것들
- 아무런 의미가 없거나(로지스틱 확률함수 \(p\)), 놀라울 게 없는 계산(다항식을 이용한 보간 등)을 해놓고 엄청난 일처럼 이야기를 함
- 수학/통계에 대한 이해가 별로 없는 사람들에게 개표 부정에 대한 불안감을 증폭시키고 있으니 주의를 요망함
'그루터기추억' 글 중에서도 가장 화제가 된 글의 삽질
- 여러 글 중에서도 로지스틱함수에 의해 사전에 계산된 ... 박근혜 후보의 득표수!! 는 많은 조회수와 답변을 기록
- 시간대별 로지스틱 확률함수 \(p(t)\)라는 것을 제시하고, 그로부터 시간대별 누적득표수를 정확히 계산할 수 있다는 주장을 해서 많은 사람들을 충격과 공포에 빠뜨림.
- \(p\)라는 것이 어떻게 얻어진 것인지를 이 글에서는 제시하지 않았기 때문에 고개를 갸우뚱하게 함
- 이에 대한 계산 과정은 논란 이후에 또다른 글 누적득표량에 대한 로지스틱곡선들이 ... 알려주는 중요한 것들 에서 그루터기추억이 밝혀 놓음
- 아래에서는 논리를 재구성하여 무엇이 뻘 계산인지를 밝히려 함
그루터기추억의 \(p\)와 \(f\)
- 집합 \(\{1,2,\cdots, 21\}\) 를 정의역으로 하는 두 함수 \(f,g\)에 대하여, 함수 \(p\)를 다음과 같이 정의하자
\[ p(t):=\frac{f(1) f(t) g(t)}{f(1) (g(t)-1)+f(t)} \]
- 이 정의로부터 다음을 얻는다 (일명 그루터기추억의 항등식)
\[\label{fep} f(t)=\frac{p(1) (1-g(t)) p(t)}{p(t)-p(1) g(t)} \]
- 중요한 점은 함수 \(g\)가 주어져 있기만 한다면 그게 무엇이든 상관없이 \(f\)로부터 \(p\)를 계산할 수 있고, 마찬가지로 \(p\)로부터 \(f\)를 계산할 수 있다는 사실.
- 이 글에서 \(f(t)\)는 박근혜 후보의 시간 \(t\)에서의 누적득표수의 비율로 다음 표로 제시됨
- \(g(t)=e^t\) 가 사용되었고, 여기서 로지스틱 확률함수라고 부르는 \(p(t)\)가 계산된 것임.
- \(g(t)=e^t\) 의 선택 때문에 \(p\)의 그래프가 로지스틱 곡선과 비슷하게 나타남.
로지스틱 음모가 아니라 혹시 사인 음모론은 아닌가
- \(g\)를 다른 함수로 선택하면, \(p\) 역시 다른 함수가 될 것임.
- 가령 \(g(t)=\sin t\)로 두면, \(p\)의 (적당한 내삽을 거쳐) 그래프는 다음과 같이 주어짐
- 물론 이 \(p(t)\)를 가지고도, 그루터기추억의 항등식 \ref{fep}을 사용하여 박근혜 후보의 시간대별 누적득표수를 완벽하게 계산할 수 있음
- 그러면 이것은 로지스틱 음모론이 아니라 사인 음모론인가?
요약정리
- 이 글에서 제시된 시간대별 로지스틱 확률함수 \(p(t)\)라는 것은 \(g\)가 지수함수이기 때문에 로지스틱 곡선의 모양을 하게 된 것뿐임
- 가령, \(g\)를 사인함수로 선택하면, \(p\)는 사인곡선 모양을 함
- 거창하게 로지스틱 확률함수 \(p\)라고 이름을 붙였으나, \(g\)와 \(p\)는 아무런 쓸모가 없는 무의미한 것들
- 뒤로 932미터, 앞으로 932미터 열심히 움직이고 났더니 제자리라며 놀라서 숫자 932에서 의미를 찾는 수준의, 뻘 계산을 담고 있는 헛소리임
시간-누적득표 곡선이 S자 형태가 되는 것은 놀라운 일인가
- 결론부터 말하면 별로 놀라울 것이 없음
S자 곡선에 대한 직관적인 이해
- 수식을 쓰지 않아도, 이를 이해하는 것은 크게 어렵지 않음
- 개표작업이 시간에 따라 어떻게 변하는지를 이해하기
- 개표가 시작되기 전에는 기울기가 0인 직선
- 개표소에 따라 차이를 갖고 개표 작업이 시작되면서 기울기가 점차 증가하기 시작함
- 모든 개표소의 작업이 궤도에 오르면 기울기는 상당히 안정된 범위에 들어가게 됨
- 개표소에 따라 개표가 점차 마무리 단계에 접어들면 기울기가 줄어들기 시작함
- 개표가 끝난 후에는 기울기가 0
- 이러한 조건을 만족시키는 가장 간단하고 직관적인 곡선이라면 S자 형태의 로지스틱 곡선이 될 것임
곡선 접합(curve fitting)의 계산
- 수학이나 통계용 소프트웨어를 사용하면 데이터에 대한 곡선 접합을 어렵지 않게 얻을 수 있음
- 가령 sage cell 을 이용한 계산 에서 확인해 볼 수 있음
- 시간-누적득표 곡선은 직관대로 그럴듯한 로지스틱 곡선 접합을 찾을 수 있음
- 하지만 그것이 수학적으로 완벽한 로지스틱 곡선이라는 주장의 상당 부분은 위에서 검토한 그루터기추억의 뻘 계산에서 온 오해
- 위에 \(f\)로 제시된 시간에 따른 누적득표 비율은, 개표가 거의 마무리된 단계, 즉 기울기가 0에 가까운 부분들이 많이 포함되어 있어 더 좋은 로지스틱 곡선 접합이 얻어짐
- 기울기가 안정된 가운데 부분들만 놓고 본다면 좋은 선형성을 가짐
관련된 항목들
계산 리소스
관련 기사 및 보도자료
- 2013년 1월 1일, 중앙선관위, 보도자료 - 대선결과 불복에 대한 입장
다음 아고라의 글
그루터기추억의 글
- '그루터기추억'이 작성한 글 검색
- 이번 대선 득표율 그래프는 ... 정확히 로지스틱곡선에 해당된다
- 누적득표량에 대한 로지스틱곡선들이 ... 알려주는 중요한 것들
- 로지스틱함수에 의해 사전에 계산된 ... 박근혜 후보의 득표수!!
- 로지스틱 곡선형태의 대선 득표수에 대한 합리적인 의심과 의문!
- 로지스틱곡선에 의한, 간단한 당선 유력 발표시점 산출 방법
메모
- David Arnold, Fitting a Logistic Curve to Data, February 24, 2002
- Kumar, K. 1998. “82.44 Fitting of Sigmoidal Growth Curves.” The Mathematical Gazette 82 (494) (July 1): 306–309. doi:10.2307/3620427.
- Cavallini, Fabio. 1993. “Fitting a Logistic Curve to Data.” The College Mathematics Journal 24 (3) (May 1): 247–253. doi:10.2307/2686488.