"N차원 가우시안 적분"의 두 판 사이의 차이
Pythagoras0 (토론 | 기여) |
Pythagoras0 (토론 | 기여) |
||
1번째 줄: | 1번째 줄: | ||
==개요== | ==개요== | ||
− | * [[1차원 가우시안 적분]] 의 | + | * [[1차원 가우시안 적분]] 의 $n$차원에서의 일반화 |
− | * A : 양의 정부호인 | + | * $A=(A_{ij})$ : 양의 정부호인 $n\times n$ 대칭행렬 |
* 가우시안 적분 | * 가우시안 적분 | ||
− | :<math>\int_{\mathbb{R}^n} | + | :<math>\int_{\mathbb{R}^n}\exp\left( - \frac {1}{2} \sum_{i,j=1}^{n}A_{ij} x_i x_j \right)\,d\mathbf{x}=\sqrt{\frac{(2\pi)^n}{\det{A}}}</math> |
* 1차항이 있는 경우는 다음과 같이 주어진다 | * 1차항이 있는 경우는 다음과 같이 주어진다 | ||
$$ | $$ | ||
− | \int_{\mathbb{R}^n} | + | \int_{\mathbb{R}^n} \exp\left(-\frac{1}{2}\sum_{i,j=1}^{n}A_{ij} x_i x_j+\sum_{i=1}^{n}b_i x_i\right)\,d\mathbf{x}=\sqrt{ \frac{(2\pi)^n}{\det{A}} }\exp\left(\frac{1}{2}\mathbf{b}^{t}A^{-1}\mathbf{b}\right) \label{lin} |
$$ | $$ | ||
* [[푸리에 변환]]에 응용 | * [[푸리에 변환]]에 응용 | ||
− | ==일반화== | + | ===일반화=== |
* 적당한 decay 조건을 만족시키는 함수 $f$에 대하여, 다음이 성립한다 | * 적당한 decay 조건을 만족시키는 함수 $f$에 대하여, 다음이 성립한다 | ||
$$ | $$ | ||
− | \ | + | \int_{\mathbb{R}^n} f(\vec x) \, \exp\left( - \frac {1}{2} \sum_{i,j=1}^{n}A_{ij} x_i x_j \right) \,d\mathbf{x}=\sqrt{(2\pi)^n\over \det A} \, \left. \exp\left({1\over 2}\sum_{i,j=1}^{n}(A^{-1})_{ij}{\partial \over \partial x_i}{\partial \over \partial x_j}\right)f(\vec{x})\right|_{\vec{x}=0} |
$$ | $$ | ||
+ | ==예== | ||
+ | * [[이차형식 x^2+xy+y^2]]에서 세타함수에 대한 다음의 항등식을 얻었다 | ||
+ | $$ | ||
+ | \sum_{(x,y)\in \mathbb{Z}^2}e^{-\pi t (x^2+x y+y^2)}=\frac{2}{t\sqrt{3}}\sum_{(x,y)\in \mathbb{Z}^2}e^{-\frac{4\pi}{3t}(x^2+x y+y^2)} | ||
+ | $$ | ||
+ | * 이를 얻는 과정에 다음과 같은 적분이 등장 | ||
+ | $$ | ||
+ | \hat{f}(u,v):=\int _{-\infty }^{\infty }\int _{-\infty }^{\infty }\exp \left(-\pi t (x^2+x y+y^2)+2 \pi i (u x+v y)\right)\,dydx \label{exp} | ||
+ | $$ | ||
+ | * \ref{lin}을 적용하기 위해 $A=2\pi t\left( | ||
+ | \begin{array}{cc} | ||
+ | 1 & 1/2 \\ | ||
+ | 1/2 & 1 | ||
+ | \end{array} | ||
+ | \right),\, \mathbf{b}=2\pi i (u,v)$로 두면, 다음을 확인할 수 있다 | ||
+ | $$ | ||
+ | \det A=3 \pi ^2 t^2, \\ | ||
+ | A^{-1}=\left( | ||
+ | \begin{array}{cc} | ||
+ | \frac{2}{3 \pi t} & -\frac{1}{3 \pi t} \\ | ||
+ | -\frac{1}{3 \pi t} & \frac{2}{3 \pi t} | ||
+ | \end{array} | ||
+ | \right),\\ | ||
+ | \mathbf{b}^{t}A^{-1}\mathbf{b}=-\frac{8 \pi \left(u^2-u v+v^2\right)}{3 t} | ||
+ | $$ | ||
+ | * 따라서 \ref{exp}는 다음과 같다 | ||
+ | $$ | ||
+ | \hat{f}(u,v)=\frac{2}{\sqrt{3} t}\exp\left(-\frac{4 \pi \left(u^2-u v+v^2\right)}{3 t}\right) | ||
+ | $$ | ||
− | |||
− | :<math>\int_{-\infty}^\infty\prod_{i=1}^ | + | ==\ref{lin}의 증명== |
+ | ;정리 | ||
+ | :<math>\int_{-\infty}^\infty\prod_{i=1}^n d\sigma_i\exp\left(-\frac{1}{2}\sum_{i,j=1}^n\sigma_iA_{ij}\sigma_j+\sum_{i=1}^n h_i\sigma_i\right)\\=\frac{(2\pi)^{n/2}}{|A|^{1/2}}\exp\left(\frac{1}{2}\sum_{i,j=1}^nh_iA_{ij}^{-1}h_j\right)</math> | ||
이게 가우스 변환인데요, [[이징 모형의 범함수 적분 형태]]에서 증명 없이 이용한 적이 있습니다. | 이게 가우스 변환인데요, [[이징 모형의 범함수 적분 형태]]에서 증명 없이 이용한 적이 있습니다. | ||
− | + | ;증명 | |
− | |||
A는 대칭행렬이므로 대각화가 가능하고 A의 고유값과 고유벡터를 구한 후 고유벡터로 이루어진 행렬 U를 이용해서 다음처럼 쓸 수 있습니다. | A는 대칭행렬이므로 대각화가 가능하고 A의 고유값과 고유벡터를 구한 후 고유벡터로 이루어진 행렬 U를 이용해서 다음처럼 쓸 수 있습니다. | ||
− | :<math>A=U\lambda U^{-1},\ \lambda=diag(\lambda_1,\cdots,\ | + | :<math>A=U\lambda U^{-1},\ \lambda=diag(\lambda_1,\cdots,\lambda_n)</math> |
위 두번째 식은 행렬 λ가 A의 고유값들로 이루어진 대각 행렬이라는 걸 말합니다. 즉 λ의 대각 요소만 0이 아니며 이 요소들 각각이 A의 고유값이라는 거죠. σ<sub>i</sub>들로 이루어진 벡터를 편의상 σ으로 쓰고 h<sub>i</sub>들로 이루어진 벡터를 편의상 h로 쓰겠습니다. 위의 U를 이용해서 σ와 h도 변환시켜줍니다. | 위 두번째 식은 행렬 λ가 A의 고유값들로 이루어진 대각 행렬이라는 걸 말합니다. 즉 λ의 대각 요소만 0이 아니며 이 요소들 각각이 A의 고유값이라는 거죠. σ<sub>i</sub>들로 이루어진 벡터를 편의상 σ으로 쓰고 h<sub>i</sub>들로 이루어진 벡터를 편의상 h로 쓰겠습니다. 위의 U를 이용해서 σ와 h도 변환시켜줍니다. | ||
40번째 줄: | 69번째 줄: | ||
&=\int\prod_id\tau_i\exp\left(-\frac{1}{2}\sum_i\lambda_i\tau_i^2+\sum_ix_i\tau_i\right)\\ | &=\int\prod_id\tau_i\exp\left(-\frac{1}{2}\sum_i\lambda_i\tau_i^2+\sum_ix_i\tau_i\right)\\ | ||
&= \prod_i\int d\tau_i \exp\left(-\frac{1}{2}\lambda_i\tau_i^2+x_i\tau_i\right)=\prod_i\sqrt{\frac{2\pi}{\lambda_i}}\exp\left(x_i^2/2\lambda_i\right)\\ | &= \prod_i\int d\tau_i \exp\left(-\frac{1}{2}\lambda_i\tau_i^2+x_i\tau_i\right)=\prod_i\sqrt{\frac{2\pi}{\lambda_i}}\exp\left(x_i^2/2\lambda_i\right)\\ | ||
− | &= \frac{(2\pi)^{ | + | &= \frac{(2\pi)^{n/2}}{|A|^{1/2}}\exp\left(\frac{1}{2}\sum_ix_i\lambda_i^{-1}x_i\right)= \frac{(2\pi)^{n/2}}{|A|^{1/2}}\exp\left(\frac{1}{2}x^T\lambda^{-1}x\right) \\ |
− | &= \frac{(2\pi)^{ | + | &= \frac{(2\pi)^{n/2}}{|A|^{1/2}}\exp\left(\frac{1}{2}\sum_{i,j=1}^nh_iA_{ij}^{-1}h_j\right) |
\end{aligned} | \end{aligned} | ||
</math> | </math> | ||
+ | |||
증명의 아이디어는 A를 대각화하여 얽혀 있는 σ<sub>i</sub>들을 서로 떼어놓음으로써 각 σ<sub>i</sub>에 대한 적분이 가능해진다는 거죠. | 증명의 아이디어는 A를 대각화하여 얽혀 있는 σ<sub>i</sub>들을 서로 떼어놓음으로써 각 σ<sub>i</sub>에 대한 적분이 가능해진다는 거죠. | ||
+ | |||
61번째 줄: | 92번째 줄: | ||
− | ==계산 리소스== | + | ==매스매티카 파일 및 계산 리소스== |
+ | * https://docs.google.com/file/d/0B8XXo8Tve1cxalJfcUxZYXY5QTQ/edit | ||
* http://mathematica.stackexchange.com/questions/6845/how-to-deal-with-complicated-gaussian-integrals-in-mathematica/6846#6846 | * http://mathematica.stackexchange.com/questions/6845/how-to-deal-with-complicated-gaussian-integrals-in-mathematica/6846#6846 | ||
2014년 1월 16일 (목) 07:51 판
개요
- 1차원 가우시안 적분 의 $n$차원에서의 일반화
- $A=(A_{ij})$ : 양의 정부호인 $n\times n$ 대칭행렬
- 가우시안 적분
\[\int_{\mathbb{R}^n}\exp\left( - \frac {1}{2} \sum_{i,j=1}^{n}A_{ij} x_i x_j \right)\,d\mathbf{x}=\sqrt{\frac{(2\pi)^n}{\det{A}}}\]
- 1차항이 있는 경우는 다음과 같이 주어진다
$$ \int_{\mathbb{R}^n} \exp\left(-\frac{1}{2}\sum_{i,j=1}^{n}A_{ij} x_i x_j+\sum_{i=1}^{n}b_i x_i\right)\,d\mathbf{x}=\sqrt{ \frac{(2\pi)^n}{\det{A}} }\exp\left(\frac{1}{2}\mathbf{b}^{t}A^{-1}\mathbf{b}\right) \label{lin} $$
- 푸리에 변환에 응용
일반화
- 적당한 decay 조건을 만족시키는 함수 $f$에 대하여, 다음이 성립한다
$$ \int_{\mathbb{R}^n} f(\vec x) \, \exp\left( - \frac {1}{2} \sum_{i,j=1}^{n}A_{ij} x_i x_j \right) \,d\mathbf{x}=\sqrt{(2\pi)^n\over \det A} \, \left. \exp\left({1\over 2}\sum_{i,j=1}^{n}(A^{-1})_{ij}{\partial \over \partial x_i}{\partial \over \partial x_j}\right)f(\vec{x})\right|_{\vec{x}=0} $$
예
- 이차형식 x^2+xy+y^2에서 세타함수에 대한 다음의 항등식을 얻었다
$$ \sum_{(x,y)\in \mathbb{Z}^2}e^{-\pi t (x^2+x y+y^2)}=\frac{2}{t\sqrt{3}}\sum_{(x,y)\in \mathbb{Z}^2}e^{-\frac{4\pi}{3t}(x^2+x y+y^2)} $$
- 이를 얻는 과정에 다음과 같은 적분이 등장
$$ \hat{f}(u,v):=\int _{-\infty }^{\infty }\int _{-\infty }^{\infty }\exp \left(-\pi t (x^2+x y+y^2)+2 \pi i (u x+v y)\right)\,dydx \label{exp} $$
- \ref{lin}을 적용하기 위해 $A=2\pi t\left(
\begin{array}{cc} 1 & 1/2 \\ 1/2 & 1 \end{array} \right),\, \mathbf{b}=2\pi i (u,v)$로 두면, 다음을 확인할 수 있다 $$ \det A=3 \pi ^2 t^2, \\ A^{-1}=\left( \begin{array}{cc} \frac{2}{3 \pi t} & -\frac{1}{3 \pi t} \\ -\frac{1}{3 \pi t} & \frac{2}{3 \pi t} \end{array} \right),\\ \mathbf{b}^{t}A^{-1}\mathbf{b}=-\frac{8 \pi \left(u^2-u v+v^2\right)}{3 t} $$
- 따라서 \ref{exp}는 다음과 같다
$$ \hat{f}(u,v)=\frac{2}{\sqrt{3} t}\exp\left(-\frac{4 \pi \left(u^2-u v+v^2\right)}{3 t}\right) $$
\ref{lin}의 증명
- 정리
\[\int_{-\infty}^\infty\prod_{i=1}^n d\sigma_i\exp\left(-\frac{1}{2}\sum_{i,j=1}^n\sigma_iA_{ij}\sigma_j+\sum_{i=1}^n h_i\sigma_i\right)\\=\frac{(2\pi)^{n/2}}{|A|^{1/2}}\exp\left(\frac{1}{2}\sum_{i,j=1}^nh_iA_{ij}^{-1}h_j\right)\]
이게 가우스 변환인데요, 이징 모형의 범함수 적분 형태에서 증명 없이 이용한 적이 있습니다.
- 증명
A는 대칭행렬이므로 대각화가 가능하고 A의 고유값과 고유벡터를 구한 후 고유벡터로 이루어진 행렬 U를 이용해서 다음처럼 쓸 수 있습니다. \[A=U\lambda U^{-1},\ \lambda=diag(\lambda_1,\cdots,\lambda_n)\]
위 두번째 식은 행렬 λ가 A의 고유값들로 이루어진 대각 행렬이라는 걸 말합니다. 즉 λ의 대각 요소만 0이 아니며 이 요소들 각각이 A의 고유값이라는 거죠. σi들로 이루어진 벡터를 편의상 σ으로 쓰고 hi들로 이루어진 벡터를 편의상 h로 쓰겠습니다. 위의 U를 이용해서 σ와 h도 변환시켜줍니다. \[\sigma=U\tau,\ h=Ux\]
이제 위 가우스 변환의 좌변을 벡터와 행렬로 다시 쓰고... 블라블라... 해주면 아래와 같습니다. \[ \begin{aligned} \int\prod_{i}d\sigma_i\exp\left(-\frac{1}{2}\sigma^TA\sigma+h^T\sigma\right) &= \int\prod_id\tau_i\exp\left(-\frac{1}{2}\tau^T\lambda\tau+x^T\tau\right)\\ &=\int\prod_id\tau_i\exp\left(-\frac{1}{2}\sum_i\lambda_i\tau_i^2+\sum_ix_i\tau_i\right)\\ &= \prod_i\int d\tau_i \exp\left(-\frac{1}{2}\lambda_i\tau_i^2+x_i\tau_i\right)=\prod_i\sqrt{\frac{2\pi}{\lambda_i}}\exp\left(x_i^2/2\lambda_i\right)\\ &= \frac{(2\pi)^{n/2}}{|A|^{1/2}}\exp\left(\frac{1}{2}\sum_ix_i\lambda_i^{-1}x_i\right)= \frac{(2\pi)^{n/2}}{|A|^{1/2}}\exp\left(\frac{1}{2}x^T\lambda^{-1}x\right) \\ &= \frac{(2\pi)^{n/2}}{|A|^{1/2}}\exp\left(\frac{1}{2}\sum_{i,j=1}^nh_iA_{ij}^{-1}h_j\right) \end{aligned} \]
증명의 아이디어는 A를 대각화하여 얽혀 있는 σi들을 서로 떼어놓음으로써 각 σi에 대한 적분이 가능해진다는 거죠.
메모
- William O. Straub, A Brief Look at Gaussian Integrals
관련된 항목들
매스매티카 파일 및 계산 리소스
- https://docs.google.com/file/d/0B8XXo8Tve1cxalJfcUxZYXY5QTQ/edit
- http://mathematica.stackexchange.com/questions/6845/how-to-deal-with-complicated-gaussian-integrals-in-mathematica/6846#6846