Mọi người ai học qua môn xác suất thống kê đều đã từng vô cùng “vật vã“ với công thức của Phân Phối Chuẩn (hay phân phối Gaussian):
$$\boxed{ f(x) = \frac 1 {\sigma \sqrt{2\pi}} e^{-\frac1 2 \frac{(x - \mu)^2}{\sigma^2}}}$$
Với:
\(f(x)\) — là hàm mật độ của phân bố
\(\mu\) — là giá trị trung bình
\(\sigma\) — là độ lệch chuẩn
Bài viết này mình chỉ đơn thuần cố gắng giải thích công thức nhằm giúp bạn đọc hiểu rõ hơn ý nghĩa của nó, và từ đó, hy vọng rằng bạn đọc sẽ cảm thấy nó dễ nhớ hơn.
Một số tiêu chuẩn mấu chốt
Hàm số có dạng hình chuông
Đối xứng tại giá trị trung bình \(x=\mu\)
Có tích phân từ \(-\infty\) đến \(\infty\) là \(1\)
Hai điểm uốn tại \(x=\mu-\sigma\) và \(x=\mu+\sigma\): \(f^{\prime\prime}(\mu \pm \sigma) = 0\)
Bản chất của hàm \(e^{-x^2}\)
Đầu tiên, hàm số \(e^{-x^2}\) có dạng hình chuông. Thực ra về bản chất, mọi hàm số mũ có dạng \(a^{-x^2}\) đều có dạng hình chuông đối xứng tại giá trị \(x=0\), không nhất thiết phải là cơ số \(e\). Thật vậy, vì với mọi \(a \gt 0\) ta luôn có thể biến đổi \(a = e^{k}\) với \(k = \ln a\).
Lúc đó ta có: \(a^{-x^2} = (e^k)^{-x^2} = e^{-kx^2}\). Sở dĩ, số \(e\) được chọn là vì để dễ liên tưởng đến hàm số mũ (exponential).
Hàm mật độ \(f(x)\) thỏa \(\displaystyle \int_{-\infty}^{\infty} f(x)dx = 1\)
Ta có: \(\displaystyle f(x) = e^{-x^2} \implies \int_{-\infty}^{\infty} e^{-x^2}dx = \sqrt{\pi}\). Tham khảo chứng minh ở bài viết của mình ở đây.
Như vậy, để thỏa mãn có tích phân toàn miền là \(1\), ta phải đem nhân với \(\frac 1 {\sqrt{\pi}}\), hàm số trở thành \(\displaystyle f(x)=\frac 1 {\sqrt{\pi}} e^{-x^2} \implies \int_{-\infty}^{\infty}f(x)dx = \frac 1 {\sqrt{\pi}}\int_{-\infty}^{\infty}e^{-x^2}dx = 1\)
Đối xứng tại giá trị trung bình \(x= \mu\)
Để thỏa mãn tính chất này, thực chất ta dời “hình chuông“ đến điểm \(x=\mu \implies x-\mu=0\). Như vậy hàm số biến đổi thành \(\displaystyle f(x)=\frac 1 {\sqrt{\pi}} e^{-(x-\mu)^2}\)
Hai điểm uốn \(x=\mu-\sigma, x=\mu+\sigma\), đối xứng tại \(\mu\)
Để đơn giản tính toán, ta tạm thời gác qua các giá trị \(\mu, \sigma\). Xét hàm số \(\displaystyle f(x)=e^{-x^2}\), ta có:
$$\begin{align*} &\text{Given } f(x)=e^{-x^2}, \text{let } u=-x^2 \implies u'=-2x, v=e^u, v'=e^u \\ &\implies f'(x) = u'.v' = -2xe^{-x^2} \\ &\text{Calculate }f''(x): \text{ applying product rule: } (uv)' = u'v+v'u \\ &\text{ with } u=-2x, u'=-2, v=e^{-x^2}, v'=-2xe^{-x^2} \\ &\implies f''(x)=(4x^2-2)e^{-x^2} = (4x^2-2)f(x) \end{align*}$$
Như vậy, để \(f''(x)=0 \implies x=\pm \frac 1 {\sqrt{2}}\)
Để điểm uốn tại điểm \(x=1.0\), ta đưa \(\frac 1 2 \) vào giá trị số mũ và khử đi bằng cách nhân với \(\frac 1 {\sqrt{2}}\) để bảo toàn tích phân, hàm số lúc này trở thành \(\displaystyle f(x)=\frac 1 {\sqrt{2\pi}} e^{-\frac 1 2(x-\mu)^2}\)
Trị số \(\sigma\) là độ lệch chuẩn của phân phối. Trị số này cũng thể hiện cho bề rộng của hàm số, \(\sigma\) càng lớn, hàm số càng rộng và ngược lại. Ta đưa luôn \(\sigma\)và hàm số, và khử để bảo toán tích phân để có công thức cuối cùng:
$$\boxed{\displaystyle f(x)=\frac 1 {\sigma\sqrt{2\pi}} e^{-\frac 1 2\frac{(x-\mu)^2} {\sigma^2}} = \frac 1 {\sigma\sqrt{2\pi}} e^{\frac{-(x-\mu)^2} {2\sigma^2}}}$$
Demo
Thay đổi giá trị \(\mu\), đồ thị sẽ trượt đi theo trục \(x\)
Thay đổi giá trị \(\sigma\), hàm số sẽ thao đổi bề rộng / hẹp