THỐNG KÊ SINH HỌC
Bản gốc tiếng Anh: Nguyễn Văn TuấnChủ đề 5: PHÂN BỐ MẪU II
PHÂN BỐ BÌNH THƯỜNG
Phân bố bình thường chiếm vị trí trung tâm trong lí thuyết thống kê và thực hành. Phân bố này đáng lưu ý và có tầm quan trọng to lớn, không chỉ vì hầu hết các hiện tượng xảy ra một cách tự nhiên với các biến ngẫu nhiên liên tục tuân theo nó một cách chính xác, và không phải vì nó là một mô hình hữu ích trong mọi trường hợp ngoại trừ các trường hợp bất thường. Tầm quan trọng của phân bố này nằm ở các tính chất toán học thuận tiện của nó trực tiếp dẫn đến đến nhiều lí thuyết thống kê đang như là một cơ sở cho việc thực hành, ở hiệu lực của nó như là một xấp xỉ cho phân bố khác, ở mối quan hệ trực tiếp đến trung bình mẫu của hầu như bất kì phân bố nào, và ở ứng dụng của nó vào các biến ngẫu nhiên phân bố gần như bình thường hay có thể dễ dàng chuyển đổi thành các biến xấp xỉ.
Từ "bình thường" (normal) như được sử dụng trong việc mô tả “phân bố bình thường” không nên nhầm lẫn là có nghĩa "bình thường" hoặc "điển hình", "không đặc biệt" hay "phổ biến nhất". Đặc biệt, một phân bố không tuân theo phân bố này sẽ được gọi là phân bố “khác bình thường" thay vì phân bố “bất thường". Vấn đề về thuật ngữ này đã khiến nhiều tác giả gọi phân bố bình thường là phân bố Gauss, nhưng điều này lại cũng có vấn đề do thiếu chính xác về mặt lịch sử. Năm 1718, nhà toán học vĩ đại người Pháp De Moivre đã suy được một biểu thức toán học về mật độ bình thường và đã công bố trong công trình Học thuyết về may rủi (Doctrine des chances) của ông. Giống như công trình trước đây của Poisson, định lí De Moivre không thu hút được sự chú ý ban đầu xứng tầm, tuy nhiên cuối cùng nó đã lọt vào mắt của Pierre-Simon de Laplace (một nhà toán học và triết học lớn của Pháp), ông đã khái quát lên và đưa nó vào trong công trình có nhiều ảnh hưởng là Lí thuyết Giải tích về Xác suất (Théorie Analytique des Probabilités ) xuất bản năm 1812. Carl F. Gauss, một nhà toán học vĩ đại của Đức, là người đã phát triển các tính chất toán học và chỉ ra khả năng ứng dụng của phân bố của De Moivre vào nhiều hiện tượng "sai lầm" tự nhiên. Vì thế phân bố này đôi khi được gọi là phân bố Gauss.
Thế thì phân bố này vận hành ra sao? Phân bố bình thường lúc khởi đầu được diễn đạt như sau: Giả sử có 1000 người sử dụng cùng một cái cân để cân một gói có trọng lượng thật là 1,00 kg, họ sẽ cho ra các giá trị trên và dưới 1,00 kg; nếu tập các số đo sai nằm bên trên hoặc bên dưới giá trị thật có xác suất bằng 0,5, thì biểu đồ tần số của các trọng lượng quan sát được sẽ có xu hướng nằm vây quanh 1,00 kg một cách mạnh mẽ (Hình 1). Các số đo sai của giá trị thật có thể được định nghĩa như một biến ngẫu nhiên liên tục trong phạm vi - ∞ tới + ∞. Phân bố xác suất của số đo sai được gọi là phân bố sai số. Tuy nhiên, vì phân bố đã được tìm thấy để mô tả nhiều hiện tượng tự nhiên và vật lí khác nên hiện nay thường được biết đến như là phân bố bình thường. Do đó, chúng ta sẽ sử dụng thuật ngữ phân bố "bình thường" thay vì phân bố De Moivre hay Gauss.
Hình 1: Biểu đồ xu hướng trung tâm của trọng lượng quan sát xung quanh trọng lượng thật 1 kg.
Trước khi đi sâu vào phân bố liên tục quan trọng này ta tìm hiểu sơ qua các tính chất của phân bố liên tục nói chung qua ví dụ về một phân bố liên tục đơn giản, đó là phân bố liên tục đều.
Không có nhận xét nào:
Đăng nhận xét