Thứ Năm, 30 tháng 9, 2010

Bài 2: Thống kê mô tả

THNG KÊ SINH HC

nguyên bản tiếng Anh: Nguyễn Văn Tuấn

Chủ đề 2: THỐNG KÊ MÔ TẢ


Lượng thông tin thống kê phổ biến đến công chúng và thật ra cả trong y văn, vì lí do này hay khác đôi khi không hiểu nổi, và trong số đó phần nào là thống kê "tốt" và phần nào là thống kê “tồi" là tuỳ vào sự đồ đoán của mỗi người. Chắc chắn, chúng ta không thể chấp nhận tất cả thông tin đó một cách không phê phán. Nhiều kết luận sai lầm hoàn toàn đôi khi do dựa trên các dữ liệu thiếu vững chắc. Trên thực tế, việc sử dụng số liệu thống kê đã bị lạm dụng hay sử dụng bừa. Nhiều sách báo và bài viết dựa trên việc vận dụng không đúng thống kê. Alvan Feinstein mới đây nhận xét: "một số trong những tác giả như thế rất được nhiều người biết đến vì họ không ngại đưa ra các lời giải cho các vấn đề chưa được giải quyết." Tất nhiên chúng ta không muốn đi theo con đường đó. Chúng ta cần phải sử dụng thống kê một cách khôn ngoan.

Trong chủ đề này chúng ta sẽ bàn về việc sử dụng một vài chỉ số thống kê cơ bản thường gọi là thống kê mô tả. Cụ thể, chúng ta sẽ quan tâm đến việc tổng kết các dữ liệu liên tục. Khi thu thập dữ liệu, ta thường quan tâm tới sự phân bố của chúng: tập trung ở các giá trị nào, mức độ phân tán ra sao so với giá trị tập trung đó, phân bố có dáng dấp thế nào và ứng dụng của chúng ra sao. Tương ứng chúng ta sẽ thảo luận bốn đề mục chính:

Độ đo về vị trí (khuynh hướng) trung tâm
Độ đo về sự khác biệt (sự phân tán)
Độ đo về hình dạng của phân bố
Ứng dụng của thống kê mô tả


I. ĐỘ ĐO VỀ VỊ TRÍ TRUNG TÂM

1.1. Trung vị (Median):

Trung vị (kí hiệu là Md) của một dãy số là giá trị ở vị trí chính giữa khi dãy số được sắp xếp theo thứ tự từ nhỏ đến lớn (hay ngược lại).

  • Nếu số phần tử n của dãy số là lẻ thì trung vị là số ở vị trí thứ (n+1)/2.
  • Trường hợp nchẵn thì số trung vị sẽ là trung bình của 2 số ở vị trí ở thứ n/2n/2 +1.

Không có nhận xét nào: