Thứ Bảy, 24 tháng 3, 2012

Bài 10: Phân tích phương sai hợp

THNG KÊ SINH HC

nguyên bản tiếng Anh: Nguyễn Văn Tuấn

Chủ đề 10: PHÂN TÍCH PHƯƠNG SAI HỢP



I. GIỚI THIỆU

Chúng ta đã quan tâm đến mô hình tuyến tính tổng quát trong việc phân tích dữ liệu. Trong lớp các mô hình này, chúng ta đã tìm hiểu về kiểm nghiệm-t, phân tích phương sai và phân tích phương sai hợp. Nói chung, khi tất cả các biến này là số thì mô hình tuyến tính được gọi là mô hình hồi quy. Khi các biến thuộc loại định tính chúng ta đưa về phân tích phương sai (ANOVA). Trong khi cả hồi quy lẫn phân tích phương sai có thể được chính thức gộp vào GLM (mô hình tuyến tính tổng quát -general linear model), mặc dù theo truyền thống hai kĩ thuật này được coi là khác biệt nhau. Điều tách biệt có tính lịch sử này xảy ra vì hai lí do. Thứ nhất, trước khi máy tính tốc độ cao được dùng phổ quát, khía cạnh tính toán của các kĩ thuật thống kê rất được quan tâm. Các thủ tục tính toán hiệu quả nhất cho hồi quy và ANOVA là khá khác biệt nhau. Thứ hai, hai phương pháp này có khuynh hướng được áp dụng cho các loại bài toán khác nhau.

Phân tích phương sai thường được coi như là một kĩ thuật để so sánh trung bình của hai hay nhiều quần thể trên cơ sở các mẫu từ mỗi quần thể này. Trong thực tế, các quần thể này thường tương ứng với các nhóm điều trị khác nhau, do đó sự khác biệt trong trung bình quần thể có thể là bằng chứng cho sự khác biệt tương ứng trong hiệu quả điều trị.

Các tính toán ANOVA liên quan đến một sự phân chia tổng phương sai mẫu thành các thành phần phương sai bên trong nhóm và phương sai giữa các nhóm. Thành phần bên trong nhóm cho ta một ước lượng cho phương sai sai số, trong khi các thành phần giữa các nhóm ước lượng phương sai sai số cộng với một hàm của hiệu trung bình các phương pháp điều trị. Tỉ giữa phương sai bên trong nhóm với phương sai giữa các nhóm cho ta một kiểm nghiệm cho giả thuyết khống cho rằng tất cả các trung bình đều bằng nhau. Ngoài ra, hiệu giữa trung bình các nhóm cho ta những ước lượng không thiên vị cho các hiệu trung bình quần thể tương ứng, và sai số chuẩn dựa trên phương sai bên trong nhóm cho ta khoảng tin cậy cho các hiệu này và các kiểm nghiệm về ý nghĩa của chúng.

Trái lại, phân tích hồi quy chủ yếu được sử dụng để mô hình các mối quan hệ giữa các biến. Với nó, chúng ta có thể ước lượng hình thức của mối quan hệ giữa một biến đáp ứng với một số biến độc lập. Chúng ta có thể cố gắng để tìm một bộ biến có quan hệ mạnh mẽ nhất đến sự biến thiên trong biến đáp ứng.

Việc phân tích phương sai hợp (ANCOVA -Analysis Of Covariance) biểu thị cho hợp nhất của hai kĩ thuật này. Phương pháp này được R A Fisher sử dụng đầu tiên trong văn bản nghiên cứu (1932), ông là người đã xem kĩ thuật này như một kĩ thuật "kết hợp những ưu điểm và dung hoà các yêu cầu của hai phương thức được áp dụng rất rộng rãi được biết dưới tên là hồi quy và phân tích phương sai ".

Kết hợp hồi quy và phân tích phương sai tạo ra một lợi thế mạnh mẽ cho việc thực hiện các so sánh về sự khác biệt giữa các nhóm điều trị khác nhau trước khi điều trị. Giả sử chúng ta có thể nhận diện ra một biến X có liên quan đến kết quả Y, và với biến đó các nhóm điều trị có trung bình khác nhau. Để đơn giản, chúng ta giả định rằng X là biến duy nhất mà với nó các nhóm khác nhau. Thế thì, nếu chúng ta biết mối quan hệ giữa YX, chúng ta có thể điều chỉnh một cách thích hợp những khác biệt quan sát trên Y để xem xét những khác biệt trên X.

1 nhận xét:

Vương nói...

Mình chưa hiểu cách thông kê này cho lắm ak.


p/s: Thông tin khuyen mai Viettel luôn được cập nhật,
Viettel khuyen mai thang 9 siêu khủng.