Thứ Bảy, 24 tháng 3, 2012

Bài 9: Hồi quy đa biến

THNG KÊ SINH HC

nguyên bản tiếng Anh: Nguyễn Văn Tuấn

Chủ đề 9: PHÂN TÍCH SỰ TƯƠNG QUAN

II. PHÂN TÍCH HỒI QUY ĐA BIẾN

DỰ ĐOÁN LÀ KHOA HỌC?


Một vài năm trước đây, tôi đọc một cuốn sách trong đó có cuộc trò chuyện sau đây (không thật đúng nguyên văn): "Một người phục vụ hỏi Andy Capp#: ‘Trong mấy thứ tiền bạc, quyền lực, hạnh phúc, hoặc khả năng tiên đoán tương lai, ông sẽ chọn cái nào?’. Andy trả lời: ’tiên đoán tương lai vì theo cách đó tôi có thể kiếm ra tiền. Tiền sẽ mang lại cho tôi sức mạnh, và sau đó tôi sẽ được hạnh phúc’".

Có lẽ là công bằng khi nói ước mơ có thể dự đoán được tương lai thì cũng xưa tựa như bản chất con người. Nhiều người trong chúng ta thường coi thường khái niệm "bói toán", điều đó hơi lạ vì bản thân khoa học xoay quanh các phương pháp để tiên đoán tương lai. Thật ra, chúng ta chỉ sử dụng từ vựng khác nhau. Trái ngược với bói toán, chúng ta nói về tính toán thay vì tiên đoán, quy luật thay vì vận số, và biến động thống kê thay vì tai nạn. Tuy nhiên, mục đích của phương pháp khoa học là như nhau. Từ những quan sát các sự kiện đã qua, chúng ta rút ra các quy luật mà khi kiểm chứng xong chúng cho phép chúng ta dự đoán những kết quả trong tương lai.

Lấy ví dụ, khái niệm cho rằng tất cả các động vật chết vào cùng một tuổi nghe có vẻ không có lí nếu chúng ta tính tuổi theo năm, tháng hay ngày, nhưng sẽ trở nên khá hợp lí nếu chúng ta dùng số nhịp đập của tim. Chính ở nhịp đập tim mà động vật này khác với động vật khác. Những con thú nhỏ, như chuột, sống khoảng 3 năm nhưng nhịp tim của chúng rất nhanh chóng. Những con có kích cỡ trung bình, chẳng hạn như thỏ, chó, cừu, vv có nhịp tim đập chậm hơn và sống trong khoảng từ12 đến 20 năm. Voi sống hơn 50 năm, nhưng có nhịp tim chậm. Không phải là điều ngạc nhiên khi một giáo sư nổi tiếng đã tuyên bố rằng "cho đến lúc chết hầu hết động vật có vú sống tự do trong tự nhiên (không phải trong nhà hoặc vườn thú) đã cóp nhặt được trung bình khoảng một tỉ nhịp tim". Có vẻ như chúng ta có thể dự đoán tuổi thọ của động vật từ nhịp tim của chúng. Nhưng, chúng ta vẫn cần có một cách có hệ thống để làm điều này. Khoa học hiện đại đã cho chúng ta kĩ thuật phân tích hồi quy để đạt được mục tiêu này. Chúng ta sẽ thảo luận về một số khía cạnh thực tiễn của kĩ thuật này trong chủ đề này.

I. GIỚI THIỆU

Trong chủ đề trước chúng ta khảo sát mô hình hồi quy với một biến độc lập. Khá thường xuyên trong các phân tích dữ liệu, chúng ta muốn nghiên cứu sự phụ thuộc của một biến ngẫu nhiên Y trên nhiều biến x1 x2, ... , xp. Trong chủ đề này, chúng ta sẽ mở rộng ý tưởng này để bao gồm nhiều hơn một biến độc lập trong phương trình hồi quy. Kĩ thuật này được gọi là hồi quy tuyến tính đa biến .


Không có nhận xét nào: