THỐNG KÊ SINH HỌC
nguyên bản tiếng Anh: Nguyễn Văn Tuấn
Chủ đề 8: PHÂN TÍCH SỰ TƯƠNG QUAN
I. HỒI QUY TUYẾN TÍNH ĐƠN GIẢN
Cho một người ba vũ khí - tương quan, hồi quy và cây bút -
và người đó sẽ sử dụng cả ba.
Anon, 1978
Cho đến giờ chúng ta chỉ quan tâm với các phân tích về sự khác biệt. Và, khi làm như vậy, chúng ta đã xem xét việc đo lường n đối tượng trên một biến kết quả đơn nhất (hoặc hai nhóm n đối tượng vào một biến). Các phép đo như vậy đã tạo ra phân bố tần số đơn biến và việc phân tích thường quy về phân tích đơn biến. Bây giờ, chúng ta là xét n đối tượng và mỗi đối tượng với hai số đo, nói cách khác, chúng ta có hai biến cho mỗi đối tượng, gọi là x và y. Quan tâm của chúng ta trong dữ liệu này rõ ràng là đo đạc mối quan hệ giữa hai biến số. Chúng ta có thể biểu diễn giá trị của y đối với giá trị của x trong một biểu đồ phân tán và đánh giá xem giá trị của y có thay đổi một cách có hệ thống theo sự biến thiên về giá trị của x hay không. Nhưng chúng ta vẫn muốn có một độ đo tóm tắt đơn nhất về mức độ mạnh yếu của mối quan hệ giữa x và y.
Trong cuốn sách "Kế thừa tự nhiên", Francis Galton đã viết: "mỗi đặc điểm ở một người được chia sẻ với các người thân của mình, nhưng về trung bình chỉ ở một mức độ thấp. Ví dụ, cha da trắng cao sẽ có xu hướng có con trai cao lớn, các con trai về trung bình thấp hơn cha của họ; và con trai với cha thấp, mặc dù có chiều cao dưới mức trung bình đối với toàn bộ dân số, sẽ có xu hướng cao hơn cha của họ. " Sau đó, ông kết luận một hiện tượng gọi là "luật hồi quy phổ quát" và là nguồn gốc của chủ đề chúng ta đang nghiên cứu bây giờ. Ngày nay, đặc tính quay về trung bình của toàn dân số từ các giá trị cực đoan đã được thừa nhận rộng rãi và được gọi là "hồi quy về trung bình".
Chúng ta sẽ xem xét các phương pháp đánh giá sự kết hợp giữa các biến liên tục bằng cách sử dụng hai phương pháp được gọi là phân tích sự tương quan và phân tích hồi quy tuyến tính, hai phương pháp này đã trở thành một số trong những kĩ thuật thống kê phổ biến nhất trong nghiên cứu y học.
I. PHÂN TÍCH SỰ TƯƠNG QUAN
1.1. PHƯƠNG SAI HỢP VÀ HỆ SỐ TƯƠNG QUAN
Trong một chủ đề trước đây, chúng ta nói rằng nếu X và Y là các biến độc lập, thì phương sai của tổng hay hiệu của X và Y là bằng phương sai của X cộng với phương sai của Y, tức là:
var (X ± Y) = var (X) + var (Y)