Thứ Năm, 30 tháng 9, 2010

Bài 2: Thống kê mô tả

THNG KÊ SINH HC

nguyên bản tiếng Anh: Nguyễn Văn Tuấn

Chủ đề 2: THỐNG KÊ MÔ TẢ


Lượng thông tin thống kê phổ biến đến công chúng và thật ra cả trong y văn, vì lí do này hay khác đôi khi không hiểu nổi, và trong số đó phần nào là thống kê "tốt" và phần nào là thống kê “tồi" là tuỳ vào sự đồ đoán của mỗi người. Chắc chắn, chúng ta không thể chấp nhận tất cả thông tin đó một cách không phê phán. Nhiều kết luận sai lầm hoàn toàn đôi khi do dựa trên các dữ liệu thiếu vững chắc. Trên thực tế, việc sử dụng số liệu thống kê đã bị lạm dụng hay sử dụng bừa. Nhiều sách báo và bài viết dựa trên việc vận dụng không đúng thống kê. Alvan Feinstein mới đây nhận xét: "một số trong những tác giả như thế rất được nhiều người biết đến vì họ không ngại đưa ra các lời giải cho các vấn đề chưa được giải quyết." Tất nhiên chúng ta không muốn đi theo con đường đó. Chúng ta cần phải sử dụng thống kê một cách khôn ngoan.

Trong chủ đề này chúng ta sẽ bàn về việc sử dụng một vài chỉ số thống kê cơ bản thường gọi là thống kê mô tả. Cụ thể, chúng ta sẽ quan tâm đến việc tổng kết các dữ liệu liên tục. Khi thu thập dữ liệu, ta thường quan tâm tới sự phân bố của chúng: tập trung ở các giá trị nào, mức độ phân tán ra sao so với giá trị tập trung đó, phân bố có dáng dấp thế nào và ứng dụng của chúng ra sao. Tương ứng chúng ta sẽ thảo luận bốn đề mục chính:

Độ đo về vị trí (khuynh hướng) trung tâm
Độ đo về sự khác biệt (sự phân tán)
Độ đo về hình dạng của phân bố
Ứng dụng của thống kê mô tả


I. ĐỘ ĐO VỀ VỊ TRÍ TRUNG TÂM

1.1. Trung vị (Median):

Trung vị (kí hiệu là Md) của một dãy số là giá trị ở vị trí chính giữa khi dãy số được sắp xếp theo thứ tự từ nhỏ đến lớn (hay ngược lại).

  • Nếu số phần tử n của dãy số là lẻ thì trung vị là số ở vị trí thứ (n+1)/2.
  • Trường hợp nchẵn thì số trung vị sẽ là trung bình của 2 số ở vị trí ở thứ n/2n/2 +1.

Thứ Tư, 29 tháng 9, 2010

Bài 1: Một số kiến thức toán học cơ bản

BÀI GIẢNG THỐNG KÊ SINH HỌC

nguyên bản tiếng Anh: Nguyễn Văn Tuấn


Lời giới thiệu: Đây là loạt bài giảng Thống kê của giáo sư Nguyễn Văn Tuấn (viện nghiên cứu Garvan - Úc) chủ yếu dành cho các người nghiên cứu ngành Y nhưng cũng có thể sử dụng cho nhiều ngành khác. Khi dịch, chúng tôi có chỉnh một số lỗi typo và tính toán trong bản gốc và cũng có thêm thắt mà vài chỗ mà chúng tôi hi vọng rằng sẽ giúp bạn đọc dễ nắm bắt hơn. Đây là bản dịch chưa qua hiệu đính của tác giả, nếu phát hiện có gì sai sót rất mong các bạn đọc góp ý dùm, rất cám ơn.

THAY LỜI NÓI ĐẦU


Hơn một thế kỉ trước, nhà toán học Pháp Pierre Louis đã xây dựng và cổ vũ "phương pháp số" dùng để thẩm định việc điều trị. Tuy nhiên, ông đã bị hầu hết các thầy thuốc hàng đầu lúc bấy giờ phản đối. Đáng tranh cãi là Claude Bernard, cha đẻ của y học thực nghiệm hiện đại đã phê phán việc áp dụng toán học vào y học; ông tuyên bố: các nhà toán học cào bằng quá nhiều và suy luận về các hiện tượng như họ xây dựng trong đầu chứ không như chúng tồn tại trong tự nhiên. Ông không ngừng kêu gọi các thầy thuốc "từ khước việc dùng thống kê làm cơ sở cho khoa học thực nghiệm về điều trị và bệnh lí.” Trớ trêu thay, gần 100 năm sau, các học trò của ông đã vứt bỏ hoàn toàn lời khuyên của ông. Thống kê đã trở nên một phần thiết yếu trong nghiên cứu y học. Ngày nay hầu như mọi công bố y học đều có phần "phương pháp thống kê" để chứng tỏ sự đáng tin cậy của công trình.

Tuy nhiên, trong những năm gần đây, việc sử dụng phổ biến thống kê đã trở thành việc lạm dụng phổ biến thống kê. Y văn bị nhét đầy với thông tin thống kê bề bộn và với những phát hiện mâu thuẫn không dứt. Có nhiều bằng chứng hùng hồn cho thấy rằng việc sử dụng không phù hợp và thao tác chưa thuần thục về các số liệu thống kê đã góp phần đáng kể vào bi kịch về sự nhầm lẫn này của tri thức. Nhiều người viết sách và các bài báo dựa trên ứng dụng không phù hợp của thống kê. Một số tác giả rất được nhiều người biết đến vì họ chẳng ngại ngùng tung ra các lời giải cho các vấn đề chưa được giải quyết. Tuy nhiên, một số nhà điều tra không nhận ra rằng họ đã phạm các lỗi lầm trong thống kê hoặc do dốt nát hoặc do thiếu kiến thức thống kê. Dù với lí do gì, dựa vào phân tích thống kê khi không hiểu bản chất là bước đầu tiên trong việc đánh mất tính trung thực trí tuệ. Vì vậy, hiểu biết nguyên tắc đứng phía sau một phân tích thống kê là rất quan yếu trong việc giải thích dữ liệu.

Mười lăm chủ đề thống kê sinh học sau đây tiêu biểu cho một tập hợp các nguyên lí thống kê, định lí, tiên đề và định nghĩa sơ đẳng được trình bày dưới dạng gần như phi kĩ thuật. Các chủ đề được chia thành hai phần: phần một bàn về xác suất và các khái niệm thống kê ; phần hai bàn về thống kê ứng dụng, trong đó sẽ thảo luận về phân tích thống kê dữ liệu và các kết luận. Do đối tượng dự kiến của khóa học này là những người nghiên cứu với ít hoặc không có kiến thức thống kê, do đó, tất cả các phát biểu thống kê trong các bài học này được trình bày không có chứng minh toán học kèm theo.

Bất kì việc học tập nào cũng sẽ không đầy đủ nếu không có một sự tiêu hóa nào đó các nguyên lí bộ môn. Để minh họa cho ý tưởng và nguyên lí đằng sau mỗi chủ đề, tôi cũng có trình bày một bộ sưu tập các bài tập và các bài toán để giải hay thảo luận. Một số câu hỏi có thể được xếp loại như là "bài tập" nhằm mục đích minh họa nguyên tắc cơ bản; các câu hỏi khác có thể được xếp loại như là "bài toán" mà thông thường sẽ đòi hỏi nhiều kĩ năng hơn để giải quyết chúng. Hầu hết những câu hỏi này đã được trích ra từ các tạp chí y học và kinh nghiệm của cuộc sống thực . Nếu bạn không thể giải được một câu hỏi, đừng tuyệt vọng. Phương pháp giảng dạy của Socrate không nhằm vào việc luyện tập để người ta đưa ra nhanh chóng những câu trả lời, nhưng để giáo dục qua các câu hỏi. Nếu đã nỗ lực nhiều lần nhưng không thành công, bạn có thể liên hệ với tôi và chúng ta hi vọng sẽ có cách xử lí nó. Hãy nhớ rằng các lời giải cho bất kì bài toán có giá trị nào hiếm khi đến với chúng ta một cách dễ dàng mà không cần sự làm việc chăm chỉ, đó phải là kết quả của nỗ lực trí tuệ trong nhiều ngày, nhiều tuần, hoặc nhiều tháng, thậm chí nhiều năm. Vâng, không có câu hỏi nào trong khóa học này đòi hỏi bạn mất nhiều năm hay nhiều tháng để giải, nhưng có thể phải mất nhiều giờ để giải ra.

Sự xuất hiện của máy tính điện tử chắc chắn đã cách mạng hóa việc thực hành thống kê . Máy tính đã thay thế bút chì giải các phương trình phức tạp khi phân tích dữ liệu. Tuy nhiên, thống kê không chỉ là một tập hợp các định lí hoặc công thức, nó là một phong cách tư duy. Máy tính cũng là một phong cách tư duy. Vì vậy, tôi không tin rằng số liệu thống kê có thể được rút gọn thành một cái nhấn nút trên máy tính mà vẫn giữ được phong cách suy nghĩ, mặc dù có những người tuyên bố đã làm như vậy. Với niềm tin này trong đầu, hầu hết các bài tập trong khóa học này có dụng ý để giải bằng tay với sự trợ giúp của một máy tính hoặc một phần mềm bảng tính (spreadsheet) nói chung - không phải bởi một phần mềm thống kê. Tôi luôn luôn tin rằng trong làm bài tập, một lời giải bằng tay sẽ thú vị hơn và trọn vẹn hơn một lời giải "tự động".

Các bài giảng này là kết quả từ nỗ lực của một người thiếu kinh nghiệm. Nó khó có thể hoàn hảo và còn rất nhiều vấn đề bỏ ngõ. Hơn nữa, tài liệu này đã được viết trong một thời gian rất ngắn và do đó sai sót là không thể tránh khỏi. Nếu bạn tìm thấy xin vui lòng cho tôi biết.
Chúc may mắn.


THỐNG KÊ SINH HỌC



Chủ đề 1: MỘT SỐ KIẾN THỨC TOÁN HỌC CƠ BẢN

Ngay cả một người chậm trí mà được đào tạo và luyện tập trong số học,nếu anh ta không nhận được cái gì khác từ nó, ít ra cũng hoàn thiện và trở nên sắc nét hơn trước.

Plato


Nhà thông thái Bertrand Russell gần đây đã viết trong một cuốn sách của ông: "có một lối đi dẫn qua các cánh đồng ở New Southgate, và tôi thường đi đến đó một mình đề ngắm hoàng hôn và dự định tự tử. Tuy nhiên tôi không tự tử bởi vì tôi muốn tìm hiểu thêm về toán học”. Tôi chắc chắn hầu hết chúng ta sẽ không phủ nhận sức mạnh của toán học, nhưng có thể có hơn một người trong chúng ta đã không ưa môn học này.

Thứ Năm, 9 tháng 9, 2010

Bến Tre sao thương quá

Mời các bạn cùng nghe bài hát của nhạc sĩ Linh Bảo về quê hương Bến Tre của tui.


Nhạc và lời: Linh Bảo
Biểu diễn: Mai Thiên Vân