Sự Nguy Hiểm Khi Thiếu Hiểu Biết Về Một Phương Trình Cơ Bản

4 minute read

Trong Kỳ 3 của chuỗi bài Suy luận Nhân quả với Python, chúng ta đã tìm hiểu về một phương trình được mệnh danh vô cùng nguy hiểm là công thức Moirve dùng để tính sai số chuẩn của giá trị trung bình (Đọc thêm về Suy luận Nhân quả với Python – Kỳ 3 tại đây).

Chúng ta hãy cùng điểm qua một vài ví dụ để thấy việc thiếu hiểu biết về công thức Moirve có thể gây ra những hậu quả như thế nào. Đơn cử như một ví dụ trong lĩnh vực giáo dục, ta quan sát thấy những trường top đầu thường có ít học sinh. Một kết luận tự nhiên có thể rút ra là quy mô trường học nhỏ dẫn đến việc trẻ học tập tốt hơn. Trực giác mách bảo ta đây là một kết luận hợp lý vì nếu một giáo viên đảm nhiệm ít học sinh hơn thì họ có thể quan tâm hơn đến mỗi học sinh.

Hay trong một trường hợp khác, ta quan sát thấy nơi có tỷ lệ tử vong do ung thư thận thấp nhất tại Mỹ nằm ở những vùng nông thôn. Thật dễ dàng và đơn giản khi suy ra rằng kết quả này do lối sống lành mạnh và môi trường trong lành ở vùng nông thôn – không ô nhiễm không khí, không khói bụi, không ô nhiễm nước, thực phẩm không có chất phụ gia, v.v.

Hậu Quả Khi Ta Thiếu Hiểu Biết Về Công Thức Moirve

Vào những năm 1990, Chính phủ và các tổ chức từ thiện tại Mỹ đã tốn hơn một tỷ đô la để tài trợ cho việc chia nhỏ các trường quy mô lớn dựa trên kết luận rằng học sinh tại các trường quy mô nhỏ chiếm đa số trong các nhóm có điểm thi cao. Tuy nhiên cái mà người ta quên mất là không nhìn vào nhóm những trường xếp cuối. Nếu làm như vậy, họ sẽ nhận ra rằng những trường này cũng có rất ít học sinh. Những trường có ít học sinh có thể có điểm thi rất cao và cũng có thể có điểm rất thấp chỉ đơn giản là do sự ngẫu nhiên. Việc tốn hơn một tỷ đô la do thiếu hiểu biết về công thức Moirve cho thấy sự thiếu hiểu biết đó có thể nguy hiểm đến mức nào. Chưa kể đến sự ảnh hưởng tới chất lượng bài giảng bởi việc chia nhỏ các trường đồng nghĩa với việc mỗi trường sẽ có ít giáo viên hơn, và như vậy giáo viên có thể phải đảm nhận việc dạy những môn không thật sự là thế mạnh của họ.

Sang ví dụ thứ hai, khi quan sát nơi có tỷ lệ tử vong do ung thư thận cao nhất tại Mỹ, một lần nữa số liệu cho thấy nó cũng rơi vào những vùng nông thôn. Một kết luận dễ dàng có thể cho rằng đó là kết quả của sự đói nghèo ở nông thôn – không được tiếp cận với dịch vụ chăm sóc y tế tốt, tiêu thụ nhiều rượu, thuốc lá, v.v. Tại sao lại có hai việc trái ngược như vậy cùng xảy ra ở vùng nông thôn? Nếu có hiểu biết về công thức Moirve, chúng ta sẽ nhận ra điều gì đang xảy ra ở đây. Sự biến thiên của giá trị trung bình tỷ lệ nghịch với phương trình của kích thước mẫu. Do vậy tỷ lệ tử vong do ung thư thận ở các quận nhỏ có sự biến thiên nhiều hơn so với các quận lớn. Ví dụ, môt quận với một trăm cư dân nhưng không có ai tử vong do ung thư thận sẽ được xếp vào nhóm những nơi có tỷ lệ tử vong thấp nhất. Nhưng nếu quận đó chỉ cần có một ca tử vong do ung thư thì nó sẽ được xếp vào nhóm những nơi có tỷ lệ tử vong cao nhất. Trong khi đó những quận lớn như New York, Los Angesles hay Miami-Dade với hàng triệu cư dân thì không có độ biến thiên lớn như vậy. Việc thiếu hiểu biết về công thức Moirve có thể dẫn đến lời khuyên không chính xác rằng bạn nên chuyển đến sống ở những vùng nông thôn nếu bạn nằm trong nhóm có nguy cơ mắc ung thư thận.

Qua hai ví dụ trên, chúng ta đã phần nào thấy việc thiếu hiểu biết về công thức Moirve có thể gây ra những quyết định sai lầm và hậu quả tai hại như thế nào. Sự thiếu hiểu biết này không chỉ gây ra sự tốn kém về tiền bạc thời gian, mà còn có thể ảnh hưởng tới sức khoẻ, chất lượng công việc học tập, hay là nguyên nhân của những những kết luận thống kê sai lầm.

Để hiểu rõ hơn về công thức Moirve qua ví dụ cụ thể với Python mời bạn đọc thêm tại Suy luận Nhân quả với Python - Kỳ 3.

Những ví dụ được trích từ Wainer, H., 2007. The most dangerous equation. American Scientist, 95(3), p.249.

Comments