Nghịch lý Simpson

Nghịch lý Simpson, còn được gọi là hiệu ứng Yule-Simpson, là một hiện tượng trong xác suất và thống kê, trong đó một xu hướng quan sát được trong các nhóm dữ liệu riêng lẻ có thể biến mất hoặc thậm chí đảo ngược khi các nhóm này được kết hợp lại. Nghịch lý này cực kỳ dễ dàng gây hiểu lầm cho người đọc hoặc người nghe, khiến họ tin vào một kết luận hoàn toàn ngược lại so với thực tế.

Phát biểu thì nghe có vẻ rắc rối, thực ra lại khá dễ hiểu. Chúng ta xét một ví dụ điển hình như sau:

Báo chí đăng tin: Sau khi thử nghiệm hai loại thuốc A B trên người nhiễm bệnh X, người ta thấy rằng loại thuốc A có tỷ lệ thành công cao hơn loại thuốc B cho cả nhóm người nhiễm bệnh nặng bệnh nhẹ. Như vậy có thể kết luận rằng loại thuốc A tốt hơn loại thuốc B.

💡
Thực hư thế nào?

Để xác định thực hư, chúng ta hãy nhìn vào bảng thống kê số liệu cụ thể dưới đây:

Đối với loại thuốc A, người ta tiến hành điều trị trên 100 bệnh nhân, trong đó có 6 người bệnh nặng và 94 người bệnh nhẹ, tỷ lệ thành công lần lượt là 100%84.04%. Trong khi đó, đối với loại thuốc B, người ta tiến hành điều trị trên 200 bệnh nhân, trong đó có 60 người bệnh nặng và 140 người bệnh nhẹ, tỷ lệ thành công lần lượt là 95%83.57%. Rõ ràng nếu chỉ xét 2 cặp tỷ lệ này, người ta có thể kết luận rằng thuốc A có phần vượt trội về mặt hiệu quả so với thuốc B. Tuy nhiên, nếu xem xét về tỷ lệ thành công trung bình bằng cách lấy tổng số người khỏi bệnh chia cho tổng số người được điều trị cho từng loại thuốc, kết quả lại nói lên điều ngược lại:

\(\displaystyle \text{average}_A = \frac {6+79} {6+94} = \frac {85}{100}=85\%;\quad \text{average}_B = \frac {57+117} {66+140} = \frac {174}{200}=87\%\)

Rõ ràng theo kết quả trên, ta thấy rằng loại thuốc B, tỷ lệ thành công 87%, tốt hơn loại thuốc A, tỷ lệ thành công 86%; và hoàn toàn đi ngược với kết luận ban đầu rằng loại thuốc A tốt hơn loại thuốc B.

Nghịch lý này cũng xảy ra khi số lượng phần tử tập mẫu bằng nhau ở 2 thí nghiệm, hãy xem bảng số liệu dưới đây nếu số điều trị cả hai loại đều là 100 người:

Qua các ví dụ trên ta có thể thấy kết quả so sánh ở từng thành phần chưa chắc đã nói lên kết quả so sánh tổng thể trên thực tế. Đây cũng là một "mánh khóe" rất công phu và đặc sắc của các nhà báo, nhà thống kê hiện nay mà chúng ta đôi khi cần phải tỉnh táo để tránh bị sa vào cạm bẫy đánh lừa.