6: Ghét con số: Tại sao chúng ta vật lộn để hiểu thống kê và phạm sai lầm có thể tránh được chỉ vì nó.

Làm sao bạn có thể dự đoán được việc này sẽ xảy ra hay không?
 
Một cách hiệu quả là hãy nhớ tỉ lệ cơ sở (base rate). Nó ám chỉ tỉ lệ cơ sở trong thống kê, mà các bản thống kê khác phụ thuộc vào. Ví dụ, tưởng tượng một hãng tắc xi lớn có 20% xe màu vàng 80% xe màu đỏ. Nghĩa là tỉ lệ cơ sở với xe tắc xi màu vàng là 20% và với xe màu đỏ là 80%. Nếu bạn gọi xe và muốn đoán màu của nó, hãy nhớ tỉ lệ cơ sở và bạn sẽ đưa ra được dự đoán tương đối chính xác.
 
Vì vậy ta nên luôn luôn nhớ tỉ lệ cơ sở khi dự đoán một sự việc, nhưng không may là điều này thường không xảy ra. Trên thực tế, việc quên mất tỉ lệ cơ sở xảy ra cực kì phổ biến.
 
Một trong những lí do tự ta lại quên mất tỉ lệ cơ sở là ta tập trung vào thứ mình kì vọng hơn là thứ có khả năng xảy ra cao nhất. Ví dụ, tưởng tượng lại những chiếc tắc xi trên: Nếu bạn thấy 5 chiếc xe đỏ chạy qua, bạn có thể sẽ bắt đầu cảm thấy khả năng cao chiếc tiếp theo sẽ có màu đỏ. Nhưng bất kể có bao nhiêu xe dù màu nào đi qua, xác suất chiếc xe tiếp theo có màu đỏ vẫn vào khoảng 80% - và nếu ta nhớ tỉ lệ cơ sở, ta sẽ nhận ra điều này. Nhưng thay vào đó, ta thường tập trung vào thứ mình kì vọng muốn thấy, một chiếc xe màu vàng, và vì vậy ta rất dễ mắc sai lầm.
 
Bỏ quên tỉ lệ cơ sở là một lỗi phổ biến liên quan tới vấn đề của con người khi đối mặt với số liệu. Ta thường hay quên rằng mọi thứ sẽ hồi quy về trung bình. Nghĩa là thừa nhận rằng tất cả mọi tình huống đều có giá trị trung bình, và những dao động khỏi giá trị trung bình cuối cùng cũng sẽ về lại điểm cân bằng.
 
Ví dụ, nếu một tiền đạo bóng đá ghi 5 bàn thắng trung bình 1 tháng, lại ghi đến 10 bàn trong tháng 9, huấn luyện viên của cô sẽ rất vui sướng, nhưng nếu suốt năm còn lại cô lại chỉ ghi 5 bàn 1 tháng, huấn luyện viên sẽ chỉ trích cô vì không giữ phong độ. Tuy nhiên, cô không đáng bị phê bình bởi vì cô chỉ đang hồi quy về giá trị trung bình!