Trong chương "Suy nghĩ về ý nghĩa" của "Suy nghĩ, nhanh và chậm" của Daniel Kahneman, một ví dụ được đưa ra và người đọc được yêu cầu dự báo doanh số của các cửa hàng riêng lẻ đưa ra dự báo doanh số chung và số lượng bán hàng từ năm trước . Chẳng hạn (ví dụ về cuốn sách có 4 cửa hàng, tôi sử dụng 2 ở đây để đơn giản):
Store 2011 2012
1 100 ?
2 500 ?
Total 600 660
Dự báo ngây thơ sẽ là 110 và 550 cho các cửa hàng 1 và 2, tăng 10% cho mỗi cửa hàng. Tuy nhiên, tác giả khẳng định cách tiếp cận ngây thơ này là sai. Cửa hàng hoạt động kém hơn có khả năng tăng hơn 10% và cửa hàng hoạt động tốt hơn sẽ tăng (hoặc thậm chí giảm) dưới 10%. Vì vậy, có lẽ dự báo 115 (tăng 15%) và 535 (tăng 7%) sẽ "chính xác" hơn so với dự báo ngây thơ.
Điều tôi không hiểu là làm thế nào chúng ta có thể kết luận rằng doanh số của 100 cửa hàng 1 nhất thiết phải là cửa hàng hoạt động kém hơn? Có lẽ, do sự khác biệt về địa điểm, các phương tiện theo chuỗi thời gian thực của các cửa hàng 1 và 2 là 10 và 550, và cửa hàng 1 đã có một năm siêu năm 2011 và cửa hàng 2 đã có một năm thảm họa vào năm 2011. Sau đó, nó sẽ không có ý nghĩa để dự báo giảm cho cửa hàng 1 và tăng cho cửa hàng 2?
Tôi biết rằng thông tin chuỗi thời gian không được đưa ra trong ví dụ ban đầu, nhưng tôi có ấn tượng rằng "hồi quy trung bình" đề cập đến ý nghĩa cắt ngang và do đó thông tin chuỗi thời gian không quan trọng. Tôi đang hiểu lầm điều gì?