@cardinal đã đưa ra một câu trả lời tuyệt vời (+1), nhưng toàn bộ vấn đề vẫn còn bí ẩn trừ khi người ta quen thuộc với các bằng chứng (còn tôi thì không). Vì vậy, tôi nghĩ rằng câu hỏi vẫn còn là lý do trực quan mà nghịch lý của Stein không xuất hiện trong và .RR2
Tôi thấy rất hữu ích một viễn cảnh hồi quy được đưa ra trong Stephen Stigler, 1990, Một quan điểm của Galton về các công cụ ước tính co ngót . Xem xét các phép đo độc lập , mỗi phép đo một số cơ bản (không quan sát được) và được lấy mẫu từ . Nếu bằng cách nào đó chúng ta biết , chúng ta có thể tạo một biểu đồ phân tán của các :XiθiN(θi,1)θi(Xi,θi)
Đường chéo tương ứng với độ nhiễu bằng không và ước lượng hoàn hảo; trong thực tế, nhiễu là khác không và do đó các điểm bị dịch chuyển khỏi đường chéo theo hướng ngang . Tương ứng, có thể được xem là đường hồi quy của trên . Tuy nhiên, chúng tôi biết và muốn ước tính , vì vậy chúng tôi nên xem xét một đường hồi quy của trên - sẽ có độ dốc khác, nằm ngang , như được hiển thị trên hình (đường nét đứt).θ=Xθ=XXθXθθX
Trích dẫn từ bài báo của Stigler:
Quan điểm của người Galton về nghịch lý Stein này khiến nó gần như trong suốt. Công cụ ước tính "thông thường" được lấy từ dòng hồi quy lý thuyết của trên . Dòng đó sẽ hữu ích nếu mục tiêu của chúng tôi là dự đoán từ , nhưng vấn đề của chúng tôi là ngược lại, cụ thể là dự đoán từ bằng cách sử dụng tổng các lỗi bình phương như một tiêu chí. Đối với tiêu chí đó, các ước lượng tuyến tính tối ưu được đưa ra bởi dòng hồi quy bình phương nhỏ nhất của trênθ^0i=XiXθXθθX∑(θi−θ^i)2θXvà các công cụ ước tính James-Stein và Efron-Morris chính là công cụ ước tính của công cụ ước tính tuyến tính tối ưu đó. Các công cụ ước tính "thông thường" có nguồn gốc từ đường hồi quy sai, công cụ ước tính James-Stein và Efron-Morris có nguồn gốc từ xấp xỉ với đường hồi quy đúng.
Và bây giờ đến bit quan trọng (nhấn mạnh thêm):
Thậm chí chúng ta có thể thấy tại sao là cần thiết: nếu hoặc , dòng bình phương nhỏ nhất của trên phải đi qua các điểm và do đó cho hoặc , hai đường hồi quy (của trên và của trên ) phải đồng ý tại mỗi .k≥3k=12θX(Xi,θi)k=12XθθXXi
Tôi nghĩ điều này làm cho nó rất rõ ràng những gì đặc biệt về và .k=1k=2