Đây là một cái gì đó tôi thấy được thực hiện như một phương pháp đặc biệt và nó có vẻ rất tanh đối với tôi nhưng có lẽ tôi đang thiếu một cái gì đó. Tôi đã thấy điều này được thực hiện trong nhiều hồi quy nhưng chúng ta hãy làm cho nó đơn giản:
Bây giờ lấy phần dư từ mô hình được trang bị
và phân tầng mẫu dựa trên kích thước của phần dư. Ví dụ: giả sử mẫu đầu tiên là 90% dưới cùng của mẫu dư và mẫu thứ hai là 10% hàng đầu, sau đó tiến hành thực hiện hai so sánh mẫu - tôi đã thấy điều này được thực hiện cả trên bộ dự đoán trong mô hình, và trên các biến không có trong mô hình. Logic không chính thức được sử dụng là có lẽ các điểm có giá trị vượt xa những gì bạn mong đợi trong mô hình (nghĩa là phần dư lớn) khác nhau theo một cách nào đó và sự khác biệt đó được nghiên cứu theo cách này.
Suy nghĩ của tôi về chủ đề này là:
- Nếu bạn thấy sự khác biệt 2 mẫu trên một yếu tố dự đoán trong mô hình, thì có những hiệu ứng của yếu tố dự đoán không được mô hình tính ở trạng thái hiện tại của nó (tức là các hiệu ứng phi tuyến tính).
- Nếu bạn thấy sự khác biệt 2 mẫu trên một biến không có trong mô hình, thì có lẽ nó phải ở trong mô hình ở vị trí đầu tiên.
Một điều tôi đã tìm thấy theo kinh nghiệm (thông qua các mô phỏng) là, nếu bạn so sánh giá trị trung bình của một yếu tố dự đoán trong mô hình và phân tầng theo cách này để tạo ra hai phương tiện mẫu, và , chúng có mối tương quan tích cực với nhau. Điều này có ý nghĩa vì cả hai mẫu đều phụ thuộc vào và \ hat {\ rho} _ {xy} . Mối tương quan đó tăng lên khi bạn di chuyển điểm cắt xuống (tức là% bạn sử dụng để chia mẫu). Vì vậy, ít nhất, nếu bạn định làm một phép so sánh hai mẫu thì lỗi tiêu chuẩn trong mẫu số của t¯ x 1 ¯ x 2 ¯ y , ¯ x , σ x , σ y ρ x y t-statistic cần được điều chỉnh để giải thích cho mối tương quan (mặc dù tôi chưa nhận được một công thức rõ ràng cho hiệp phương sai).
Nhưng dù sao, câu hỏi cơ bản của tôi là: Có lý do nào để làm việc này không? Nếu vậy, trong những tình huống này có thể là một điều hữu ích để làm gì? Rõ ràng tôi không nghĩ là có nhưng có thể có điều gì đó tôi không nghĩ đến theo cách đúng đắn.
IV
s không? Nếu vậy, tôi không thể thấy được điểm này vì phần còn lại đã sử dụng thông tin đó. Bạn có thể cho một ví dụ về nơi bạn đã thấy điều này, nó mới đối với tôi?