Trong một số gói thống kê bao gồm SAS, SPSS và có thể nhiều hơn nữa, có một tùy chọn để "triệt tiêu chặn". Tại sao bạn muốn làm điều đó?
Trong một số gói thống kê bao gồm SAS, SPSS và có thể nhiều hơn nữa, có một tùy chọn để "triệt tiêu chặn". Tại sao bạn muốn làm điều đó?
Câu trả lời:
Nếu vì một lý do nào bạn biết tung độ gốc (đặc biệt là nếu nó là số không), bạn có thể tránh lãng phí phương sai trong dữ liệu của bạn để ước lượng một cái gì đó bạn đã biết, và có tự tin hơn trong các giá trị bạn làm phải ước tính.
Một ví dụ hơi đơn giản là nếu bạn đã biết (từ kiến thức tên miền) rằng một biến là (trung bình) là bội số của một biến khác và bạn đang cố gắng tìm bội số đó.
Hãy xem xét trường hợp của hiệp phương sai 3 cấp. Nếu một người có một đánh chặn, điều đó sẽ yêu cầu 2 biến chỉ báo. Sử dụng mã hóa thông thường cho các biến chỉ báo, hệ số cho một trong hai biến chỉ báo là chênh lệch trung bình so với nhóm tham chiếu. Bằng cách triệt tiêu chặn, bạn sẽ có 3 biến đại diện cho hiệp phương phân loại, thay vì chỉ 2. Một hệ số sau đó là ước tính trung bình cho nhóm đó. Một ví dụ cụ thể hơn về nơi để làm điều này là trong khoa học chính trị, nơi người ta có thể đang nghiên cứu 50 tiểu bang của Hoa Kỳ. Thay vì có một chặn và 49 biến chỉ báo cho các trạng thái, thường thì tốt hơn là triệt tiêu chặn và thay vào đó có 50 biến.
Để minh họa quan điểm của @Nick Sabbe bằng một ví dụ cụ thể.
Tôi đã từng thấy một nhà nghiên cứu trình bày một mô hình về tuổi của cây như là một hàm của chiều rộng của nó. Có thể giả định rằng khi cây ở tuổi 0, nó thực sự có chiều rộng bằng không. Vì vậy, một đánh chặn là không cần thiết.