Tại sao người ta sẽ ngăn chặn sự chặn trong hồi quy tuyến tính?


20

Trong một số gói thống kê bao gồm SAS, SPSS và có thể nhiều hơn nữa, có một tùy chọn để "triệt tiêu chặn". Tại sao bạn muốn làm điều đó?

Câu trả lời:


16

Nếu vì một lý do nào bạn biết tung độ gốc (đặc biệt là nếu nó là số không), bạn có thể tránh lãng phí phương sai trong dữ liệu của bạn để ước lượng một cái gì đó bạn đã biết, và có tự tin hơn trong các giá trị bạn làm phải ước tính.

Một ví dụ hơi đơn giản là nếu bạn đã biết (từ kiến ​​thức tên miền) rằng một biến là (trung bình) là bội số của một biến khác và bạn đang cố gắng tìm bội số đó.


Tôi hoàn toàn không hiểu nó, nhưng trong một mô hình tôi đang tạo trong R, tôi có một cái gì đó như lm (a ~ b / c - 1) tạo ra sự tương tác giữa b và c, và bằng cách triệt tiêu chặn ("- 1" trong R), tôi nhận được các câu trả lời dễ hiểu hơn về cơ bản giống như khi tôi không ngăn chặn việc chặn. Bằng cách nào đó, sự tương tác làm cho điều này có thể.
Wayne

Câu trả lời dễ hiểu hơn mà về cơ bản là giống nhau? Điều đó dường như là một mâu thuẫn. Có lẽ bạn nên giới thiệu đây là một câu hỏi mới?
Nick Sabbe

Nếu tôi nhìn vào các hệ số, với phần chặn có một (phần chặn)tempwarmer (một trong những biến của tôi là temp có thể ấm hơn hoặc mát hơn ). Để giải thích các hệ số, tôi phải biết rằng (chặn) tương ứng trực tiếp với tempcoolertempwarmer + (chặn)tempwarmer có thể hiểu trực tiếp . Nếu tôi chặn chặn, tôi sẽ thấy tempcoolertempwarmer trực tiếp. Có lẽ là một công thức của công thức R và mô hình tuyến tính, nhưng ...
Wayne

12

Hãy xem xét trường hợp của hiệp phương sai 3 cấp. Nếu một người có một đánh chặn, điều đó sẽ yêu cầu 2 biến chỉ báo. Sử dụng mã hóa thông thường cho các biến chỉ báo, hệ số cho một trong hai biến chỉ báo là chênh lệch trung bình so với nhóm tham chiếu. Bằng cách triệt tiêu chặn, bạn sẽ có 3 biến đại diện cho hiệp phương phân loại, thay vì chỉ 2. Một hệ số sau đó là ước tính trung bình cho nhóm đó. Một ví dụ cụ thể hơn về nơi để làm điều này là trong khoa học chính trị, nơi người ta có thể đang nghiên cứu 50 tiểu bang của Hoa Kỳ. Thay vì có một chặn và 49 biến chỉ báo cho các trạng thái, thường thì tốt hơn là triệt tiêu chặn và thay vào đó có 50 biến.


Cách dễ dàng hơn để giải thích hệ số theo cách đó
xác suất

1
Có, nhưng nó bị hỏng với hai hoặc nhiều biến phân loại!
kjetil b halvorsen

2

Để minh họa quan điểm của @Nick Sabbe bằng một ví dụ cụ thể.

Tôi đã từng thấy một nhà nghiên cứu trình bày một mô hình về tuổi của cây như là một hàm của chiều rộng của nó. Có thể giả định rằng khi cây ở tuổi 0, nó thực sự có chiều rộng bằng không. Vì vậy, một đánh chặn là không cần thiết.


8
Sự khôn ngoan hay thiếu phụ thuộc vào phạm vi của biến quan tâm phụ thuộc. Xem xét dữ liệu phanh xe nơi bạn có tốc độ và khoảng cách dừng. Bạn có thể phù hợp với một mô hình bậc hai có hoặc không có chặn. Tốc độ quan tâm thường bắt đầu khoảng 50 km / giờ và đi lên, 130 km / giờ. Lắp một phương trình bậc hai với đánh chặn trong trường hợp này có ý nghĩa hơn, tôi nghĩ, vì việc buộc chặn bằng không có thể phát sinh (thực tế) các vấn đề thiếu phù hợp đáng kể. Thực tế là "khoảng cách phanh" của một chiếc xe dừng lại bằng không không liên quan đặc biệt đến vấn đề mô hình hóa trong tay.
Đức hồng y

@cardinal vâng tôi đã tự hỏi liệu tôi có nên làm một điểm tương tự không. Tôi đã tìm thấy trong một số bối cảnh mô hình hồi quy phi tuyến có mối quan tâm lớn hơn khi có một mô hình cung cấp mô hình hợp lý về mặt lý thuyết dự đoán chính xác ngoài phạm vi dữ liệu (ví dụ: trong việc học tốc độ dữ liệu đường cong, các mô hình không nên dự đoán tốc độ dưới 0 giây ). Trong những trường hợp như vậy, việc hạn chế chặn bằng 0 có thể phù hợp hơn ngay cả khi điều đó dẫn đến việc giảm dự đoán cho dữ liệu.
Jeromy Anglim

@cardinal Tôi đồng ý các mô hình đa thức hiếm khi dự đoán hợp lý ngoài phạm vi dữ liệu và do đó hạn chế chặn 0 trong các mô hình như vậy hiếm khi là một ý tưởng hay.
Jeromy Anglim

Cảm ơn ý kiến ​​của bạn. Nhận xét của tôi không nhắm nhiều vào các mô hình đa thức. Sự lựa chọn của một bậc hai chỉ đơn giản dựa trên một động lực vật lý thực tế (tức là cơ học cổ điển). Điểm tôi đang cố gắng nói rõ là người ta nên xem xét cẩn thận vấn đề mô hình quan tâm; đôi khi làm một cái gì đó (hoặc dường như) "không chính đáng về mặt lý thuyết" thực sự phù hợp hơn về mặt thống kê.
Đức hồng y
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.