sự hiểu biết về giá trị p trong hồi quy tuyến tính bội


12

Về giá trị p của phân tích hồi quy tuyến tính đa biến, phần giới thiệu từ trang web của Minitab được hiển thị bên dưới.

Giá trị p cho mỗi thuật ngữ kiểm tra giả thuyết null cho rằng hệ số bằng 0 (không có hiệu lực). Giá trị p thấp (<0,05) chỉ ra rằng bạn có thể từ chối giả thuyết khống. Nói cách khác, một công cụ dự đoán có giá trị p thấp có khả năng là một bổ sung có ý nghĩa cho mô hình của bạn vì những thay đổi trong giá trị của công cụ dự đoán có liên quan đến những thay đổi trong biến phản hồi.

Ví dụ: tôi có mô hình MLR kết quả là . và đặt ra được hiển thị dưới đây. Sau đó, một có thể được tính bằng phương trình này.y=0.46753X10.2668X2+1.6193X3+4.5424X4+14.48y

            Estimate      SE        tStat       pValue  
               ________    ______    _________    _________

(Intercept)      14.48     5.0127       2.8886    0.0097836
x1             0.46753     1.2824      0.36458      0.71967
x2             -0.2668     3.3352    -0.079995      0.93712
x3              1.6193     9.0581      0.17877      0.86011
x4              4.5424     2.8565       1.5902       0.1292

Dựa trên phần giới thiệu ở trên, giả thuyết null là hệ số bằng 0. Hiểu biết của tôi là hệ số, ví dụ hệ số , sẽ được đặt là 0 và một y khác sẽ được tính là . Sau đó, thử nghiệm t ghép đôi được tiến hành cho và , nhưng giá trị p của thử nghiệm t này là 6,9e-12 không bằng 0,122 (giá trị p của hệ số .X4y2=0.46753X10.2668X2+1.6193X3+0X4+14.48yy2X4

Bất cứ ai có thể giúp đỡ về sự hiểu biết chính xác? Cảm ơn nhiều!


bạn có thể hiển thị đầu ra của thói quen hồi quy?
Aksakal

Mô tả của bạn về tính toán giá trị p là không chuẩn. Tại sao bạn nghĩ rằng nó nên được tính theo cách bạn mô tả? giá trị p trong đầu ra được tính từ ma trận Var-Cov của các tham số. Nếu bạn muốn chạy thử nghiệm hạn chế, như Wald, thì đó không phải là cách bạn mô tả. Bạn sẽ phải ước tính lại mô hình với 3 biến, nhận loglikabilities, v.v.
Aksakal

1
Theo giới thiệu đó, bạn chỉ có một biến "đáng kể" - "chặn" - bởi vì chỉ có giá trị p của nó là nhỏ. Để vượt ra ngoài thực tiễn ngây thơ và sai lệch trong trích dẫn, bạn cần tìm hiểu thêm về hồi quy bội. Để xem những gì có thể được học về vấn đề này, hãy xem xét khám phá các chủ đề có liên quan trên trang web của chúng tôi .
whuber

2
Kiểm tra câu trả lời cho hai câu hỏi sau: - stats.stackexchange.com/questions/5135/ và và stats.stackexchange.com/questions/126179/. Họ giúp tôi hiểu cách tính giá trị p, hy vọng bạn sẽ tìm thấy chúng hữu ích là tốt.
Giacomo

Câu trả lời:


7

Điều này không chính xác vì một vài lý do:

  1. Mô hình "không có" X4 sẽ không nhất thiết phải có cùng ước tính hệ số cho các giá trị khác. Phù hợp với mô hình giảm và xem cho chính mình.

  2. Kiểm tra thống kê cho hệ số không liên quan đến các giá trị "trung bình" của Y thu được từ 2 dự đoán. dự đoán sẽ luôn có cùng giá trị trung bình, do đó có giá trị p từ phép thử t bằng 0,5. Điều tương tự giữ cho phần dư. Bài kiểm tra t của bạn có giá trị sai cho mỗi điểm trên.Y

  3. Thử nghiệm thống kê được thực hiện cho ý nghĩa thống kê của hệ số là thử nghiệm một mẫu. Điều này gây nhầm lẫn vì chúng tôi không có "mẫu" nhiều hệ số cho X4, nhưng chúng tôi có ước tính các thuộc tính phân phối của mẫu đó bằng định lý giới hạn trung tâm. Giá trị trung bình và sai số chuẩn mô tả vị trí và hình dạng của phân phối giới hạn đó. Nếu bạn lấy cột "Est" và chia cho "SE" và so sánh với phân phối chuẩn thông thường, điều này mang lại cho bạn các giá trị p trong cột thứ 4.

  4. Điểm thứ tư: một chỉ trích về trang trợ giúp của minitab. Một tệp trợ giúp như vậy không thể, trong một đoạn, tóm tắt nhiều năm đào tạo thống kê, vì vậy tôi không cần phải tranh luận với toàn bộ. Nhưng, để nói rằng một "người dự đoán" là "một đóng góp quan trọng" là mơ hồ và có thể không chính xác. Cơ sở lý luận cho việc chọn biến nào để đưa vào mô hình đa biến là tinh tế và dựa vào lý luận khoa học và không suy luận thống kê.


0

Giải thích ban đầu về giá trị p của bạn có vẻ đúng, đó là chỉ có phần chặn có hệ số khác đáng kể so với 0. Bạn sẽ nhận thấy rằng ước tính của hệ số cho x4 vẫn còn khá cao, nhưng có đủ lỗi mà nó không đáng kể khác 0.

Bài kiểm tra ghép đôi của bạn về y1 và y2 cho thấy các mô hình khác nhau. Điều đó được mong đợi, trong một mô hình, bạn bao gồm một hệ số lớn nhưng không chính xác, đóng góp khá nhiều cho mô hình của bạn. Không có lý do nào để nghĩ rằng giá trị p của các mô hình này khác với nhau phải giống với giá trị p của hệ số x4 khác 0.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.