Kiểm tra thống kê phổ biến như mô hình tuyến tính


22

(CẬP NHẬT: Tôi đã tìm hiểu sâu hơn về điều này và đăng kết quả tại đây )

Danh sách các bài kiểm tra thống kê có tên là rất lớn. Nhiều thử nghiệm phổ biến dựa trên suy luận từ các mô hình tuyến tính đơn giản, ví dụ thử nghiệm t một mẫu chỉ là y = β + được thử nghiệm đối với mô hình null y = + ε tức là = μ trong đó μ là null giá trị - thường là μ = 0.

Tôi thấy điều này mang tính hướng dẫn nhiều hơn cho mục đích giảng dạy hơn là học vẹt có tên là mô hình, khi nào nên sử dụng chúng và các giả định của chúng như thể chúng không liên quan gì đến nhau. Cách tiếp cận đó thúc đẩy không thúc đẩy sự hiểu biết. Tuy nhiên, tôi không thể tìm thấy một nguồn tài nguyên tốt thu thập này. Tôi quan tâm nhiều hơn đến sự tương đương giữa các mô hình cơ bản hơn là phương pháp suy luận từ chúng. Mặc dù, theo như tôi có thể thấy, các thử nghiệm tỷ lệ khả năng trên tất cả các mô hình tuyến tính này mang lại kết quả tương tự như suy luận "cổ điển".

Dưới đây là những tương đồng tôi đã học được về cho đến nay, bỏ qua số hạng sai số εN(0,σ2) và giả định rằng tất cả các giả thuyết không là vắng mặt của một hiệu ứng:

One-mẫu t-test: y=β0H0:β0=0.

Cặp-mẫu t-test: y2y1=β0H0:β0=0

Điều này giống hệt với thử nghiệm t một mẫu về sự khác biệt theo cặp.

Hai mẫu t-test: y=β1xi+β0H0:β1=0

Trong đó x là một chỉ số (0 hoặc 1).

Pearson tương quan: y=β1x+β0H0:β1=0

Lưu ý sự tương tự với phép thử t hai mẫu chỉ là hồi quy trên trục x nhị phân.

Tương quan Spearman: rank(y)=β1rank(x)+β0H0:β1=0

Điều này giống hệt với mối tương quan Pearson trên x và y được chuyển đổi thứ hạng.

One-way ANOVA: y=β1x1+β2x2+β3x3+...H0:β1,β2,β3,...=β

nơi xi là chỉ số chọn phù hợp β (một x là 1; những người khác 0). Mô hình này có thể có thể được viết dưới dạng ma trận như như Y=βX .

Hai chiều ANOVA: y=β1X1+β2X2+β3X1X2H0:β3=0

cho hai yếu tố hai cấp độ. Ở đây βi là các vectơ của betas trong đó một vectơ được chọn bởi vectơ Xi . Các H0 đưa ra ở đây là hiệu ứng tương tác.

Chúng ta có thể thêm nhiều "thử nghiệm có tên" vào danh sách các mô hình tuyến tính này không? Ví dụ, hồi quy đa biến, các xét nghiệm "không tham số" khác, xét nghiệm nhị thức hoặc RM-ANOVAs?

CẬP NHẬT: các câu hỏi đã được hỏi và trả lời về ANOVA và các bài kiểm tra t dưới dạng mô hình tuyến tính ở đây trên SO. Xem câu hỏi này và được gắn thẻ các câu hỏi liên quan .


1
Tôi nghĩ những so sánh này là phù hợp nhưng đến một lúc nào đó cũng có những khác biệt tinh tế. Ví dụ: lấy ANOVA một chiều: trong đó hồi quy tuyến tính sẽ cung cấp cho bạn các hệ số và trong hầu hết các gói phần mềm, mức ý nghĩa trên mỗi hệ số với các phép thử Wald (có thể không phù hợp), ANOVA sẽ cung cấp một giá trị p duy nhất cho biết liệu có một trong các hệ số khác biệt đáng kể so với không. Thử nghiệm tỷ lệ khả năng giữa mô hình null và mô hình hồi quy quan tâm có thể tương đương hơn. Như vậy, tôi sẽ không hoàn toàn cân bằng các thử nghiệm / mô hình này.
IWS

Điểm tốt; Tôi đã cập nhật câu hỏi, nói rằng "Tôi quan tâm nhiều hơn đến sự tương đương giữa các mô hình cơ bản hơn là phương pháp suy luận từ chúng." Các thử nghiệm tỷ lệ khả năng trên ANOVAs một chiều và các thuật ngữ tương tác mang lại các giá trị p giống hệt như các phân tích "cổ điển" theo như thử nghiệm của tôi.
Jonas Lindeløv

1
Đủ công bằng, nhưng suy luận sang một bên, lưu ý rằng các mô hình hồi quy cũng cung cấp thêm tính linh hoạt khi xử lý phi tuyến tính (mặc dù các phép biến đổi cũng có thể được kiểm tra với các 'phép thử có tên' này, spline là một vấn đề khác) hoặc xử lý sự không đồng nhất, thậm chí không đề cập đến gia đình của các mô hình tổng quát cũng xử lý các biến phụ thuộc không liên tục. Tuy nhiên, tôi có thể thấy việc giải thích các bài kiểm tra được đặt tên là các biến thể hạn chế của mô hình hồi quy cho mục đích giảng dạy có thể có giá trị, vì vậy +1
IWS

1
Là tương quan xếp hạng Spearman thực sự là một mô hình tuyến tính?
Martin Dietz

1
@MartinDietz: Có, sau khi chuyển đổi thứ hạng x và y, nó là tuyến tính. Mã R:x = rnorm(100); y = rnorm(100); summary(lm(rank(x) ~ rank(y))); cor.test(x, y, method='spearman')
Jonas Lindeløv

Câu trả lời:


6

Không phải là một danh sách đầy đủ nhưng nếu bạn bao gồm các mô hình tuyến tính tổng quát , phạm vi của vấn đề này sẽ trở nên lớn hơn đáng kể.

Ví dụ:

E[logit(p)|t]=β0+β1tH0:β1=0

p×k

E[log(μ)]=β0+βi.+β.j+γiji,j>1H0:γij=0,i,j>1

Ngoài ra, kiểm tra t cho các phương sai không bằng nhau được xấp xỉ bằng cách sử dụng ước tính lỗi mạnh mẽ của Huber White.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.