Nếu bạn không thể thực hiện trực giao, hãy thực hiện thô (hồi quy đa thức)


11

Khi thực hiện hồi quy đa thức cho lên , đôi khi người ta sử dụng đa thức thô, đôi khi là đa thức trực giao. Nhưng khi họ sử dụng những gì dường như hoàn toàn tùy ý.XYX

Ở đâyở đây đa thức thô được sử dụng. Nhưng ở đâyđây , đa thức trực giao dường như cho kết quả chính xác. Cái gì, như thế nào, tại sao?!

Ngược lại, khi tìm hiểu về hồi quy đa thức từ sách giáo khoa (ví dụ ISLR ), điều đó thậm chí không đề cập đến đa thức thô hoặc trực giao - chỉ đưa ra mô hình được trang bị.

Vậy khi nào chúng ta phải sử dụng cái gì?
Và tại sao các giá trị p riêng lẻ cho , v.v ... khác nhau rất nhiều giữa hai giá trị này?XX2


1
Bạn nên đưa ra một số suy nghĩ để p-giá trị khác nhau khi bạn phù hợp với mô hình tương tự với cùng một dữ liệu sử dụng đa thức nguyên & trực giao, và diễn giải của họ. Còn những dự đoán về mô hình thì sao?
Scortchi - Phục hồi Monica

@Scortchi Tôi đã thêm thông tin liên quan vào câu hỏi của tôi.
l7ll7

4
Một lý do chính đáng khác để sử dụng đa thức trực giao là sự ổn định về số; ma trận thiết kế liên quan để phù hợp trong cơ sở đơn hình có thể khá khó điều chỉnh cho phù hợp mức độ cao vì các đơn thức bậc cao là "phụ thuộc rất gần tuyến tính" (một khái niệm có thể được thực hiện chính xác hơn về mặt toán học), trong khi ma trận thiết kế đối với đa thức trực giao thì ứng xử tốt hơn một chút. Tôi đã thảo luận về trường hợp abscissas (Gram) không thể thay thế ở đây , nhưng thỏa thuận này tương tự trong trường hợp không thay thế.
JM không phải là một thống kê

(Tuy nhiên, người ta không nên phù hợp với đa thức bậc cao mà không có lý do chính đáng để làm như vậy.)
JM không phải là một thống kê

Câu trả lời:


7

Các biến và không độc lập tuyến tính. Vì vậy, ngay cả khi không có tác động bậc hai, thêm với mô hình sẽ thay đổi tác dụng ước tính của .X 2 X 2 XXX2X2X

Chúng ta hãy xem xét với một mô phỏng rất đơn giản.

> x <- runif(1e3)
> y <- x + rnorm(length(x))
> summary(lm(y~x))

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) -0.03486    0.06233  -0.559    0.576    
x            1.05843    0.10755   9.841   <2e-16 ***

Bây giờ với một thuật ngữ bậc hai trong mô hình để phù hợp.

> summary(lm(y~x+I(x^2)))

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)  0.03275    0.09528   0.344    0.731
x            0.65742    0.44068   1.492    0.136
I(x^2)       0.39914    0.42537   0.938    0.348

Tất nhiên bài kiểm tra omnibus vẫn còn có ý nghĩa, nhưng tôi nghĩ rằng kết quả mà chúng tôi đang tìm kiếm không phải là bài kiểm tra này. Giải pháp là sử dụng đa thức trực giao.

 > summary(lm(y~poly(x,2)))

 Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)  0.49744    0.03098  16.059   <2e-16 ***
poly(x, 2)1  9.63943    0.97954   9.841   <2e-16 ***
poly(x, 2)2  0.91916    0.97954   0.938    0.348    

Lưu ý rằng các hệ số của xtrong mô hình đầu tiên và của poly(x,2)1mô hình thứ hai không bằng nhau, và thậm chí các lần chặn cũng khác nhau. Điều này là do polycung cấp các vectơ trực giao, cũng trực giao với vectơ rep(1, length(x)). Vậy poly(x,2)1là không xnhưng (x -mean(x))/sqrt(sum((x-mean(x))**2))...

Một điểm quan trọng là các bài kiểm tra Wald, trong mô hình cuối cùng này, là độc lập. Bạn có thể sử dụng đa thức trực giao để quyết định mức độ bạn muốn đi, chỉ bằng cách xem xét nghiệm Wald: ở đây bạn quyết định giữ nhưng không phải . Tất nhiên bạn sẽ tìm thấy cùng một mô hình bằng cách so sánh hai mô hình được trang bị đầu tiên, nhưng nó đơn giản hơn theo cách này - nếu bạn xem xét việc đi lên mức độ cao hơn, nó thực sự đơn giản hơn nhiều. X 2XX2

Khi bạn đã quyết định giữ các thuật ngữ nào, bạn có thể muốn quay lại các đa thức thô và để có thể giải thích hoặc để dự đoán. X 2XX2


+1 Cuối cùng một câu trả lời rõ ràng! Cảm ơn bạn! Trước khi tôi chấp nhận, bạn có thể vui lòng cho tôi biết, có bất kỳ số liệu thống kê nào khác không, như R ^ 2 hoặc thống kê F rằng tôi nên đọc tóm tắt cốt truyện trực giao hơn so với số liệu thống kê thô? Bên cạnh việc vẽ các biến, sự phù hợp sử dụng đa thức thô có tốt cho bất kỳ điều gì khác trong kịch bản này không?
l7ll7

Và khi tôi có nhiều dự đoán, liệu điều đó có đúng không?
l7ll7

Làm thế nào bạn "sử dụng đa thức trực giao để quyết định xem bạn có muốn bao gồm một thuật ngữ bậc hai hay không"?
Scortchi - Phục hồi Monica

1
Điểm là, thử nghiệm của hiệu ứng bậc cao nhất, bậc hai trong trường hợp này, giống nhau cho dù bạn sử dụng đa thức thô hay trực giao. Vậy tại sao phải bận tâm với đa thức trực giao?
Scortchi - Phục hồi Monica

4
Chà, tất nhiên là bạn đơn giản không nên làm những bài kiểm tra cận biên trong mô hình đó; bạn nên lắp lại sau khi loại bỏ hiệu ứng bậc cao nhất. Đa thức trực giao giúp bạn đỡ phiền phức, cho phép một thủ tục bước xuống dễ dàng - có lẽ bạn có thể minh họa bằng một thuật ngữ khối.
Scortchi - Phục hồi Monica

3

Để đưa ra một đánh giá ngây thơ về tình hình:

nói chung: giả sử bạn có hai hệ thống chức năng cơ bản khác nhau , cũng như cho một số chức năng (hilbert-) không gian, , tức là không gian của tất cả các hàm có thể tích hợp hình vuông. { ~ p } n = 1 L 2 ( [ một , b ] ){pn}n=1{p~}n=1L2([a,b])

Điều này có nghĩa là mỗi trong hai cơ sở có thể được sử dụng để giải thích từng yếu tố của , tức là với bạn có một số hệ số và , (trong -sense): L2([a,b])yL2([a,b])θnθ~nRn=1,2,L2

n=1θ~np~n=y=n=1θnpn.

Tuy nhiên, mặt khác, nếu bạn cắt bớt cả hai bộ hàm cơ bản ở một số số , tức là bạn lấy cũng như các bộ hàm cơ bản bị cắt cụt này rất có khả năng hai mô tả "các phần khác nhau" của .k<

{pn}n=1k
{p~}n=1k,
L2([a,b])

Tuy nhiên, ở đây trong trường hợp đặc biệt có một cơ sở, , chỉ là một trực giao của cơ sở khác, , dự đoán tổng thể của sẽ giống nhau cho từng mô hình bị cắt cụt ( và đối tác trực giao của chúng sẽ mô tả cùng một không gian con -chiều của ).{p~}n=1{pn}n=1y{p}n=1kkL2([a,b])

Nhưng mỗi hàm cơ sở riêng lẻ từ hai cơ sở "khác nhau" sẽ mang lại sự đóng góp khác nhau cho dự đoán này (rõ ràng là các hàm / dự đoán khác nhau!) Dẫn đến giá trị và hệ số khác nhau .p

Do đó, về mặt dự đoán, (trong trường hợp này) không có sự khác biệt.

Từ quan điểm tính toán, một ma trận mô hình bao gồm các hàm cơ sở trực giao có các thuộc tính số / tính toán đẹp cho công cụ ước lượng bình phương nhỏ nhất. Trong khi cùng lúc theo quan điểm thống kê, việc trực giao hóa dẫn đến các ước tính không tương quan, vì theo các giả định tiêu chuẩn.var(θ~^)=Iσ²


Câu hỏi tự nhiên đặt ra nếu có một hệ thống cơ sở cắt ngắn tốt nhất. Tuy nhiên, câu trả lời cho câu hỏi không đơn giản cũng không độc đáo và ví dụ phụ thuộc vào định nghĩa của từ "tốt nhất", tức là những gì bạn đang cố lưu trữ.


1
(+1) Không có sự khác biệt về dự đoán; & có thể nói không có sự khác biệt về bất kỳ suy luận có ý nghĩa nào.
Scortchi - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.