Giả định phân phối dư


12

Tại sao cần phải đặt giả định phân phối cho các lỗi, nghĩa là

yi=Xβ+ϵi , với.ϵiN(0,σ2)

Tại sao không viết

yi=Xβ+ϵi , vớiyiN(Xβ^,σ2) ,

trong đó trong cả hai trường hợp . Tôi đã thấy nó nhấn mạnh rằng các giả định phân phối được đặt trên các lỗi, không phải dữ liệu, nhưng không có lời giải thích. ϵi=yiy^

Tôi không thực sự hiểu sự khác biệt giữa hai công thức này. Một số nơi tôi thấy các giả định phân phối được đặt trên dữ liệu (Bayesian lit. có vẻ như là chủ yếu), nhưng hầu hết các giả định được đặt vào các lỗi.

Khi lập mô hình, tại sao người ta nên / nên chọn bắt đầu với các giả định về cái này hay cái khác?


Đầu tiên, nó không "cần thiết", nó phụ thuộc vào những gì bạn định làm. Có một số câu trả lời hay, nhưng tôi nghĩ mấu chốt là giả định cơ bản của quan hệ nhân quả, theo nghĩa của Xs "gây ra" y, và nếu bạn nhìn vào đó theo cách bạn thấy rằng sự phân phối của y là "gây ra" phân phối của rhs, nghĩa là Xs và các lỗi (nếu có). Bạn có thể thực hiện nhiều phép đo kinh tế lượng với các giả định phân phối rất hạn chế và đặc biệt, không có tính quy tắc. Cảm ơn Chúa.
PatrickT

3
không phải làXβ, và giá trị trung bình dân số củaylà không giống như các mẫu dự toán của nó. Mà là để nói rằng điều thứ hai không phải là thực sự là điều tương tự như người đầu tiên, nhưng nếu bạn thay thế nó với sự mong đợi của nó (E( y )=E(y)=Xβ), hai sẽ tương đương. y^XβyE(y^)=E(y)=Xβ
Glen_b -Reinstate Monica

Là gì y ? Và nếu y i thay đổi theo tôi , tại sao không X β khác nhau? Hãy ghi nhớ ký hiệu mà bạn muốn sử dụng, vectơ hoặc ma trận. Bây giờ nếu chúng ta giả định rằng y = X β ký hiệu của bạn là hơn bizzare: y i ~ N ( x ' i ( Σ x j x ' j ) - 1 Σ x j y j , σ 2 )y^yiiXβy^=Xβ^yiN(xi(xjxj)1xjyj,σ2), tức là bạn xác định phân phối của theo chính nó và tất cả các quan sát khác y j ! yiyj
mpiktas

1
Tôi đã đánh giá thấp câu hỏi vì tôi nghĩ rằng ký hiệu này gây nhầm lẫn và điều này đã dẫn đến một số câu trả lời mâu thuẫn tinh tế.
mpiktas

Câu trả lời:


9

Trong cài đặt hồi quy tuyến tính, thông thường phải phân tích và rút ra kết quả có điều kiện trên , tức là có điều kiện trên "dữ liệu". Vì vậy, những gì bạn cần là y | X là bình thường, có nghĩa là, bạn cần ε là bình thường. Một ví dụ Peter Flom của minh họa, người ta có thể có bình thường của ε mà không cần phải bình thường của y , và, do đó, vì những gì bạn cần là bình thường của ε , đó là giả định hợp lý.XyXϵϵyϵ


8

Tôi sẽ viết định nghĩa thứ hai là

yiN(Xiβ,σ2)

hoặc (như Karl Oskar gợi ý +1)

yi|XiN(Xiβ,σ2)

tức là giả định mô hình hóa là biến trả lời thường được phân phối xung quanh đường hồi quy (là ước tính của giá trị trung bình có điều kiện), với phương sai không đổi . Điều này không giống với gợi ý rằng y i được phân phối bình thường, bởi vì giá trị trung bình của phân phối phụ thuộc vào X i .σ2yiXi

Tôi nghĩ rằng tôi đã thấy các công thức tương tự như thế này trong máy học văn học; như xa như tôi có thể nhìn thấy nó tương đương với định nghĩa đầu tiên, tất cả tôi đã làm là để rexpress các công thức thứ hai một chút khác nhau để loại bỏ các 's và y ' s.ϵiy^


3

Sự khác biệt là dễ nhất để minh họa bằng một ví dụ. Đây là một cách đơn giản:

Giả sử Y là lưỡng kim, với phương thức chiếm bởi một biến độc lập. Ví dụ: giả sử Y là chiều cao và mẫu của bạn (vì bất kỳ lý do gì) bao gồm jockeys và cầu thủ bóng rổ. ví dụ như trongR

set.seed(123)
tall <- rnorm(100, 78, 3)
short <- rnorm(100, 60, 3)

height <- c(tall, short)
sport <- c(rep("B", 100), rep("H",100))

plot(density(height))

m1 <- lm(height~sport)
plot(m1)

mật độ đầu tiên là rất không bình thường. Nhưng phần dư từ mô hình cực kỳ gần với bình thường.

Về lý do tại sao các hạn chế được đặt theo cách này - tôi sẽ để người khác trả lời câu hỏi đó.


1
yiϵi

Trong trường hợp đó, tính không đồng nhất sẽ là một vấn đề và bạn sẽ cần sử dụng một số hình thức hồi quy khác, hoặc có thể là một số biến đổi, hoặc bạn có thể thêm một biến khác (trong ví dụ ngớ ngẩn này, vị trí chơi trong bóng rổ có thể làm điều đó).
Peter Flom - Tái lập Monica

Tôi không chắc chắn công thức dự định đề xuất rằng các ys được phân phối bình thường, chỉ là chúng có phân phối có điều kiện bình thường.
Dikran Marsupial

2


yiN(y^i,σε2)
y^xi

y^ixiβ^

yiN(xiβ^,σε2)

E[xiβ^]=E[xiβ^+E[N(0,σε2)]]=E[xiβ^+0]=E[xiβ^]

Vì vậy, câu hỏi trở thành, có lý do để thích trình bày ý tưởng bằng cách sử dụng công thức đầu tiên?

Tôi nghĩ câu trả lời là vì hai lý do:

  1. YXY|Xε
  2. Y|XY|X

Tôi tin rằng những niềm tin này có nhiều khả năng sử dụng công thức thứ hai hơn là lần đầu tiên.


1
y^Xβy^ixiβ^iy^ixiβ^Y

y¯y^y^=Xβyi=Xβ+ϵiϵi=yiy^y^Xβ
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.