Phân phối lỗi cho hồi quy tuyến tính và logistic


9

Với dữ liệu liên tục, hồi quy tuyến tính giả định rằng thuật ngữ lỗi được phân phối N (0, )σ 2Y=β1+β2X2+uσ2

1) Chúng ta có cho rằng Var (Y | x) tương tự như vậy ~ N (0, ) không?σ2

2) Phân phối lỗi này trong hồi quy logistic là gì? Khi dữ liệu ở dạng 1 bản ghi cho mỗi trường hợp, trong đó "Y" là 1 hoặc 0, là thuật ngữ lỗi được phân phối Bernoulli (tức là phương sai là p (1-p))) và khi dữ liệu ở dạng # thành công trong số các thử nghiệm #of, có phải là nhị thức giả định (tức là phương sai là np (1-p)), trong đó p là xác suất mà Y là 1?


2
Bạn không chính xác. Giả định mô hình là các thuật ngữ lỗi là độc lập và được phân phối giống hệt với phân phối là N (0, σ ) và không liên quan đến COVARIATE. Var (Y | x) là gì? Bạn có điều hòa trên X = x không? Liệu mô hình giả định hiệp phương sai là ngẫu nhiên theo cách nào đó hay chúng ta giả sử rằng hiệp phương sai được cố định theo một ma trận thiết kế? Tôi nghĩ đó là cái sau và do đó Var (Y | X = x) được ngụ ý bởi các giả định và không cần phải giả định. 2 2222
Michael R. Chernick

@MichaelCécick Tại sao mô hình cho rằng là cố định? Nó chắc chắn có thể là trường hợp nó được cố định, nhưng nó cũng có thể là ngẫu nhiên. Không có gì trong câu hỏi ngụ ý một trong hai cho tôi. X2
Peter Flom

@PeterFlom Tôi đọc được câu hỏi rằng hồi quy tuyến tính với phân phối lỗi giả định đó có nghĩa là OLS yêu cầu X phải được sửa và biết. Nếu ai đó có hồi quy Deming (nghĩa là lỗi trong hồi quy biến) thì nó sẽ được chỉ định trong câu hỏi. Nhìn vào câu trả lời mà Stat đưa ra cho thấy anh ta cũng đặt câu hỏi theo cách đó. 2
Michael R. Chernick

@Michael, tôi đã giả sử X.
B_Miner

Câu trả lời:


10

1) Nếu có phân phối bình thường tức là thì , kể từ không phải là một biến ngẫu nhiên.uV một r ( Y | X 2 ) = V một r ( β 1 + β 2 X 2 ) + V một r ( u ) = 0 + σ 2 = σ 2 β 1 + β 2 X 2N(0,σ2)Var(Y|X2)=Var(β1+β2X2)+Var(u)=0+σ2=σ2β1+β2X2

2) Trong hồi quy logistic, người ta cho rằng các lỗi tuân theo phân phối nhị thức như đã đề cập ở đây . Tốt hơn là viết nó dưới dạng , vì các xác suất đó phụ thuộc vào , như được tham chiếu ở đây hoặc trong Hồi quy logistic ứng dụng .X jVar(Yj|Xj)=mj.E[Yj|Xj].(1E[Yj|Xj])=mjπ(Xj).(1π(Xj))Xj


Vì vậy, thật đúng khi nói rằng phương sai của lỗi riêng thứ i, , là (1- ) tương đương với những gì bạn đã chỉ ra khi giả sử rằng có nhiều hơn 1 quan sát trong cùng một dữ liệu với cùng một biến số. mẫu (tức là = 1 khác cho tất cả j)? p i p i m jeipipimj
B_Miner

2
Vâng cái này đúng rồi. Nếu với , thì với xác suất hoặc với xác suất . Do đó có phân phối với giá trị trung bình và phương sai bằng . P ( Y i = 1 ) = 1 - P ( Y i = 0 ) = p i e i = 1 - p iYi=pi+eiP(Yi=1)=1P(Yi=0)=piei=1pie i = - p i 1 - p i e i 0 p i ( 1 - p i )piei=pi1piei0pi(1pi)
Stat

Một điểm bổ sung ở đây, Stat, chúng ta CÓ phải giả sử rằng X là cố định, không ngẫu nhiên cho Var (Y | X) = Var (e) cho cả hai trường hợp hồi quy tuyến tính và logistic đúng không?
B_Miner

NB với xác suất hoặc với xác suất là không một phân phối nhị thức cho . p i e i = - p i 1 - p i e iei=1pipiei=pi1piei
Scortchi - Phục hồi Monica

B_Miner: có nghĩa là phương sai của điều kiện trên biến ngẫu nhiên lấy giá trị quan sát . Vì vậy, việc dự đoán của bạn được cố định bằng một thử nghiệm hoặc được quan sát trong một mẫu là không quan trọng: những gì @ Stat nói là chúng không còn được coi là biến ngẫu nhiên cho mục đích hồi quy. Y X xVar(Y|X)=Var(Y|X=x)YXx
Scortchi - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.