Mô hình với các biến chứng

7

Một mô hình hồi quy tuyến tính thông thường là $y = c'x + \varepsilon$ , Ở đâu $c$ là các hệ số chưa biết và $\varepsilon$ là nhiễu Gaussian với giá trị trung bình bằng không và phương sai không đổi. Tôi đang xây dựng một mô hình trong đó thuật ngữ lỗi, $\varepsilon$ , có hai biến chứng:

Phân phối của nó là không bình thường.
Phương sai lỗi không phải là hằng số.

Tôi biết rằng vấn đề đầu tiên có thể được giải quyết bằng một số mô hình hồi quy tuyến tính, trong khi vấn đề thứ hai có thể được giải quyết bằng hồi quy tuyến tính (ví dụ: Tofallis, C (2008), "Hồi quy tỷ lệ phần trăm nhỏ nhất"). Nhưng tôi chưa bao giờ thấy một mô hình sẽ giải quyết cả hai vấn đề cùng một lúc.

regression

— shuwong
nguồn

Nhìn vào số liệu thống kê mạnh mẽ .

— usεr11852

Nếu bạn có tính không đồng nhất, bạn không thể đánh giá mức độ nặng của phân phối có điều kiện trực tiếp từ âm mưu QQ, vì tính không đồng nhất sẽ bị nhầm lẫn với điều đó (ví dụ như tính không đồng nhất là đủ để tạo ra một bản phân phối QQ có đuôi trông nặng nề một cái đuôi)

— Glen_b -Reinstate Monica

3

Sandwich ước tính lỗi mạnh mẽ xử lý cả không đồng nhất và phân phối lỗi không bình thường theo triệu chứng . Điều đó cũng xảy ra có nghĩa là bạn có được suy luận xấp xỉ hợp lệ trong các mẫu tương đối.

Một lời chỉ trích có thể là một phương pháp mạnh mẽ như vậy phải có sức mạnh thấp. Nói chung, không đúng như người ta nghĩ. Nhưng ... bạn có thể đưa ra các giả định yếu hơn hoặc khác nhau về việc phân phối các lỗi không? Ví dụ, thay vì bình thường, có lẽ chúng có thể xuất phát từ một họ lỗi chung bao gồm phân phối bình thường như họ phân phối t hoặc họ 3 tham số bình thường. Điều này làm mờ đi ranh giới giữa suy luận cổ điển, trong các mẫu nhỏ phụ thuộc vào các giả định phân phối mạnh và ước tính sai số mạnh, có nhiều bằng chứng đạn trong các mẫu tương đối lớn.

Một ví dụ về làm mờ các dòng này cho cách tiếp cận hỗn hợp, là tối đa hóa khả năng có điều kiện cho phép phân phối lỗi thú vị như $t$ -Phân phối với mức độ tự do tương đối thấp. Đối với trường hợp không đồng nhất, bạn có thể kiểm tra các biến thể để mô hình hóa các lỗi như là một hàm của giá trị trung bình, chẳng hạn như với mối quan hệ phương sai trung bình là tuyến tính (thay thế xem xét một Poisson GLM với liên kết nhận dạng).

— Adam
nguồn

3

Cả hai tính không đồng nhất và độ bền nặng có thể được coi là vi phạm các giả định phân phối của một mô hình tuyến tính tiêu chuẩn. Nếu phân phối dù sao cũng là đối xứng và mối quan hệ là giữa $x$ và $y$ là trực tuyến, mô hình của bạn không nên bị sai lệch. Thay vào đó, ước tính khoảng và suy luận sẽ không chính xác. Với đủ dữ liệu, dù sao họ cũng có thể đúng. Thật không may, thật khó để biết bao nhiêu dữ liệu sẽ là 'đủ' và số lượng có thể rất lớn mà không có nhận thức của bạn theo cách này hay cách khác. Vì vậy, bạn cần các phương pháp không dựa trên các giả định phân phối tiêu chuẩn. Đề xuất của AdamO là khả thi. Hai cách tiếp cận bổ sung nhảy vào tâm trí:

Bạn có thể tự khởi động mô hình của mình để có khoảng tin cậy và giá trị p tốt hơn. Ưu điểm ở đây là mô hình của bạn tương tự nhau (đặc biệt liên quan đến khả năng diễn giải). Nhược điểm là bạn cần có đủ dữ liệu để thể hiện đầy đủ dân số và điều này có thể yêu cầu bạn phải viết mã gốc (nghĩa là có thể chưa có các thói quen thuận tiện).
Phương pháp hồi quy không phân phối cuối cùng là sử dụng hồi quy logistic thứ tự . Các mô hình thông thường không đưa ra bất kỳ giả định nào về phân phối có điều kiện, chúng chỉ yêu cầu bạn có thể yêu cầu, nói rằng, một $7$ Là $>$ một $6$ . Đó không phải là rất hạn chế. Ưu điểm là sự mạnh mẽ đáng kể, và sẽ có các chức năng thuận tiện cho việc này trong phần mềm bạn chọn. Nhược điểm là các mô hình OLR có xu hướng khó diễn giải.

— gung - Phục hồi Monica
nguồn

Tôi không thể nhớ ai đã phát minh ra ngôn ngữ, nhưng ước tính lỗi bánh sandwich đã được gọi là bootstrap tuyến tính gần đúng. Họ được cho là phù hợp không có triệu chứng cho cùng một điều! Nhưng tôi không thể nói thêm về lý do tại sao hoặc ai thành lập điều này là chính xác.

— AdamO

@AdamO, tôi không ngạc nhiên khi chúng nhất quán không có triệu chứng. Một câu hỏi thú vị là làm thế nào họ so sánh với các mẫu vừa phải & sự bất thường phân phối khác nhau.

— gung - Phục hồi Monica