Ước tính mạnh mẽ của phân phối Poisson


8

Tôi có một bộ số được cho là đến từ phân phối Poisson. Bộ này cũng có một số ngoại lệ và do đó, ước tính khả năng tối đa bị ảnh hưởng xấu. Tôi nghe nói rằng các thủ tục ước tính mạnh mẽ có thể giúp đỡ trong tình huống như vậy. Có ai có thể giải thích làm thế nào để làm điều này? Tôi không phải là một sinh viên thống kê.

Tôi thấy rằng glmrobhàm trong R có thể được sử dụng cho việc này. (Tôi còn khá mới với R). Nhưng tôi không thể tìm ra, làm thế nào để sử dụng nó mặc dù đọc các trang hướng dẫn. Cụ thể, tôi không thể hiểu làm thế nào để có được một forumulađối số đầu tiên cho hàm glmrob.

Cảm ơn.


1
Bạn đã đọc tài liệu glmrob ? Có mã mẫu cho phù hợp Poisson mạnh mẽ tại p. 23.
whuber

Tôi đã nhìn vào họ. Trong ví dụ đó ở trang 23, có một công thức như thế này sumY ~ Age10 + Base4*Trt. Với dữ liệu tôi có, tôi không thể đưa ra bất kỳ công thức nào như vậy. Tôi chỉ có một loạt các số được cho là đến từ một bản phân phối Poisson. Theo tôi hiểu, tôi không có biến phụ thuộc và biến độc lập và có thể đó là lý do tại sao tôi không thể đưa ra công thức.
suresh

2
Bạn mặc nhiên có một thuật ngữ chặn.
Đức hồng y

2
Bạn có số lượng poisson là các phản hồi của bạn và "dự đoán" của bạn chỉ bao gồm một thuật ngữ chặn, tức là bạn muốn mô hình hóa nó như thể tất cả các phản hồi của bạn đến từ cùng một phân phối. Điều đó có làm cho nó ý nghĩa hơn không? :)
Đức hồng y

1
Công thức ví dụ : y~1.
Đức hồng y

Câu trả lời:


17

@cardinal đã điện báo một câu trả lời trong các bình luận. Hãy để nó ra. Quan điểm của ông là mặc dù các mô hình tuyến tính chung (như được triển khai bởi lmvà, trong trường hợp này glmRob) dường như nhằm đánh giá mối quan hệ giữa các biến, chúng cũng có thể là công cụ mạnh để nghiên cứu một biến duy nhất. Thủ thuật dựa trên thực tế là hồi quy dữ liệu theo hằng số chỉ là một cách khác để ước tính giá trị trung bình của nó ("vị trí") .

Ví dụ: tạo một số dữ liệu phân phối Poisson:

set.seed(17)
x <- rpois(10, lambda=2)

R(1,5,2,3,2,2,1,1,3,1)x2glmRob

library(robust)
glmrob(x ~ 1, family=poisson())

0.7268

exp(0.7268)

2.06852

plot(x, ylim=c(0, max(x)))
abline(exp(0.7268), 0, col="red")

Lô đất với đường được trang bị

Đường được trang bị hoàn toàn nằm ngang và do đó ước tính giữa các giá trị dọc: dữ liệu của chúng tôi. Đó là tất cả những gì đang diễn ra.

Để kiểm tra độ chắc chắn, hãy tạo ra một ngoại lệ xấu bằng cách ghép một vài số không vào giá trị đầu tiên của x:

x[1] <- 100

Lần này, để linh hoạt hơn trong xử lý hậu kỳ, chúng tôi sẽ lưu kết quả đầu ra của glmRob:

m <- glmrob(x ~ 1, family=poisson())

Để có được trung bình ước tính, chúng tôi có thể yêu cầu

exp(m$coefficients)

2.496xmean(x)12

summary(m)

100x[1]0.021790


3
(+1) Trình bày đẹp, như thường lệ. :)
Đức hồng y

Cảm ơn rất nhiều. Một câu trả lời như vậy rất quan trọng đối với tôi bây giờ vì tôi hoàn toàn mới đối với tất cả những điều này (các thuật ngữ như dự đoán, đánh chặn và thậm chí là gói R).
suresh

Bạn có thể chỉ ra một công cụ tương tự để phân phối Poisson bivariate không?
Diogo Santos

@Diogo Nó phụ thuộc vào công cụ đó dự định làm gì và chính xác hình thức phụ thuộc giữa các bên đang được sử dụng.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.