Rõ ràng đề xuất của Greg là điều đầu tiên nên thử: Hồi quy Poisson là mô hình tự nhiên trong nhiều cụ thể tình huống.
Tuy nhiên, mô hình mà bạn đề xuất có thể xảy ra, ví dụ như khi bạn quan sát dữ liệu được làm tròn:
với iid lỗi bình thường .
Yi=⌊axi+b+ϵi⌋,
ϵi
Tôi nghĩ rằng điều này là thú vị để có một cái nhìn về những gì có thể được thực hiện với nó. Tôi biểu thị bằng cdf của biến thông thường tiêu chuẩn. Nếu , thì
bằng cách sử dụng các ký hiệu máy tính quen thuộc.Fϵ∼N(0,σ2)
P(⌊ax+b+ϵ⌋=k)=F(k−b+1−axσ)−F(k−b−axσ)=pnorm(k+1−ax−b,sd=σ)−pnorm(k−ax−b,sd=σ),
Bạn quan sát các điểm dữ liệu . Khả năng nhật ký được đưa ra bởi
Điều này không giống với hình vuông nhỏ nhất. Bạn có thể cố gắng tối đa hóa điều này bằng một phương pháp số. Đây là một minh họa trong R:(xi,yi)
ℓ(a,b,σ)=∑ilog(F(yi−b+1−axiσ)−F(yi−b−axiσ)).
log_lik <- function(a,b,s,x,y)
sum(log(pnorm(y+1-a*x-b, sd=s) - pnorm(y-a*x-b, sd=s)));
x <- 0:20
y <- floor(x+3+rnorm(length(x), sd=3))
plot(x,y, pch=19)
optim(c(1,1,1), function(p) -log_lik(p[1], p[2], p[3], x, y)) -> r
abline(r$par[2], r$par[1], lty=2, col="red")
t <- seq(0,20,by=0.01)
lines(t, floor( r$par[1]*t+r$par[2]), col="green")
lm(y~x) -> r1
abline(r1, lty=2, col="blue");
Trong màu đỏ và màu xanh, các dòng được tìm thấy bằng cách tối đa hóa số lượng của khả năng này và bình phương nhỏ nhất, tương ứng. Cầu thang màu xanh lá cây là cho được tìm thấy từ khả năng tối đa ... điều này cho thấy rằng bạn có thể sử dụng bình phương tối thiểu, lên đến một bản dịch bằng 0,5 và nhận được kết quả gần như tương tự; hoặc, bình phương tối thiểu đó phù hợp với mô hình
trong đó là số nguyên gần nhất. Dữ liệu làm tròn thường được đáp ứng đến mức tôi chắc chắn điều này đã được biết và đã được nghiên cứu rộng rãi ...ax+b⌊ax+b⌋a,bb
Yi=[axi+b+ϵi],
[x]=⌊x+0.5⌋