Khoảng thời gian quan trọng và đáng tin cậy cho thuật ngữ tương tác trong hồi quy logistic


8

Tôi đã trang bị hồi quy logistic Bayes trong WinBugs và nó có thuật ngữ tương tác. Một cái gì đó như thế này:

Prob(yi=1)=logit1(a+b1xi+b2wi+b3xiwi)

Ở đâu x là một biến liên tục được tiêu chuẩn hóa, và wlà một biến giả. Trong thực tế mô hình phức tạp hơn, nhưng tôi muốn giữ mọi thứ đơn giản.

Nó xảy ra rằng thuật ngữ tương tác là "đáng kể", nhưng không phải là các yếu tố dự đoán duy nhất. Ví dụ,

mean(b1)=.295 lượng tử: (1.3.7)

mean(b2)=.495 lượng tử: (1.3.5)

mean(b3)=1.495 lượng tử: (.42.5)

Các bạn có lời khuyên nào về cách phản ứng với phát hiện này không? Tôi nghĩ rằng tôi có thể tính toán khoảng tin cậy 95% cho toàn bộ tác động củax khi nào w=1. Đây sẽ là: 95% lượng tử cho tổng hiệu ứng của x, có điều kiện trênw=1: (1.3+.4.7+2,5)= =(-.9+3.2)

Điều này có đúng không? Nếu không, tôi phải làm sao? Bất kỳ tài liệu tham khảo về chủ đề này?

Câu trả lời:


5

Không, tính toán của bạn không chính xác, bởi vì:

a) b1b3 có lẽ có tương quan trong phân phối sau, và

b) ngay cả khi họ không, đó không phải là cách bạn sẽ tính toán (nghĩ về luật số lượng lớn).

Nhưng đừng bao giờ sợ hãi, có một cách thực sự dễ dàng để làm điều này trong WinBUGS. Chỉ cần xác định một biến mới:

b1b3 <- b1 + b3

và theo dõi các giá trị của nó.

BIÊN TẬP:

Để giải thích rõ hơn về điểm đầu tiên của tôi, giả sử hậu thế có phân phối bình thường đa biến chung (nó sẽ không có trong trường hợp này, nhưng nó phục vụ như một minh họa hữu ích). Sau đó, tham sốbTôi có phân phối N(μTôi,σTôi2)và do đó, khoảng tin cậy 95% là (μTôi-1,96σTôi,μTôi+1,96σTôi) - lưu ý rằng điều này chỉ phụ thuộc vào giá trị trung bình và phương sai.

Hiện nay b1+b3 sẽ có phân phối N(μ1+μ3,σ12+2ρ13σ1σ3+σ32). Lưu ý rằng thuật ngữ phương sai (và do đó khoảng tin cậy 95%) liên quan đến thuật ngữ tương quanρ13 mà không thể được tìm thấy từ các khoảng cho b1 hoặc là b3.

(Quan điểm của tôi về luật số lượng lớn chỉ là độ lệch chuẩn của tổng 2 biến ngẫu nhiên độc lập nhỏ hơn tổng độ lệch chuẩn.)

Về cách triển khai nó trong WinBUGS, một cái gì đó như thế này là những gì tôi đã nghĩ:

model {
  a ~ dXXXX
  b1 ~ dXXXX
  b2 ~ dXXXX
  b3 ~ dXXXX
  b1b3 <- b1 + b3

  for (i in 1:N) {
    logit(p[i]) <- a + b1*x[i] + b2*w[i] + b3*x[i]*w[i]
    y[i] ~ dbern(p[i])
  }
}

Tại mỗi bước của bộ lấy mẫu, nút b1b3sẽ được cập nhật từ b1b3. Nó không cần trước vì nó chỉ là một hàm xác định của hai nút khác.


Tôi không chắc là tôi hiểu commnet của bạn. Nếu b1 và b3 tương quan với nhau, tại sao nó lại quan trọng? Ý tôi là, phân phối chung của chúng phải đặc trưng với một số tham số tương quan, nhưng vậy thì sao? Tôi có phân phối cận biên của họ. 2. Tôi không hiểu bạn đề cập đến luật số lượng lớn. Bạn có thể mở rộng về nó? Cuối cùng, bạn có đang nói rằng tôi nên thêm b1 + b3 vào vòng lặp chính không? Và tôi chỉ cần sử dụng một mơ hồ trước thông số mới này? Cảm ơn bạn!
Manoel Galdino

1

Một vài suy nghĩ: 1) Tôi không chắc liệu thực tế đây có phải là vấn đề của Bayes hay không. 2) Tôi nghĩ cách tiếp cận của bạn là đúng 3) Tương tác trong hồi quy logistic là khó khăn. Tôi đã viết về điều này trong một bài báo về SAS PROC LOGISTIC, nhưng ý tưởng chung vẫn đúng. Giấy đó trên blog của tôi và có sẵn ở đây


Tôi đồng ý rằng nó có khả năng là bayesian hay không không quan trọng. Tôi chỉ nói đó là Bayes trong trường hợp có vấn đề.
Manoel Galdino

1

Tôi hiện đang có một vấn đề tương tự. Tôi cũng tin rằng cách tiếp cận để tính tổng hiệu ứng của w là chính xác. Tôi tin rằng điều này có thể được kiểm tra thông qua

h0: b2 + b3 * có nghĩa là (x) = 0; ha: b2 + b3 * nghĩa là (x)! = 0

Tuy nhiên, tôi tình cờ thấy một bài báo của Ai / Norton, người cho rằng "cường độ của hiệu ứng tương tác trong các mô hình phi tuyến không bằng hiệu ứng cận biên của thuật ngữ tương tác, có thể là dấu hiệu ngược lại và ý nghĩa thống kê của nó không được tính bằng phần mềm tiêu chuẩn. " (2003, trang 123)

Vì vậy, có lẽ bạn nên cố gắng áp dụng các công thức của họ. (Và nếu bạn hiểu làm thế nào để làm điều đó, xin vui lòng cho tôi biết.)

Tái bút Điều này có vẻ giống với kiểm tra chow cho hồi quy logistic. Alfred DeMaris (2004, trang 283) mô tả một thử nghiệm cho điều này.

Người giới thiệu:

Ai, Chunrong / Norton, Edward (2003): Các thuật ngữ tương tác trong mô hình logit và probit, Thư kinh tế 80, tr. 123 Gian129

DeMaris, Alfred (2004): Hồi quy với dữ liệu xã hội: mô hình hóa các biến phản ứng liên tục và giới hạn. John Wiley & Sons, Inc., Hoboken NJ


Cảm ơn đã tham khảo. Tôi sẽ xem xét nó và sẽ báo cáo ở đây nếu tôi có bất kỳ tiến triển nào về vấn đề này. Về bài kiểm tra đề xuất của bạn, tôi không nghĩ rằng nó sẽ thực hiện công việc. Trước tiên hãy nhớ rằng sự tương tác là hai chiều, từ x với w và w với x. Điều này có nghĩa là ngay cả khi h0 là đúng, vẫn có thể nói h2: b1 + b2 * có nghĩa là (w) không bằng không. Hơn nữa, nói chung tôi biết trước rằng giả thuyết null là sai, tức là, nói chung không có thứ gọi là hiệu ứng bằng không. Với một mẫu đủ lớn tôi có thể tìm thấy bất kỳ hiệu ứng nào là đáng kể.
Manoel Galdino

Và một điểm khác. Ngay cả khi h0 và h2 là đúng, vẫn có thể nói h3: b2 + b3 * (mean (x) + sd (x))! = 0. Nói cách khác, chúng ta không chỉ kiểm tra giá trị trung bình của x (hoặc w), nhưng đối với toàn bộ phân phối các giá trị, vì một thuật ngữ tương tác là một cách để nói rằng hiệu ứng dự đoán thay đổi theo các nhóm con của các yếu tố dự đoán.
Manoel Galdino

Tôi không hiểu ý bạn. Khi kiểm tra xem b2 + b3 * có nghĩa là (x) == 0 hay không, bạn luôn so sánh với một số thống kê kiểm tra để xác định xem kết quả có khác biệt đáng kể so với không, độ lệch chuẩn của x không phải là yếu tố liên quan duy nhất.
mzuba

Về những gì bạn nói ... Tôi cũng không chắc là tôi có hiểu bạn không. Trong mọi trường hợp, một trong những quan điểm của tôi là: ngay cả khi chúng tôi không từ chối giả thuyết null rằng b2 + b3 * có nghĩa là (x) == 0, điều đó chỉ có nghĩa là chúng tôi không thể nói rằng hiệu ứng trung bình của W, có điều kiện giá trị trung bình của x, không bằng không. Tuy nhiên, toàn bộ quan điểm của một thuật ngữ tương tác là vì chúng tôi muốn điều kiện ảnh hưởng của W không chỉ trên trung bình x, mà trên toàn bộ sự phân tâm của x!
Manoel Galdino

Ổn thỏa. Tôi hiểu ý bạn là gì. (Tiếng Anh cũng không phải là ngôn ngữ đầu tiên của tôi.) Tôi tin rằng những gì bạn viết là đúng và đó cũng là lý do Ai / Norton vẽ hiệu ứng tương tác chống lại toàn bộ phân phối của prob (x) - đối với một số giá trị của x, hiệu ứng tương tác là tích cực, đối với một số người khác thì không. Tuy nhiên, tôi tin rằng việc bạn tính toán hiệu ứng của W, là một hình nộm, có thể (?) Làm cho mọi việc dễ dàng hơn, bởi vì nó có thể được hiểu là kiểm tra chow, phá vỡ cấu trúc, phân nhóm, v.v. (Bạn có muốn tính toán không hiệu ứng bước của w 0 → 1, hoặc bạn có quan tâm đến hiệu ứng tương tác không?)
mzuba
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.