Cách tốt nhất để hình dung các tác động của các loại và mức độ phổ biến của chúng trong hồi quy logistic là gì?


11

Tôi cần trình bày thông tin về những người dự đoán chính về phiếu bầu của ứng cử viên bằng cách sử dụng dữ liệu khảo sát dư luận. Tôi đã chạy hồi quy logistic bằng cách sử dụng tất cả các biến mà tôi quan tâm, nhưng tôi không thể tìm thấy một cách hay để trình bày thông tin này.

Khách hàng của tôi không quan tâm đến kích thước của hiệu ứng mà chỉ quan tâm đến sự tương tác giữa kích thước của hiệu ứng và kích thước của dân số với thuộc tính đó.

Làm thế nào tôi có thể đối phó với điều đó trong một biểu đồ? Bất kỳ đề xuất?

Đây là một ví dụ:

Các của SEX biến (Nam = 1) khi biến phụ thuộc là Vote / Không có trong một ứng cử viên là 2.3, đó là một số lượng lớn sau khi đã được exponentiated và hạch toán như tỷ số chênh hoặc xác suất. Tuy nhiên, xã hội nơi cuộc khảo sát này được thực hiện chỉ có 30% nam giới. Do đó, mặc dù người đàn ông ủng hộ ứng cử viên này khá nhiều, nhưng con số của họ không đáng kể đối với một ứng cử viên đang cố gắng giành chiến thắng trong một cuộc bầu cử chuyên chế.β


FWIW, việc sử dụng thuật ngữ "tương tác" là không chính xác (xem, ví dụ ở đây hoặc ở đây ). Tôi sẽ nói một cái gì đó như, '... nhưng về việc xác định các tình huống trong đó kích thước hiệu ứng lớn và kích thước của dân số có thuộc tính như vậy cũng lớn'.
gung - Phục hồi Monica

Câu trả lời:


10

Tôi đồng ý với @PeterFlom rằng ví dụ này là số lẻ, nhưng đặt nó sang một bên, tôi nhận thấy rằng biến giải thích là phân loại. Nếu điều đó luôn đúng, nó đơn giản hóa điều này rất nhiều. Tôi sẽ sử dụng các ô khảm để trình bày các hiệu ứng này. Biểu đồ khảm hiển thị tỷ lệ có điều kiện theo chiều dọc, nhưng chiều rộng của mỗi loại được chia tỷ lệ tương ứng với tỷ lệ biên (nghĩa là vô điều kiện) của nó trong mẫu.

Dưới đây là một ví dụ với dữ liệu từ thảm họa Titanic, được tạo bằng R:

data(Titanic)

sex.table   = margin.table(Titanic, margin=c(2,4))
class.table = margin.table(Titanic, margin=c(1,4))
round(prop.table(t(sex.table), margin=2), digits=3)
#          Sex
# Survived  Male Female
#      No  0.788  0.268
#      Yes 0.212  0.732
round(prop.table(t(class.table), margin=2), digits=3)
#           Class
# Survived   1st   2nd   3rd  Crew
#      No  0.375 0.586 0.748 0.760
#      Yes 0.625 0.414 0.252 0.240

windows(height=3, width=6)
  par(mai=c(.5,.4,.1,0), mfrow=c(1,2))
  mosaicplot(sex.table,   main="")
  mosaicplot(class.table, main="")

nhập mô tả hình ảnh ở đây

Ở bên trái, chúng tôi thấy rằng phụ nữ có nhiều khả năng sống sót hơn, nhưng đàn ông chiếm khoảng 80% số người trên tàu. Vì vậy, việc tăng tỷ lệ sống sót của nam giới có nghĩa là sẽ cứu được nhiều mạng sống hơn so với sự gia tăng lớn hơn về tỷ lệ sống sót của nữ. Điều này hơi giống với ví dụ của bạn. Có một ví dụ khác ở bên phải nơi phi hành đoàn và lái tàu chiếm tỷ lệ lớn nhất trong số những người, nhưng có xác suất sống sót thấp nhất. (Đối với những gì đáng giá, đây không phải là một phân tích đầy đủ về những dữ liệu này, bởi vì lớp học và giới tính cũng không độc lập với Titanic, nhưng nó đủ để minh họa các ý tưởng cho câu hỏi này.)


5

Tôi hơi tò mò về việc xã hội chỉ có 10% đàn ông ... nhưng ...

Một điều bạn có thể làm là vẽ các tỷ lệ tỷ lệ cược và dán nhãn cho từng tỷ lệ với kích thước của mẫu.

Nếu bạn muốn cả hai biến được biểu thị bằng đồ họa, bạn có thể tạo biểu đồ bong bóng, với vị trí của mỗi bong bóng trên trục y khớp với kích thước của tỷ lệ chênh lệch và diện tích của bong bóng tỷ lệ với kích thước mẫu.


7
Có lẽ cái này .
Andre Silva
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.