Phân tích hệ số hồi quy logistic


12

Dưới đây là danh sách các hệ số hồi quy logistic (đầu tiên là đánh chặn)

-1059.61966694592
-1.23890500515482
-8.57185269220438
-7.50413155570413
 0
 1.03152408392552
 1.19874787949191
-4.88083274930613
-5.77172565873336
-1.00610998453393

Tôi thấy thật kỳ lạ khi mức độ chặn quá thấp và tôi có một hệ số thực sự bằng 0. Tôi không hoàn toàn chắc chắn làm thế nào tôi sẽ diễn giải điều này. Có phải 0 chỉ ra rằng biến cụ thể không ảnh hưởng gì đến mô hình không? Nhưng việc đánh chặn được thực hiện bằng cách nhập một cột của ai đó có thực sự quan trọng? Hoặc là dữ liệu của tôi chỉ là tào lao và mô hình không thể phù hợp với nó.


2
Phạm vi hoặc độ lệch chuẩn của các biến khác của bạn là gì? Có sự khác biệt lớn giữa độ lệch chuẩn của biến với ước tính bằng 0 so với các biến khác không? Bạn có thể mong đợi một hệ số bằng 0 nếu độ lệch chuẩn nhỏ so với các hệ số khác (độ chính xác bằng số). Ngoài ra, về cơ bản chặn có nghĩa là bạn có các biến có trung bình lớn (cách xa 0). Việc căn giữa các biến của bạn sẽ giúp đánh chặn dễ hiểu hơn và sẽ không thay đổi betas cho các biến khác (lỗi thuật toán lặp sang một bên).
xác suất

1
Nếu bạn đã trừ 1027 khỏi tất cả các giá trị của biến thứ sáu, thì khả năng chặn của bạn sẽ khá gần với 0. Điều đó có làm bạn cảm thấy tốt hơn không? :-)
whuber

4
Hiển thị một danh sách các hệ số như thế này, hoàn toàn không có ngữ cảnh, có khả năng nói rằng "Joe có 31, không phải vậy sao?" mà không nói 31 . 31 xe? Rất nhiều. 31 đứa trẻ? Một trong rất nhiều! 31 đô la? Không nhiều.
Peter Flom - Tái lập Monica

1
Về hệ số 0: Tôi có thể thấy điều này xảy ra như một yếu tố của việc đưa tất cả các hệ số của bạn vào XL trước khi dán chúng vào đây - một cái gì đó có vẻ phù hợp với số lượng lớn các số thập phân mà chúng ta thường thấy. Có thể một trong những ô XL đó được đặt thành tròn thành số nguyên, mang lại số không. Tôi đã có những điều như thế này xảy ra.
rolando2

Cảm ơn tất cả các bạn cho đầu vào của bạn! Tôi thực sự đánh giá cao từng người trong số các bạn! Rất nhiều câu hỏi của tôi đã được trả lời
shiu6rewgu

Câu trả lời:


16


logit=β0+β1x1+β2x2+...+βkxk
e2.718281828
e2=7.389056
7.3890561+7.389056=0.880797

9.8×103050/(1+0)), cho chúng tôi 0 lần nữa. Do đó, điều mà đầu ra của bạn nói với bạn là sự kiện của bạn (dù đó là gì) đơn giản không xảy ra khi tất cả các biến của bạn bằng 0. Tất nhiên, nó phụ thuộc vào những gì chúng ta đang nói, nhưng tôi thấy không có gì quá đáng chú ý về điều này. Một phương trình hồi quy logistic tiêu chuẩn (ví dụ, không có thuật ngữ bình phương) nhất thiết phải thừa nhận rằng mối quan hệ giữa hiệp phương sai và xác suất thành công là tăng đơn điệu hoặc giảm đơn điệu. Điều đó có nghĩa là nó luôn lớn hơn và lớn hơn (hoặc nhỏ hơn và nhỏ hơn), và vì vậy, nếu bạn đi đủ xa theo một hướng, bạn sẽ nhận được các số nhỏ đến mức máy tính của tôi không thể phân biệt được chúng từ 0. Đó chỉ là bản chất của con thú. Khi điều đó xảy ra, đối với mô hình của bạn, việc thực sự đi xa sẽ đến nơi các giá trị đồng biến của bạn bằng 0.

Đối với hệ số 0, điều đó có nghĩa là biến đó không có tác dụng, như bạn đề xuất. Bây giờ, khá hợp lý khi một biến sẽ không có hiệu lực, tuy nhiên, về cơ bản, bạn sẽ không bao giờ có được hệ số chính xác bằng 0. Tôi không biết tại sao nó lại xảy ra trong trường hợp này; các ý kiến ​​cung cấp một số gợi ý có thể. Tôi có thể cung cấp một cái khác, đó là có thể không có biến thể trong biến đó. Ví dụ: nếu bạn có một biến được mã hóa cho giới tính, nhưng chỉ có phụ nữ trong mẫu của bạn. Tôi không biết đó có phải là câu trả lời thực sự hay không (ví dụ R, trả về NAtrong trường hợp đó, nhưng phần mềm thì khác) - đó chỉ là một gợi ý khác.


2
3067003746010460

10

Phiên dịch đánh chặn

Bạn có thể nghĩ về hồi quy logistic là cho bạn xác suất sau là "1". Chặn thể hiện sự ưu tiên trước các danh mục xuất phát từ tập dữ liệu: cụ thể, đó là ước tính thực nghiệm của log (p (Y = 1) / p (Y = 0), khi mô hình chỉ có một phần chặn, đối với các trường hợp trong các lớp 'tham chiếu' khi có các đồng biến phân loại và đối với các trường hợp khi các hiệp phương sai ở mức 0 nói chung (nhưng ít diễn giải hơn). Vì vậy, số âm mạnh mẽ của bạn có thể cho bạn biết rằng '1' rất hiếm trong số các trường hợp trong mẫu của bạn được đặc trưng bởi có tất cả các đồng biến ở mức 0. Một lần nữa, có thể không có quan sát nào ở đó, vì vậy không đáng lo ngại về giá trị chặn. Cuộc thảo luận này khá rõ ràng.

Do sự phân tách mối quan tâm tiện dụng này giữa các tham số, bạn có thể sửa lỗi cho sự mất cân bằng danh mục bằng cách huấn luyện trên một mẫu cân bằng tốt hơn và chỉ điều chỉnh đánh chặn . Xem King và Zeng để thảo luận kỹ lưỡng.


Liên kết đến "cuộc thảo luận này" dường như đã chết. Bất kỳ cơ hội để phục hồi liên kết này?
Alexey Grigorev

1
@ alexey-grigorev Tôi đã cập nhật liên kết UCLA
liên hợp

và thu được một downvote. Rất kỳ quặc.
liên hợp chiến
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.