Giải thích mô hình Tobit


13

Chúng tôi có 100 người tham gia trong hai nhóm, trong mỗi nhóm. Chúng tôi đã sử dụng một đánh giá về khả năng hoạt động cơ bản tại 4 thời điểm. Bài đánh giá bao gồm 6 câu hỏi, mỗi câu được 0 - 5. Chúng tôi không có điểm riêng cho mỗi câu hỏi, chỉ có tổng điểm nằm trong khoảng từ 0 - 30. Điểm cao hơn cho thấy chức năng tốt hơn. Vấn đề là đánh giá là rất cơ bản và có hiệu ứng trần đáng kể. Kết quả rất sai lệch. Phần lớn những người tham gia đạt gần 30 điểm, đặc biệt là ở 3 thời điểm theo dõi. Có vẻ như không phải tất cả những người tham gia đạt điểm giới hạn trên đều có khả năng thực sự như nhau: một số người tham gia chỉ đạt điểm 30 và những người khác đạt 30 điểm dễ dàng và sẽ đạt điểm cao hơn nhiều nếu có thể và vì vậy dữ liệu là Kiểm duyệt từ trên cao.n=50

Tôi muốn so sánh hai nhóm và theo thời gian nhưng rõ ràng điều này rất khó đưa ra bản chất của kết quả. Các biến đổi của bất kỳ loại nào làm cho không có sự khác biệt. Tôi đã được thông báo rằng mô hình Tobit được trang bị tốt nhất cho đánh giá này và tôi có thể chạy phân tích trong R bằng các ví dụ từ bài báo của Arne Henningen, Ước tính mô hình hồi quy kiểm duyệt trong R bằng cách sử dụng gói censReg .

Tuy nhiên, tôi chỉ có kiến ​​thức cơ bản về thống kê và đã tìm thấy thông tin về mô hình Tobit khá phức tạp. Tôi cần có khả năng giải thích mô hình này bằng ngôn ngữ đơn giản và tôi không thể tìm thấy một ngôn ngữ đơn giản, các loại hạt và bu lông giải thích về những gì mô hình Tobit thực sự làm và làm thế nào. Bất cứ ai cũng có thể giải thích mô hình Tobit hoặc chỉ cho tôi theo hướng của một tài liệu tham khảo có thể đọc được mà không cần giải thích thống kê và toán học phức tạp?

Vô cùng biết ơn sự giúp đỡ

Câu trả lời:


8

Wiki mô tả mô hình Tobit như sau:

yi={yiifyi>0 0ifyi0

yi=βxi+ui

uiN(0,σ2)

Tôi sẽ điều chỉnh mô hình trên với bối cảnh của bạn và đưa ra một cách giải thích bằng tiếng Anh đơn giản về các phương trình có thể hữu ích.

yi={ yiifyi3030ifyi>30

yi=βxi+uTôi

uiN(0,σ2)

Trong các phương trình trên, đại diện cho khả năng của một chủ thể. Do đó, tập hợp các phương trình đầu tiên nêu sau:yi

  1. yi=30ifyi>30

  2. yi=yiifyi30

  3. yixi

Tôi hi vọng điều đó hữu ích. Nếu một số khía cạnh không rõ ràng, vui lòng hỏi trong các ý kiến.


Varty, tôi rất đánh giá cao phản ứng của bạn. Nó rất hữu ích, và rất nhanh! Không chắc là tôi cảm thấy thoải mái khi giải thích nó chưa, nhưng tôi sẽ tiếp tục đọc. Nếu bạn biết bất kỳ văn bản nào có thể đọc được trên Tobit, vui lòng chuyển tiếp chúng. Rất cám ơn một lần nữa
Adam

4

Có một bài viết của Berk trong ấn bản năm 1983 của Tạp chí Xã hội học Hoa Kỳ (số 3) - đó là cách tôi học về kiểm duyệt. Giải thích cụ thể về xu hướng lựa chọn nhưng hoàn toàn phù hợp với vấn đề của bạn. Lựa chọn thiên vị như Berk thảo luận chỉ là kiểm duyệt thông qua quy trình chọn mẫu, trong trường hợp của bạn, kiểm duyệt là kết quả của một công cụ không nhạy cảm. Có một số biểu đồ đẹp cho bạn thấy chính xác cách bạn có thể mong đợi đường hồi quy của mình bị sai lệch khi Y bị kiểm duyệt theo các cách khác nhau. Nói chung, bài viết hợp lý và trực quan hơn là toán học (vâng tôi coi chúng là riêng biệt, thích cái trước hơn). Tobit được thảo luận như là một giải pháp cho vấn đề.

Tổng quát hơn, có vẻ như quỹ đạo là công cụ phù hợp cho công việc trong tầm tay. Về cơ bản, cách thức hoạt động của nó là bằng cách ước tính xác suất bị kiểm duyệt và sau đó kết hợp nó vào phương trình dự đoán điểm số. Có một cách tiếp cận khác được Heckman đề xuất bằng cách sử dụng probit và tỷ lệ nghịch của các nhà máy về cơ bản là giống nhau nhưng cho phép bạn có các biến khác nhau dự đoán khả năng kiểm duyệt và điểm trong bài kiểm tra - rõ ràng điều đó sẽ không phù hợp với tình huống của bạn có.

Một đề xuất khác - bạn có thể xem xét một mô hình quỹ đạo phân cấp trong đó các quan sát được lồng trong các cá nhân. Điều này sẽ giải thích chính xác cho xu hướng lỗi được liên kết trong các cá nhân. Hoặc nếu bạn không sử dụng mô hình phân cấp, ít nhất hãy chắc chắn điều chỉnh các lỗi tiêu chuẩn của mình để phân cụm các quan sát trong các cá nhân. Tôi biết tất cả điều này có thể được thực hiện ở Stata và tôi tự tin R với tất cả tính linh hoạt của nó cũng có thể làm được .. nhưng với tư cách là một người dùng Stata khao khát, tôi không thể cung cấp cho bạn bất kỳ hướng dẫn nào về cách thực hiện trong R.


Tôi cho rằng đây là trích dẫn đầy đủ cho bài viết @Will đang đề cập đến: Berk, RA (1983). Giới thiệu về Xu hướng chọn mẫu trong dữ liệu xã hội học. Tạp chí Xã hội học Hoa Kỳ, 48, 386-398. doi: 10.2307 / 2095230 Có một số phiên bản có sẵn miễn phí của bài viết này, mà bạn sẽ tìm thấy trên Google Scholar, ví dụ:
crsh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.