Bộ ba thử nghiệm trong khả năng tối đa: phải làm gì khi phải đối mặt với kết luận mâu thuẫn?


10

Các thử nghiệm Wald, Tỷ lệ khả năng và Lagrange Multiplier trong bối cảnh ước tính khả năng tối đa là tương đương với triệu chứng. Tuy nhiên, đối với các mẫu nhỏ, chúng có xu hướng phân kỳ khá nhiều, và trong một số trường hợp, chúng dẫn đến kết luận khác nhau.

Làm thế nào họ có thể được xếp hạng theo khả năng họ từ chối null? Làm gì khi các bài kiểm tra có câu trả lời mâu thuẫn? Bạn chỉ có thể chọn câu trả lời mà bạn muốn hoặc có "quy tắc" hoặc "hướng dẫn" như cách tiến hành không?


Có phải đây, có lẽ, chỉ là một trường hợp trong đó các xấp xỉ tiệm cận đối với các phân phối [null] của một hoặc nhiều trong ba thống kê kiểm tra là không tốt? có lẽ các kết quả khác nhau bởi vì kích thước thực tế của các bài kiểm tra là khác nhau? cỡ mẫu của bạn lớn bao nhiêu?
ronaf

Câu trả lời:


5

Tôi không biết các tài liệu trong khu vực đủ tốt để cung cấp một phản ứng trực tiếp. Tuy nhiên, đối với tôi, nếu ba bài kiểm tra khác nhau thì đó là một dấu hiệu cho thấy bạn cần nghiên cứu thêm / thu thập dữ liệu để trả lời dứt khoát câu hỏi của bạn.

Bạn cũng có thể muốn xem xét này tìm kiếm Google Scholar

Cập nhật để phản hồi bình luận của bạn:

Nếu không thể thu thập dữ liệu bổ sung thì có một cách giải quyết. Thực hiện một mô phỏng phản ánh cấu trúc dữ liệu, kích thước mẫu và mô hình đề xuất của bạn. Bạn có thể đặt tham số cho một số giá trị được chỉ định trước. Ước tính mô hình bằng cách sử dụng dữ liệu được tạo và sau đó kiểm tra xem một trong ba thử nghiệm sẽ đưa bạn đến đúng mô hình. Một mô phỏng như vậy sẽ cung cấp một số hướng dẫn về việc sử dụng thử nghiệm nào cho dữ liệu thực của bạn. Điều đó có ý nghĩa?


1
Bạn đang đề cập đến một bài báo cụ thể? Tôi tưởng tượng tôi có thể tìm thấy câu trả lời cho câu hỏi của mình nếu tôi nghiên cứu, nghiên cứu, đọc nhiều, nhưng cũng có thể 95% câu hỏi mà người khác hỏi ở đây ... Ngoài ra, trong một số trường hợp, đặc biệt là với dữ liệu kinh tế vĩ mô (là lĩnh vực của tôi ), không có thêm dữ liệu được thu thập. Dữ liệu khan hiếm (ý tôi là số lượng quan sát) và bạn chỉ cần sống với nó. Không có giải pháp "lấy thêm dữ liệu". Tôi đã hy vọng ai đó ở đây sẽ biết chủ đề này, nhưng có vẻ như không phải vậy. Có lẽ một khi trang web được mở ra cho công chúng?
Vivi

Tôi nghi ngờ câu trả lời cho câu hỏi của bạn sẽ là tên miền / mô hình cụ thể và do đó tôi không chắc chắn mình có thể đề xuất một bài báo cụ thể.

1
Xin lỗi vì hồi âm muộn. Tôi thích đề xuất của bạn về mô phỏng. Điều đó không thực sự dễ dàng, mặc dù. Sự thật là, những gì tôi thấy trong thực tế là các nhà nghiên cứu chỉ làm bài kiểm tra dễ tính toán hơn hoặc mang lại cho họ kết quả họ muốn.
Vivi

8

Tôi sẽ không đưa ra một câu trả lời dứt khoát về thứ hạng ba. Xây dựng 95% các TCTD xung quanh các tham số của bạn dựa trên từng thông số và nếu chúng hoàn toàn khác nhau, thì bước đầu tiên của bạn là đào sâu hơn. Chuyển đổi dữ liệu của bạn (mặc dù LR sẽ bất biến), thường xuyên hóa khả năng của bạn, v.v. Trong một trường hợp khó khăn, tôi có thể sẽ chọn thử nghiệm LR và CI liên quan. Một cuộc tranh cãi sau đây.

LR là bất biến dưới sự lựa chọn tham số (ví dụ T so với logit (T)). Thống kê Wald giả định tính quy phạm của (T - T0) / SE (T). Nếu điều này không thành công, CI của bạn là xấu. Điều thú vị về LR là bạn không cần tìm biến đổi f (T) để đáp ứng tính quy tắc. CI 95% dựa trên T sẽ giống nhau. Ngoài ra, nếu khả năng của bạn không phải là bậc hai, Wald 95% CI, đối xứng, có thể là kooky vì nó có thể thích các giá trị với khả năng thấp hơn so với những người có khả năng cao hơn.

Một cách khác để suy nghĩ về LR là nó sử dụng nhiều thông tin hơn, nói một cách lỏng lẻo, từ chức năng khả năng. Wald dựa trên MLE và độ cong của khả năng là null. Điểm số dựa trên độ dốc ở mức không và độ cong ở mức không. LR đánh giá khả năng theo null và khả năng dưới sự kết hợp giữa null và thay thế, và kết hợp cả hai. Nếu bạn bị buộc phải chọn một, điều này có thể thỏa mãn bằng trực giác khi chọn LR.

Hãy nhớ rằng có những lý do khác, chẳng hạn như sự thuận tiện hoặc tính toán, để chọn Wald hoặc Score. Wald là đơn giản nhất và, được cung cấp một tham số đa biến, nếu bạn đang thử nghiệm đặt nhiều giá trị riêng lẻ thành 0, có nhiều cách thuận tiện để ước tính khả năng. Hoặc nếu bạn muốn thêm một biến số tại một số bộ, bạn có thể không muốn tối đa hóa khả năng cho từng mô hình mới và việc triển khai các bài kiểm tra Điểm mang lại sự thuận tiện ở đây. Wald và Score trở nên hấp dẫn khi các mô hình và khả năng của bạn trở nên không hấp dẫn. (Nhưng tôi không nghĩ rằng đây là những gì bạn đã hỏi, vì bạn có sẵn cả ba ...)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.