Phải làm gì khi một số điểm thời gian có phản ứng sai lệch nặng nề và một số không trong nghiên cứu các biện pháp lặp đi lặp lại?


12

Thông thường, khi một người gặp phải các biện pháp kết quả liên tục nhưng bị sai lệch trong một thiết kế theo chiều dọc (giả sử, với một hiệu ứng giữa các chủ thể), cách tiếp cận phổ biến là biến kết quả thành bình thường. Nếu tình hình là cực kỳ, chẳng hạn như với các quan sát bị cắt cụt, người ta có thể thích và sử dụng mô hình đường cong tăng trưởng Tobit, hoặc một số như vậy.

Nhưng tôi cảm thấy hụt hẫng khi thấy các kết quả thường được phân phối tại các thời điểm nhất định và sau đó bị sai lệch nhiều ở người khác; chuyển đổi có thể cắm một rò rỉ nhưng mùa xuân khác. Bạn có thể đề nghị gì trong trường hợp như vậy? Có các phiên bản "không tham số" của các mô hình hiệu ứng hỗn hợp mà tôi không biết?

Lưu ý: một ví dụ được áp dụng sẽ là điểm kiểm tra kiến ​​thức trước / đăng một loạt các can thiệp giáo dục. Điểm số bắt đầu bình thường nhưng sau đó cụm ở mức cao của thang điểm sau này.


6
Ví dụ này rất thú vị bởi vì nó xảy ra mọi lúc. Có những biến đổi nổi tiếng để đối phó với nó, chẳng hạn như biến đổi sức mạnh "gấp" của Tukey. Chúng tạo ra một chút thay đổi ở giữa thang đo nhưng vẫn chữa được sự sai lệch ở cả hai đầu. Tôi đã thấy rằng các gốc gấp và các bản ghi hoạt động rất tốt cho các so sánh kiểm tra trước / sau được tiêu chuẩn hóa.
whuber

Cảm ơn bạn, Whuber . Tôi sẽ xem xét các phương pháp chuyển đổi gấp.
Brenden Dufault

1
Để biết định nghĩa và ví dụ, Brenden, hãy xem stats.stackexchange.com/a/10979 . Để được hướng dẫn sử dụng, hãy xem một vài chương cuối trong cuốn sách EDA của Tukey .
whuber

2
Một lưu ý bổ sung - hãy nhớ rằng các giả định được thực hiện về phần dư của mô hình, chứ không phải các biến thực tế có liên quan.
Peter Flom - Tái lập Monica

Câu trả lời:


1

Giả sử rằng sự cố xảy ra trong phần dư của bạn (vì phân phối biến kết quả thường không phải là vấn đề), tôi sẽ tìm cách điều tra nguyên nhân của vấn đề thay vì cố gắng "khắc phục" thông qua chuyển đổi hoặc ứng dụng mô hình không tham số.

Nếu đó là trường hợp dường như có một xu hướng (ví dụ, dần dần trở nên bình thường hơn hoặc ít hơn bình thường), hoặc, một sự phá vỡ rõ ràng giữa khi nó chuyển từ bình thường sang không bình thường, thì nó gợi ý một "sự thay đổi chế độ" nào đó trong dữ liệu của bạn (nghĩa là cơ chế tạo dữ liệu đang thay đổi theo thời gian) hoặc một số loại vấn đề biến thiếu.

Nếu đó là trường hợp không có mẫu rõ ràng (ví dụ: khoảng thời gian 1 và 3 trông bình thường và khoảng thời gian 2 và 4 thì không) Tôi sẽ xem xét rất kỹ vấn đề toàn vẹn dữ liệu.

Một cách đơn giản để kiểm tra xem bạn có thay đổi chế độ hay không là ước tính mô hình chỉ sử dụng các khoảng thời gian "bình thường" và sau đó ước tính lại bằng các khoảng thời gian khác và xem sự khác biệt nào xảy ra. Một cách tiếp cận phức tạp hơn là sử dụng một mô hình lớp tiềm ẩn, có lẽ với thời gian là một biến đồng thời.

Đối với câu hỏi của bạn về các mô hình hiệu ứng hỗn hợp không theo tỷ lệ, nó phụ thuộc vào ý nghĩa của bạn đối với tính không định lượng. Nếu bạn có nghĩa là các mô hình không giả sử biến phụ thuộc số thì có rất nhiều mô hình như vậy (ví dụ: LIMDEP có khá nhiều). Ngoài ra, hãy nhớ rằng việc vi phạm giả định quy tắc có lẽ sẽ chỉ có vấn đề từ góc độ suy luận nếu kích thước mẫu của bạn nhỏ. Một cách để điều tra điều này sẽ là thử các biến đổi khác nhau được thảo luận trong các nhận xét và câu trả lời khác và xem liệu nó có ảnh hưởng nhiều đến kết luận của bạn không.


+1 Cảm ơn bạn, Tim. Tôi đánh giá cao đề xuất của bạn về các mô hình lớp tiềm ẩn và LIMDEP. Những cách tiếp cận này đang tăng sức hấp dẫn đối với tôi khi tôi bắt đầu tìm hiểu thêm về chúng.
Brenden Dufault

0

Có các phép biến đổi Box-Cox nâng biến thành lambda công suất trong đó lambda được bao gồm trong ước lượng tham số mô hình. Tôi không quen với việc chuyển đổi sức mạnh gấp của Tukey, vì vậy tôi không biết liệu chúng ta có đang nói về điều tương tự không. Trong orde để ước tính lambda bạn cần nhiều điểm phù hợp. Bạn có muốn phù hợp với một phân phối khác nhau tại mỗi thời điểm trong đó phân phối được xác định trên một tập hợp các đối tượng thực hiện bài kiểm tra tại mỗi thời điểm không? Ngay cả khi đó là trường hợp nếu bạn biết rằng một số điểm thời gian nên có cùng phân phối, bạn có thể muốn kết hợp chúng theo một cách phù hợp.

Một cách tiếp cận khác không tham số và không liên quan đến các phép biến đổi thành tính chuẩn sẽ là áp dụng bootstrap tại mỗi thời điểm hoặc tại mỗi tập hợp các điểm thời gian kết hợp.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.