Nếu tôi có nhiều kết quả dương tính, không đáng kể, tôi có thể kiểm tra ít nhất


9

Giả sử tôi đã chạy hồi quy tương tự cho 100 cá nhân khác nhau. Các hệ số quan tâm của tôi là dương (và khá khác biệt với nhau) nhưng không có ý nghĩa thống kê trong tất cả 100 kết quả (giả sử mọi giá trị p = 0,11).

Có cách nào để kết hợp các giá trị p này để kết luận "ít nhất 80 trong số các kết quả này là dương" với ý nghĩa lớn hơn p = 0,11 không? Các tìm kiếm trực tuyến của tôi chỉ cho tôi thấy làm thế nào để nói "ít nhất 1 trong số các kết quả này là dương tính" thông qua một bài kiểm tra của Fisher hoặc tương tự, nhưng tôi chưa thể khái quát kết quả đó. Tôi muốn kiểm tra "H0 = tất cả 100 hiệu ứng đều giống nhau ở 0" so với "HA = ít nhất 80 hiệu ứng là dương".

Mục tiêu của tôi không nói là có một hệ số dương trung bình, và cũng không phải là để đo cụ thể hệ số. Mục tiêu của tôi là chứng minh, với tầm quan trọng, rằng ít nhất 80 người cá nhân phải đối mặt với một số hiệu ứng tích cực bất kể là 80, và bất kể mức độ ảnh hưởng của mỗi cá nhân.


2
Bạn có ý nghĩa gì khi nói "chạy cùng một hồi quy cho 100 cá nhân"? - điều này có nghĩa là bạn có 100 bộ dữ liệu, mỗi bộ có nhiều quan sát trên cùng một bộ biến trả lời và biến giải thích? Không chắc chắn cách thức hoạt động của nó, ví dụ: nếu bạn quan tâm đến việc so sánh chiều cao và cân nặng của từng cá nhân, bạn chỉ có một quan sát cho mỗi cá nhân, vậy làm thế nào để phù hợp với hồi quy? Bạn có thể có một chuỗi thời gian cho mỗi cá nhân - trong trường hợp đó bạn vẫn cần các kỹ thuật phức tạp hơn. Đó sẽ là một hình thức phân tích theo chiều dọc, nếu bạn đang tìm kiếm cụm từ tìm kiếm.
Peter Ellis

Câu trả lời:


8

Bạn nên thực hiện tất cả 100 phân tích dưới dạng một mô hình hiệu ứng hỗn hợp duy nhất, với các hệ số biến ngẫu nhiên quan tâm của bạn. Bằng cách đó, bạn có thể ước tính phân phối cho các hệ số đó bao gồm cả giá trị trung bình chung của chúng, sẽ cung cấp cho bạn loại giải thích mà tôi nghĩ bạn đang tìm kiếm.

Lưu ý rằng, nếu như tôi nghi ngờ là trường hợp, bạn có một chuỗi thời gian cho mỗi cá nhân, bạn cũng sẽ cần phải sửa cho tự động tương quan của phần dư.


Cảm ơn bạn đã dành thời gian, đánh giá cao. Nếu tôi có thể làm rõ, đó là một chuỗi thời gian. Hãy nói rằng tôi có dữ liệu cho tất cả 100 cá nhân trên 5 năm và trong năm thứ ba, một biến giả (biến độc lập mà tôi quan tâm) thay đổi thành 1 cùng lúc cho tất cả 100 cá nhân. Tôi không quan tâm đến tác động chính xác của sự thay đổi đó đối với mỗi người, hoặc hiệu ứng trung bình. Thay vào đó, tôi chỉ muốn thiết lập rằng ít nhất 80 người bị ảnh hưởng. Hệ số dương trên tất cả 100, nhưng mỗi hệ số không đáng kể. Tôi không chắc chắn đo lường phân phối của hệ số sẽ thực hiện điều đó.
dùng28239

1
Đó là những gì tôi đoán bạn đã có. Tôi nghĩ rằng cách tiếp cận được đề nghị của tôi là đúng. Sau đó, bạn có thể sử dụng mô hình để thực hiện dự đoán hoặc bất kỳ điều diễn giải nào khác mà bạn muốn.
Peter Ellis

4

Điều đơn giản nhất để làm có lẽ là một bài kiểm tra dấu hiệu. Giả thuyết khống là mỗi kết quả có xác suất dương hoặc âm bằng nhau (như lật một đồng xu công bằng). Mục tiêu của bạn là xác định xem các kết quả quan sát được có đủ khả năng theo giả thuyết không có giá trị này mà bạn có thể từ chối hay không.

Xác suất nhận được 80 đầu trở lên trong số 100 lần tung đồng xu là gì? Bạn có thể tính toán điều này bằng cách sử dụng phân phối nhị thức. Trong R, hàm có liên quan được gọi pbinomvà bạn có thể nhận giá trị p (một phía) bằng cách sử dụng dòng mã sau:

pbinom(80, size = 100, prob = 0.5, lower.tail = FALSE)

Theo thử nghiệm này, trực giác của bạn là chính xác, bạn sẽ cực kỳ khó có thể đạt được 80 kết quả dương tính nếu điều trị không có kết quả.

Một lựa chọn liên quan chặt chẽ sẽ là sử dụng một cái gì đó giống như bài kiểm tra xếp hạng có chữ ký của Wilcoxon .


Một cách tiếp cận tốt hơn , nếu bạn thực sự muốn ước tính kích thước của hiệu ứng (thay vì chỉ xác định xem nó có xu hướng lớn hơn 0 hay không), có lẽ sẽ là mô hình phân cấp ("hỗn hợp").

Ở đây, mô hình nói rằng kết quả 100 cá nhân của bạn đến từ một phân phối và mục tiêu của bạn là xem giá trị trung bình của phân phối đó là bao nhiêu (cùng với khoảng tin cậy).

Các mô hình hỗn hợp cho phép bạn nói thêm một chút về kích thước hiệu ứng của bạn: sau khi lắp mô hình, bạn có thể nói điều gì đó như "chúng tôi ước tính rằng việc điều trị của chúng tôi có xu hướng cải thiện kết quả trung bình ba đơn vị, mặc dù dữ liệu phù hợp với mức trung bình thực kích thước hiệu ứng ở bất kỳ nơi nào từ 1,5 đến 4,5 đơn vị. Ngoài ra, có một số biến thể giữa các cá nhân, vì vậy một người nhất định có thể thấy hiệu ứng ở bất kỳ đâu từ -0,5 đến +6,5 đơn vị ".

Đó là một tập hợp các tuyên bố rất chính xác và hữu ích - tốt hơn nhiều so với chỉ "hiệu quả có thể là tích cực, trung bình", đó là lý do tại sao phương pháp này có xu hướng được các nhà thống kê ưa chuộng. Nhưng nếu bạn không cần tất cả chi tiết đó, cách tiếp cận đầu tiên tôi đề cập cũng có thể ổn.


0

Có thể tôi hiểu điều đó hoàn toàn sai, nhưng dường như với tôi là bạn đang cố gắng thực hiện các biện pháp lặp lại ANOVA. Chỉ cần định nghĩa "hình nộm" này là một yếu tố bên trong chủ đề và mô hình sẽ làm phần còn lại. Ý nghĩa bản thân nó không nhiều thông tin; nó là bắt buộc nhưng không đủ; bất kỳ mô hình nào cũng sẽ có ý nghĩa với số lượng quan sát đủ lớn. bạn có thể muốn có được kích thước hiệu ứng, như (một phần) Eta-Squared, để có được ý tưởng về mức độ "lớn" của hiệu ứng của bạn. 2 xu của tôi.


0

Nó có thể đơn giản như một phép tính ANCOVA thông thường, nhưng cách thích hợp để phân tích dữ liệu của bạn sẽ phụ thuộc vào tình huống vật lý và bạn chưa cung cấp các chi tiết đó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.