Mặt trái của việc coi một yếu tố là ngẫu nhiên trong một mô hình hỗn hợp là gì?


24

Tôi có một vấn đề bao hàm các lợi ích của việc gắn nhãn một yếu tố mô hình là ngẫu nhiên vì một vài lý do. Đối với tôi có vẻ như trong hầu hết các trường hợp, giải pháp tối ưu là coi tất cả các yếu tố là cố định.

Đầu tiên, sự phân biệt cố định và ngẫu nhiên là khá tùy tiện. Giải thích tiêu chuẩn là, nếu một người quan tâm đến các đơn vị thử nghiệm cụ thể, thì người ta nên sử dụng các hiệu ứng cố định và, nếu một người quan tâm đến dân số được đại diện bởi các đơn vị thử nghiệm, thì nên sử dụng các hiệu ứng ngẫu nhiên. Điều này không giúp ích nhiều vì nó ngụ ý người ta có thể xen kẽ giữa các chế độ xem cố định và ngẫu nhiên ngay cả khi dữ liệu và thiết kế thử nghiệm vẫn giữ nguyên. Ngoài ra, định nghĩa này thúc đẩy một ảo tưởng rằng, nếu một yếu tố được gắn nhãn là ngẫu nhiên, suy luận được rút ra từ mô hình bằng cách nào đó có thể áp dụng cho dân số hơn trong trường hợp khi yếu tố được dán nhãn là cố định. Cuối cùng, Gelman cho thấy sự phân biệt ngẫu nhiên cố định là khó hiểu thậm chí ở cấp độ định nghĩa vì có thêm bốn định nghĩa về các hiệu ứng cố định và ngẫu nhiên là gì.

Thứ hai, việc ước tính các mô hình hỗn hợp khá phức tạp. Trái ngược với mô hình "cố định hoàn toàn, có nhiều cách để đạt được giá trị p. Giáo sư Bates đã thực hiện ước lượng REML trong gói lme4 trong R đã từ chối báo cáo giá trị p hoàn toàn .

Thứ ba, có một vấn đề mờ ám về việc có bao nhiêu tham số ngầm được đưa ra bởi một yếu tố ngẫu nhiên. Ví dụ sau đây là sự thích ứng của tôi về điều đó trong Burnham & Anderson, Lựa chọn mô hình và suy luận đa mô hình: Phương pháp tiếp cận lý thuyết thông tin thực tế . Từ quan điểm đánh đổi sai lệch thiên vị, vai trò của các hiệu ứng ngẫu nhiên có thể được minh họa như sau. Xem xét ANOVA một chiều với các nghiệm thức và các hiệu ứng nhân tố chính , trong đó là có thể ước tính được. Thuật ngữ lỗi có phân phối . Nếu số lượng quan sát được cố định, sự đánh đổi sai lệch sẽ giảm đi khi tăng lên. Giả sử chúng ta nói rằngKKK-1N(0,σ2)KKcác hiệu ứng chính được rút ra từ phân phối . Mô hình tương ứng sẽ có độ phức tạp nằm ở đâu đó giữa phiên bản cố định (quá mức) và mô hình bị thiếu chỉ chứa phần chặn. Số lượng tham số hiệu quả trong mô hình cố định làN(0,σK)

1intercept+(K1)maineffects+1σ=K+1.

Số lượng tham số hiệu quả trong mô hình ngẫu nhiên có ít nhất ba: . Ngoài ra, mô hình ngẫu nhiên có một số tham số ẩn ẩn của ẩn ý ngụ ý hạn chế phân phối (bình thường trong trường hợp này) áp đặt cho các hiệu ứng chính.intercept,σ,σK

Đặc biệt, nếu có một yếu tố có hai cấp độ, sẽ không có nghĩa khi gọi nó là ngẫu nhiên, ngay cả khi chúng tôi biết chắc chắn rằng các cấp độ của nó đã được lấy mẫu ngẫu nhiên từ một số người. Đó là bởi vì phiên bản hiệu ứng cố định có ba tham số và phiên bản hiệu ứng ngẫu nhiên có hơn ba tham số. Trong trường hợp này, mô hình ngẫu nhiên hóa ra có độ phức tạp hơn phiên bản cố định. Rõ ràng, việc chuyển đổi từ phiên bản cố định sang ngẫu nhiên có căn cứ hơn đối với lớn hơnK. Tuy nhiên, không rõ số lượng tham số ẩn ẩn trong mô hình ngẫu nhiên, do đó không thể so sánh các phiên bản cố định và ngẫu nhiên dựa trên các tiêu chí thông tin như AIC. Do đó, trong khi ví dụ này làm sáng tỏ sự đóng góp của các hiệu ứng ngẫu nhiên (khả năng đánh đổi sai lệch sai lệch tốt hơn), nó cũng cho thấy thật khó để nói khi nào có thể xác định lại yếu tố từ cố định sang ngẫu nhiên.

Không có vấn đề nào ở trên xuất hiện trong mô hình cố định hoàn toàn của người Viking. Do đó, tôi sẵn sàng hỏi:

  1. Bất cứ ai cũng có thể cung cấp một ví dụ khi một cái gì đó rất xấu xảy ra khi một yếu tố ngẫu nhiên được sử dụng như thể nó đã được sửa chữa? Tôi tin rằng nên có một số nghiên cứu mô phỏng giải quyết vấn đề một cách rõ ràng.

  2. Có một phương pháp định lượng đã được chứng minh để quyết định khi nào có ý nghĩa để chuyển từ nhãn cố định sang nhãn ngẫu nhiên?


Câu hỏi được viết tốt, và tôi đã học được một vài điều từ việc đọc nó. Tôi tự hỏi nếu phân tích hiệu ứng ngẫu nhiên sẽ bị tiêu diệt trong thời gian dài, có lẽ sẽ bị đánh bại bởi các kỹ thuật làm mịn đơn giản hơn. Nếu tôi cố gắng trả lời # 1, tôi sẽ gặp tình huống có độ biến thiên cao, nhiều đối tượng và cỡ mẫu nhỏ trong chủ đề. Sau đó, các ước tính cố định trong chủ đề sẽ ở khắp mọi nơi.
Ben Ogorek

Câu trả lời:


20

1. Một ví dụ nổi tiếng về tâm lý học và ngôn ngữ học được mô tả bởi Herb Clark (1973; sau Coleman, 1964): "Ngụy biện ngôn ngữ như cố định: Một phê bình về thống kê ngôn ngữ trong nghiên cứu tâm lý học."

Clark là một nhà tâm lý học thảo luận về các thí nghiệm tâm lý trong đó một mẫu đối tượng nghiên cứu đưa ra phản ứng với một tập hợp các tài liệu kích thích, thường là những từ khác nhau được rút ra từ một số xác chết. Ông chỉ ra rằng quy trình thống kê tiêu chuẩn được sử dụng trong các trường hợp này, dựa trên các biện pháp lặp lại ANOVA, và được Clark gọi là , coi người tham gia là một yếu tố ngẫu nhiên nhưng (có lẽ ngầm) xử lý các tài liệu kích thích (hoặc "ngôn ngữ") như cố định. Điều này dẫn đến các vấn đề trong việc diễn giải kết quả kiểm tra giả thuyết về yếu tố điều kiện thí nghiệm: tự nhiên chúng tôi muốn giả định rằng kết quả dương tính cho chúng tôi biết điều gì đó về cả dân số mà chúng tôi đã rút ra mẫu người tham gia cũng như dân số lý thuyết mà chúng tôi đã rút ra các tài liệu ngôn ngữ. Nhưng FF1 , bằng cách coi người tham gia là ngẫu nhiên và kích thích là cố định, chỉ cho chúng ta biết về tác động của yếu tố điều kiện đối với những người tham gia tương tự khác phản ứng vớicác kích thích chính xác tương tự. Tiến hànhphân tích F 1 khi cả người tham gia và kích thích được xem một cách thích hợp là ngẫu nhiên có thể dẫn đến tỷ lệ lỗi Loại 1 vượt quá mức α danh nghĩa- thường là 0,05 - với mức độ tùy thuộc vào các yếu tố như số lượng và độ biến thiên của kích thích và thiết kế của thí nghiệm. Trong trường hợp này, việc phân tích thích hợp hơn, ít nhất là trong khuôn khổ ANOVA cổ điển, là sử dụng những gì được gọi là gần F thống kê dựa trên tỷ lệ củatổ hợp tuyến tính củaF1F1αF nghĩa là hình vuông.

Bài báo của Clark đã tạo ra một sự nổi bật trong tâm lý học vào thời điểm đó, nhưng đã thất bại trong việc tạo ra một vết lõm lớn trong văn học tâm lý rộng lớn hơn. . trong các mô hình hiệu ứng hỗn hợp, trong đó mô hình hỗn hợp cổ điển ANOVA có thể được xem là trường hợp đặc biệt. Một số trong những bài báo gần đây bao gồm Baayen, Davidson, & Bates (2008), Murayama, Sakaki, Yan, & Smith (2014), và ( ahem ) Judd, Westfall, & Kenny (2012). Tôi chắc chắn có một số tôi đang quên.

2. Không chính xác. Có nhiều phương pháp để xem liệu một yếu tố có tốt hơn được đưa vào như một hiệu ứng ngẫu nhiên hay không trong mô hình (xem ví dụ, Pinheiro & Bates, 2000, tr. 83-87; tuy nhiên, hãy xem Barr, Levy, Scheepers, & Tily, 2013). Và tất nhiên, có các kỹ thuật so sánh mô hình cổ điển để xác định xem một yếu tố tốt hơn có được bao gồm như một hiệu ứng cố định hay không (ví dụ, -tests). Nhưng tôi nghĩ rằng việc xác định liệu một yếu tố được coi là cố định hay ngẫu nhiên thường tốt nhất là một câu hỏi khái niệm, được trả lời bằng cách xem xét thiết kế nghiên cứu và bản chất của các kết luận được rút ra từ nó.F

Một trong những người hướng dẫn thống kê tốt nghiệp của tôi, Gary McClelland, thích nói rằng có lẽ câu hỏi cơ bản của suy luận thống kê là: "So với cái gì?" Theo Gary, tôi nghĩ chúng ta có thể đóng khung câu hỏi khái niệm mà tôi đã đề cập ở trên như: Lớp tham chiếu của các kết quả thử nghiệm giả định mà tôi muốn so sánh kết quả quan sát thực tế của mình là gì? Ở trong bối cảnh tâm lý học và xem xét một thiết kế thử nghiệm trong đó chúng ta có một mẫu Đối tượng phản ứng với một mẫu Từ được phân loại theo một trong hai Điều kiện (thiết kế cụ thể được thảo luận bởi Clark, 1973), tôi sẽ tập trung vào hai khả năng:

  1. Tập hợp các thử nghiệm trong đó, đối với mỗi thử nghiệm, chúng tôi vẽ một mẫu Đối tượng mới, một mẫu Từ mới và một mẫu lỗi mới từ mô hình tổng quát. Theo mô hình này, Chủ đề và Từ ngữ đều là hiệu ứng ngẫu nhiên.
  2. Tập hợp các thử nghiệm trong đó, đối với mỗi thử nghiệm, chúng tôi vẽ một mẫu Đối tượng mới và một mẫu lỗi mới, nhưng chúng tôi luôn sử dụng cùng một bộ Từ . Theo mô hình này, Chủ đề là các hiệu ứng ngẫu nhiên nhưng Từ là hiệu ứng cố định.

Để thực hiện điều này hoàn toàn cụ thể, dưới đây là một số sơ đồ từ (trên) 4 bộ kết quả giả thuyết từ 4 thí nghiệm mô phỏng theo Mô hình 1; (bên dưới) 4 bộ kết quả giả thuyết từ 4 thử nghiệm mô phỏng theo Mô hình 2. Mỗi thử nghiệm xem kết quả theo hai cách: (bảng bên trái) được nhóm theo Đối tượng, với Chủ đề theo Điều kiện có nghĩa được vẽ và gắn với nhau cho từng Đối tượng; (bảng bên phải) được nhóm theo từ, với các ô hình hộp tóm tắt phân phối câu trả lời cho mỗi từ. Tất cả các thí nghiệm liên quan đến 10 Đối tượng phản ứng với 10 từ và trong tất cả các thử nghiệm, "giả thuyết khống" không có sự khác biệt về Điều kiện là đúng trong dân số có liên quan.

Cả hai chủ đề và từ ngẫu nhiên: 4 thí nghiệm mô phỏng

cả hai

Lưu ý ở đây rằng trong mỗi thử nghiệm, cấu hình phản hồi cho Chủ đề và Từ hoàn toàn khác nhau. Đối với Đối tượng, đôi khi chúng tôi nhận được phản hồi tổng thể thấp, đôi khi phản hồi cao, đôi khi Đối tượng có xu hướng hiển thị sự khác biệt lớn về Điều kiện và đôi khi Đối tượng có xu hướng hiển thị chênh lệch Điều kiện nhỏ. Tương tự như vậy, đối với các từ, đôi khi chúng ta nhận được các từ có xu hướng gợi ra các phản hồi thấp và đôi khi nhận được các từ có xu hướng gợi ra các phản hồi cao.

Đối tượng ngẫu nhiên, Từ cố định: 4 thí nghiệm mô phỏng

tài khoản phụ

Lưu ý ở đây là trên 4 thử nghiệm mô phỏng, các Chủ đề trông khác nhau mỗi lần, nhưng cấu hình phản hồi cho các từ về cơ bản trông giống nhau, phù hợp với giả định rằng chúng tôi đang sử dụng cùng một bộ Từ cho mọi thử nghiệm trong mô hình này.

Sự lựa chọn của chúng tôi về việc chúng tôi nghĩ Mô hình 1 (Đối tượng và Từ cả ngẫu nhiên) hay Mô hình 2 (Đối tượng ngẫu nhiên, Từ cố định) cung cấp lớp tham chiếu phù hợp cho kết quả thử nghiệm mà chúng tôi thực sự quan sát có thể tạo ra sự khác biệt lớn đối với đánh giá của chúng tôi về việc thao tác Điều kiện "đã làm việc." Chúng tôi mong đợi sự thay đổi cơ hội nhiều hơn trong dữ liệu trong Mô hình 1 so với Mô hình 2, vì có nhiều "bộ phận chuyển động" hơn. Vì vậy, nếu kết luận mà chúng tôi muốn đưa ra phù hợp hơn với các giả định của Mô hình 1, trong đó độ biến thiên cơ hội tương đối cao hơn, nhưng chúng tôi phân tích dữ liệu của chúng tôi theo các giả định của Mô hình 2, trong đó biến thiên cơ hội tương đối thấp hơn, thì lỗi Loại 1 của chúng tôi tỷ lệ để kiểm tra sự khác biệt Điều kiện sẽ được tăng lên ở một mức độ nào đó (có thể khá lớn). Để biết thêm thông tin, xem các tài liệu tham khảo dưới đây.

Tài liệu tham khảo

Baayen, rh, Davidson, DJ, & Bates, DM (2008). Mô hình hiệu ứng hỗn hợp với các hiệu ứng ngẫu nhiên chéo cho các đối tượng và vật phẩm. Tạp chí của bộ nhớ và ngôn ngữ, 59 (4), 390-412. PDF

Barr, DJ, Levy, R., Scheepers, C., & Tily, HJ (2013). Cấu trúc hiệu ứng ngẫu nhiên để kiểm tra giả thuyết xác nhận: Giữ cho nó tối đa. Tạp chí bộ nhớ và ngôn ngữ, 68 (3), 255-278. PDF

Clark, HH (1973). Ngụy biện ngôn ngữ như cố định: Một bài phê bình về thống kê ngôn ngữ trong nghiên cứu tâm lý học. Tạp chí học tập bằng lời nói và hành vi bằng lời nói, 12 (4), 335-359. PDF

Coleman, EB (1964). Tổng quát hóa cho một dân số ngôn ngữ. Báo cáo tâm lý, 14 (1), 219-226.

Judd, CM, Westfall, J., & Kenny, DA (2012). Xử lý các kích thích như một yếu tố ngẫu nhiên trong tâm lý học xã hội: một giải pháp mới và toàn diện cho một vấn đề phổ biến nhưng phần lớn bị bỏ qua. Tạp chí tính cách và tâm lý xã hội, 103 (1), 54. PDF

Murayama, K., Sakaki, M., Yan, VX, & Smith, GM (2014). Lạm phát lỗi loại I trong phân tích người tham gia truyền thống đến độ chính xác siêu hình: Một quan điểm mô hình hiệu ứng hỗn hợp tổng quát. Tạp chí Tâm lý học Thực nghiệm: Học tập, Trí nhớ và Nhận thức. PDF

Pinheiro, JC, & Bates, DM (2000). Các mô hình hiệu ứng hỗn hợp trong S và S-PLUS. Mùa xuân.

Raaijmakers, JG, Schrijnemakers, J., & Gremmen, F. (1999). Làm thế nào để đối phó với những lời ngụy biện về ngôn ngữ có hiệu lực cố định ngôn ngữ: Những quan niệm sai lầm phổ biến và giải pháp thay thế. Tạp chí bộ nhớ và ngôn ngữ, 41 (3), 416-426. PDF


1
+1 Đây là một câu trả lời tuyệt vời và bài báo năm 2012 của bạn rất hay.
amip nói rằng Phục hồi Monica

vì câu hỏi ban đầu đã được liên kết với một cuộc thảo luận tuyệt vời về vấn đề này - chính xác bạn đang đề cập đến điều gì?
James

1
Liên kết Gelman
Jake Westfall

@James Tôi đã đi trước và thêm một số công cụ khái niệm, bao gồm một số hình ảnh. Cho tôi biết bạn nghĩ gì.
Jake Westfall

Cảm ơn những hình ảnh. Theo đoạn cuối cùng của bạn, càng nhiều hiệu ứng trong mô hình được dán nhãn là ngẫu nhiên, giá trị p càng cao cho (các) hiệu ứng cố định còn lại. Tuy nhiên, đối với mô hình phụ gia, có vẻ như khi phương thức "ngăn chặn" mặc định được sử dụng trong PROC MIXED, thì giá trị p cho hiệu ứng cố định sẽ giống nhau. Một ví dụ cụ thể là trong câu hỏi này: stats.stackexchange.com/q/112640/54099 Làm thế nào bạn có thể giải thích điều đó?
James

1

Giả sử tôi có một quy trình sản xuất liên quan đến việc chế tạo vật liệu trên một số máy khác nhau. Chúng là những máy duy nhất tôi có "máy" là một hiệu ứng cố định. Nhưng tôi tạo ra rất nhiều tài liệu trên mỗi máy và tôi quan tâm đến việc dự đoán mọi thứ về các lô trong tương lai. Tôi sẽ biến "Số lô" thành một yếu tố ngẫu nhiên vì tôi quan tâm đến kết quả mà tôi sẽ nhận được cho cáctrong tương lai .


1
Emil thân mến: Tôi sợ bạn không hiểu những câu hỏi tôi đã hỏi. Ví dụ của bạn minh họa định nghĩa phổ biến nhất về "cố định so với ngẫu nhiên" mà bản thân tôi đã cung cấp trong câu hỏi của mình. Dù sao, bằng cách sử dụng ví dụ của bạn, bạn có thể cho tôi biết lý do tại sao nên rút ra suy luận về phản ứng trong tương lai từ một mô hình trong đó số lô là một yếu tố cố định không?
James

Nếu bạn coi "số lô" là cố định, suy luận của bạn sẽ chỉ áp dụng cho các lô mà bạn đã kiểm tra. Trong các tình huống khác, điều tương tự xảy ra. Nếu bạn muốn suy luận về các hiệu ứng ngẫu nhiên thì coi chúng là các hiệu ứng cố định thường sẽ đưa ra câu trả lời sai. Trong nhiều tình huống mô hình hỗn hợp, coi các hiệu ứng ngẫu nhiên là hiệu ứng cố định thậm chí sẽ đưa ra câu trả lời không chính xác về các hiệu ứng thực sự được cố định.
Emil Friedman

Đó không phải là vấn đề lộn ngược so với nhược điểm. Nếu một người phân tích không phù hợp, kết quả thường sẽ không chính xác.
Emil Friedman

Bạn có thể cung cấp một tài liệu tham khảo cho một nghiên cứu mô phỏng chứng minh làm thế nào kết quả trở nên không chính xác tùy thuộc vào nhãn cố định / ngẫu nhiên?
James

Cũng lưu ý rằng MLE không miễn phí, đặc biệt là khi có các thành phần phương sai. Cố gắng thiết lập một thiết kế giai thừa chéo với 3 yếu tố và một vài hiệp phương sai tiếp tục. Sau đó thử ước tính một mô hình cố định thuần túy và một vài thông số kỹ thuật hỗn hợp. Miễn là có một thành phần ngẫu nhiên gây ra sự chuyển đổi từ OLS sang MLE / REML, các vấn đề về hội tụ, nhận các thành phần phương sai bằng 0 hoặc âm hoặc các kết quả vô nghĩa khác có nhiều khả năng.
James

1

Vì vậy, bạn coi chúng là ngẫu nhiên để có hiệu ứng trung bình giữa trung bình tổng thể và trung bình cho yếu tố cụ thể đó dựa trên kích thước mẫu của yếu tố và tổng số quan sát. Điều này cho phép bạn nói rằng kết quả của bạn áp dụng cho dân số lớn, vì bạn có loại trung bình có trọng số và ước tính biến thể do yếu tố đó, nếu không, bạn thực sự chỉ có thể nói rằng kết quả của bạn áp dụng cho các mức yếu tố bạn đã sử dụng vì hồi quy sẽ coi chúng là các yếu tố riêng biệt và không phải là các yếu tố ngẫu nhiên có được tính trung bình có trọng số.

Chúng cũng hữu ích khi bạn có các biện pháp lặp lại trên cùng một chủ đề, vì bạn có thể sử dụng chúng để tính toán mối tương quan giữa các biện pháp trên cùng một chủ đề.


Đối với RM, đó là một trong những lý do tại sao tôi đặt câu hỏi ngay từ đầu. Như tôi đã đề cập ở đây: stats.stackexchange.com/q/112640/54099 Đối tượng điều trị là cố định hoặc ngẫu nhiên không thay đổi giá trị p Điều trị, vậy tại sao phải bận tâm.
James

Nếu bạn có một thiết kế chéo đơn giản với một yếu tố cố định và một yếu tố ngẫu nhiên và sử dụng Bình phương trung bình dự kiến, giá trị p cho yếu tố cố định sẽ khác với những gì bạn sẽ nhận được nếu bạn coi cả hai là cố định.
Emil Friedman

1

Ytôij= =β1Xtôij+β2Ztôi+etôi+μtôijXtôijZtôiβ2ZtôitôiZtôi

Ytôij= =β1Xtôij+etôi+μtôijZtôi

β1β1


(Câu trả lời gốc)

Một nơi mà về cơ bản bạn bắt buộc phải sử dụng các hiệu ứng ngẫu nhiên là khi bạn muốn bao gồm các tham số bất biến ở cấp độ nhóm của hiệu ứng cố định.

Ví dụ: giả sử bạn muốn điều tra tác động của các đặc điểm của bác sĩ (ví dụ: giáo dục) đến kết quả của bệnh nhân. Bộ dữ liệu ở cấp độ bệnh nhân với kết quả bệnh nhân được quan sát và đặc điểm của bệnh nhân / bác sĩ. Vì bệnh nhân được điều trị theo một bác sĩ duy nhất có khả năng tương quan, bạn muốn kiểm soát điều này. Bạn có thể chèn một hiệu ứng cố định bác sĩ ở đây nhưng khi làm như vậy, bạn loại trừ bao gồm bất kỳ đặc điểm nào của bác sĩ trong mô hình. Đó là vấn đề nếu sự quan tâm là đặc điểm cấp bác sĩ.


Bạn có thể cung cấp một số báo cáo mô hình?
James

0

Tôi nghĩ rằng nó liên quan đến tính nhất quán của các ước tính.

xtôij= =mộttôi+bj+emộttôi

bj

Neyman và Scott (1948) chỉ ra vấn đề về tính nhất quán của

mộttôibj

mộttôibj

thích hợp. Ít nhất, đó là cách tôi hiểu ...

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.