Đã sửa hiệu ứng so với hiệu ứng ngẫu nhiên khi tất cả các khả năng được đưa vào mô hình hiệu ứng hỗn hợp


15

Trong mô hình hiệu ứng hỗn hợp, khuyến nghị là sử dụng hiệu ứng cố định để ước tính một tham số nếu bao gồm tất cả các mức có thể (ví dụ: cả nam và nữ). Bạn cũng nên sử dụng hiệu ứng ngẫu nhiên để tính toán một biến nếu các mức bao gồm chỉ là một mẫu ngẫu nhiên từ dân số (bệnh nhân nhập viện từ vũ trụ của bệnh nhân có thể) và bạn muốn ước tính trung bình và phương sai dân số thay vì phương tiện của các cấp yếu tố cá nhân.

Tôi tự hỏi nếu bạn có nghĩa vụ phải luôn luôn sử dụng một hiệu ứng cố định theo cách này. Xem xét một nghiên cứu về cách thay đổi kích thước bàn chân / giày thông qua sự phát triển và có liên quan đến, nói, chiều cao, cân nặng và tuổi. Siderõ ràng phải được đưa vào mô hình bằng cách nào đó để giải thích cho thực tế rằng các phép đo qua các năm được lồng trong một chân nhất định và không độc lập. Hơn nữa, phải và trái là tất cả các khả năng có thể tồn tại. Ngoài ra, có thể rất đúng khi đối với một người tham gia nhất định, bàn chân phải của họ lớn hơn (hoặc nhỏ hơn) so với bên trái. Tuy nhiên, mặc dù kích thước bàn chân có phần khác nhau giữa hai bàn chân đối với tất cả mọi người, nhưng không có lý do gì để tin rằng bàn chân phải sẽ trung bình lớn hơn bàn chân trái. Nếu chúng nằm trong mẫu của bạn, điều này có lẽ là do một cái gì đó về di truyền của những người trong mẫu của bạn, chứ không phải là một cái gì đó nội tại đối với chân phải. Cuối cùng, có vẻ như là một tham số phiền toái, không phải là thứ bạn thực sự quan tâm. side

Hãy để tôi lưu ý rằng tôi đã làm ví dụ này lên. Nó có thể không tốt chút nào; nó chỉ là để có được ý tưởng trên. Đối với tất cả những gì tôi biết, có một bàn chân phải lớn và một bàn chân trái nhỏ là cần thiết để sống sót trong thời kỳ đồ đá.

Trong trường hợp như thế này, việc kết hợp trong mô hình như một hiệu ứng ngẫu nhiên có hợp lý không? Điều gì sẽ là ưu và nhược điểm của việc sử dụng hiệu ứng cố định so với ngẫu nhiên ở đây? side


Tại sao bạn muốn coi bên là một yếu tố ngẫu nhiên cho rằng có hai và chỉ hai cấp của yếu tố đó? Sự ngẫu nhiên đến từ đâu trong thiết lập vấn đề của bạn?
Aaron Zeng

@AaronZeng, đặt chất lượng ví dụ của tôi sang một bên, đó là câu hỏi của tôi. Có bao giờ có bất kỳ lý do để đại diện cho các cấp với hiệu ứng ngẫu nhiên nếu bạn có tất cả các cấp độ có thể. Điều gì xảy ra nếu yếu tố trong câu hỏi có> 2 cấp độ?
gung - Phục hồi Monica

1
@gung Tôi vừa quay lại chủ đề này - có câu trả lời nào giúp được không? Nếu không - những gì bạn quan tâm hơn để tìm hiểu? Có lẽ bạn có câu trả lời của riêng mình (nếu có, tôi rất muốn tìm hiểu thêm về vấn đề này!)?
Tim

2
Lâu lắm rồi tôi mới quay lại đây, @Tim. Tôi đánh giá cao cả hai câu trả lời (tôi đã nâng cao chúng), nhưng chúng không hoàn toàn là những gì tôi đang tìm kiếm (có lẽ do một câu hỏi không rõ ràng rõ ràng). Tôi đã nghĩ về việc biên soạn một câu trả lời từ một số thứ Ben Bolker đã đăng ở nhiều nơi, nhưng nó sẽ là một chút công việc & tôi chưa bao giờ thực sự hoàn thành nó. Nó vẫn là một cái gì đó tôi nên làm, mặc dù. Cảm ơn vì sự nũng nịu.
gung - Phục hồi Monica

Câu trả lời:


13

Vấn đề chung với các hiệu ứng "cố định" và "ngẫu nhiên" là chúng không được xác định theo một cách nhất quán. Andrew Gelman trích dẫn một vài trong số đó:

(1) Hiệu ứng cố định là không đổi giữa các cá nhân và hiệu ứng ngẫu nhiên khác nhau. Ví dụ, trong một nghiên cứu tăng trưởng, một mô hình với ngẫu nhiên chặn và độ dốc b cố định tương ứng với các đường song song cho các cá nhân i khác nhau , hoặc mô hình y i t = a i + b t . Do đó Kreft và De Leeuw (1998) phân biệt hệ số cố định và ngẫu nhiên.aibiyit=ai+bt

(2) Hiệu ứng được cố định nếu bản thân chúng thú vị hoặc ngẫu nhiên nếu có sự quan tâm đến dân số cơ bản. Searle, Casella và McCulloch (1992, Phần 1.4) khám phá sự khác biệt này theo chiều sâu.

(3) Triệu Khi một mẫu cạn kiệt dân số, biến tương ứng được cố định; khi mẫu là một phần nhỏ (nghĩa là không đáng kể) của quần thể thì biến tương ứng là ngẫu nhiên. ((Green và Tukey, 1960)

(4) Vang Nếu một hiệu ứng được coi là giá trị nhận ra của một biến ngẫu nhiên, thì nó được gọi là hiệu ứng ngẫu nhiên. Rằng (LaMotte, 1983)

(5) Các hiệu ứng cố định được ước tính bằng cách sử dụng bình phương tối thiểu (hay nói chung là khả năng tối đa) và các hiệu ứng ngẫu nhiên được ước tính với độ co ngót (dự đoán không thiên vị tuyến tính trong thuật ngữ của Robinson, 1991). Định nghĩa này là tiêu chuẩn trong tài liệu mô hình hóa đa cấp (xem, ví dụ, Snijder và Bosker, 1999, Mục 4.2) và trong kinh tế lượng.

và thông báo rằng chúng không nhất quán. Trong cuốn sách Phân tích dữ liệu bằng cách sử dụng mô hình hồi quy và đa cấp / phân cấp , ông thường tránh sử dụng các thuật ngữ đó và trong công việc của mình, ông tập trung vào cố định hoặc thay đổi giữa các nhóm chặn và dốc vì

Hiệu ứng cố định có thể được xem như là trường hợp đặc biệt của hiệu ứng ngẫu nhiên, trong đó phương sai cấp cao hơn (trong mô hình (1.1), đây sẽ là ) được thiết lập để 0 hoặc . Do đó, trong khuôn khổ của chúng tôi, tất cả các tham số hồi quy là ngẫu nhiên, Rằng và thuật ngữ đa cấp độ của Google là bao gồm tất cả.σα20

Điều này đặc biệt đúng với khung Bayes - thường được sử dụng cho các mô hình hỗn hợp - trong đó tất cả các hiệu ứng là ngẫu nhiên mỗi se. Nếu bạn đang nghĩ Bayes, bạn không thực sự quan tâm đến các hiệu ứng và ước tính điểm "cố định" và không có vấn đề gì với việc coi tất cả các hiệu ứng là ngẫu nhiên.

Càng đọc về chủ đề này, tôi càng tin rằng đây là một cuộc thảo luận về ý thức hệ về những gì chúng ta có thể (hoặc nên) ước tính và những gì chúng ta chỉ có thể dự đoán (ở đây tôi cũng có thể đề cập đến câu trả lời của riêng bạn ). Bạn sử dụng các hiệu ứng ngẫu nhiên nếu bạn có một mẫu ngẫu nhiên về các kết quả có thể xảy ra, do đó bạn không quan tâm đến các ước tính riêng lẻ và bạn quan tâm hơn đến các hiệu ứng dân số, sau đó là các cá nhân. Vì vậy, câu trả lời cho câu hỏi của bạn cũng phụ thuộc vào những gì bạn nghĩ về nếu bạn muốn hoặc có thể ước tính các hiệu ứng cố định cho dữ liệu của bạn. Nếu tất cả các mức có thể được bao gồm trong dữ liệu của bạn, bạn có thểước tính các hiệu ứng cố định - cũng như trong ví dụ của bạn, số lượng cấp độ có thể nhỏ và điều đó thường không tốt cho việc ước tính các hiệu ứng ngẫu nhiên và có một số yêu cầu tối thiểu cho việc này .

Đối số kịch bản trường hợp tốt nhất

Giả sử bạn có số lượng dữ liệu không giới hạn và sức mạnh tính toán không giới hạn. Trong trường hợp này, bạn có thể tưởng tượng việc ước tính mọi hiệu ứng là cố định, vì các hiệu ứng cố định giúp bạn linh hoạt hơn (cho phép chúng tôi so sánh các hiệu ứng riêng lẻ). Tuy nhiên, ngay cả trong trường hợp này, hầu hết chúng ta sẽ miễn cưỡng sử dụng các hiệu ứng cố định cho mọi thứ.

Ví dụ, hãy tưởng tượng rằng bạn muốn mô hình hóa kết quả thi của các trường ở một số khu vực và bạn có dữ liệu về tất cả 100 trường trong khu vực. Trong trường hợp này, bạn có thể đe dọa các trường là cố định - vì bạn có dữ liệu ở tất cả các cấp độ - nhưng trong thực tế, bạn có thể nghĩ rằng chúng là ngẫu nhiên. Tại sao vậy?

  1. Một lý do là nói chung trong các trường hợp này, bạn không quan tâm đến tác động của từng trường (và thật khó để so sánh tất cả chúng), mà là một sự thay đổi chung giữa các trường.

  2. Một đối số khác ở đây là mô hình phân tích. Nói chung, bạn không quan tâm đến mô hình "mọi ảnh hưởng có thể có", do đó, trong mô hình của bạn, bạn bao gồm một số hiệu ứng cố định mà bạn muốn kiểm tra và kiểm soát đối với các nguồn biến đổi có thể khác. Điều này làm cho các mô hình hiệu ứng hỗn hợp phù hợp với cách suy nghĩ chung về mô hình thống kê nơi bạn ước tính một cái gì đó và kiểm soát những thứ khác. Với dữ liệu phức tạp (đa cấp hoặc phân cấp), bạn có nhiều hiệu ứng để đưa vào, do đó, bạn đe dọa một số là "cố định" và một số là "ngẫu nhiên" để kiểm soát chúng.

  3. Trong kịch bản này, bạn cũng sẽ không nghĩ về các trường vì mỗi trường đều có ảnh hưởng riêng, duy nhất đến kết quả, mà là về các trường có một số ảnh hưởng nói chung. Vì vậy, lập luận này sẽ là chúng tôi tin rằng thực sự không thể ước tính được các tác động duy nhất của từng trường và vì vậy chúng tôi đe dọa chúng là mẫu ngẫu nhiên của các hiệu ứng trường học có thể.

Các mô hình hiệu ứng hỗn hợp nằm ở đâu đó giữa các kịch bản "mọi thứ cố định" và "mọi thứ ngẫu nhiên". Dữ liệu chúng tôi gặp phải khiến chúng tôi hạ thấp kỳ vọng về ước tính mọi thứ là hiệu ứng cố định, vì vậy chúng tôi quyết định hiệu ứng nào chúng tôi muốn so sánh và hiệu ứng nào chúng tôi muốn kiểm soát hoặc có cảm nhận chung về ảnh hưởng của chúng. Nó không chỉ là về dữ liệu là gì, mà còn là cách chúng ta nghĩ về dữ liệu trong khi mô hình hóa nó.


Rất nhiều điểm tốt ở đây, @Tim. Tôi đang tự hỏi những gì bạn làm là ví dụ của gung trong OP; đã có một cuộc thảo luận dài trong các bình luận dưới câu trả lời của tôi nhưng tôi nghĩ đến giờ nó cuối cùng cũng được giải quyết ít nhiều. Sẽ là tốt để biết nếu bạn đồng ý hoặc có thể không đồng ý với những gì tôi đã viết.
amip nói rằng Phục hồi lại

@amoeba đó là một câu trả lời thú vị (tôi đã + 1'd) và tôi đồng ý với quan điểm của bạn. Tôi nghĩ rằng về cơ bản gung là đúng (giống như Gelman - người luôn luôn đúng :)) rằng không có câu trả lời duy nhất. Có một tài liệu khổng lồ và nhiều cách để sử dụng các mô hình hiệu ứng hỗn hợp và không có sự phân biệt rõ ràng. Hơn nữa, có những người theo mặc định luôn sử dụng các hiệu ứng cố định cho mọi thứ và có những người sử dụng các hiệu ứng ngẫu nhiên bất cứ khi nào họ có thể, ngay cả trong trường hợp chúng ta thường coi là hiệu ứng cố định ... Nó cũng phụ thuộc vào chính xác những gì bạn muốn mô hình.
Tim

13

Tóm tắt

Người ta thường nói rằng nếu tất cả các mức yếu tố có thể được đưa vào một mô hình hỗn hợp, thì yếu tố này nên được coi là một hiệu ứng cố định. Điều này không nhất thiết đúng với HAI LÝ DO DISTINCT:

(1) Nếu số lượng cấp độ lớn, thì có thể coi yếu tố [vượt qua] là ngẫu nhiên.

Tôi đồng ý với cả @Tim và @RobertLong ở đây: nếu một yếu tố có số lượng lớn các cấp độ được bao gồm trong mô hình (ví dụ như tất cả các quốc gia trên thế giới; hoặc tất cả các trường học trong một quốc gia; hoặc có thể là toàn bộ dân số của các đối tượng được khảo sát, v.v.), sau đó không có gì sai khi coi nó là ngẫu nhiên --- điều này có thể khó hiểu hơn, có thể cung cấp một số co rút, v.v.

lmer(size ~ age + subjectID)                     # fixed effect
lmer(size ~ age + (1|subjectID))                 # random effect

(2) Nếu yếu tố được lồng trong một hiệu ứng ngẫu nhiên khác, thì nó phải được coi là ngẫu nhiên, không phụ thuộc vào số cấp của nó.

Có một sự nhầm lẫn lớn trong chủ đề này (xem bình luận) bởi vì các câu trả lời khác là về trường hợp # 1 ở trên, nhưng ví dụ bạn đưa ra là một ví dụ về một tình huống khác , cụ thể là trường hợp # 2 này. Ở đây chỉ có hai cấp độ (tức là hoàn toàn không phải là "một số lượng lớn"!) Và chúng làm cạn kiệt tất cả các khả năng, nhưng chúng được lồng trong một hiệu ứng ngẫu nhiên khác , mang lại hiệu ứng ngẫu nhiên lồng nhau.

lmer(size ~ age + (1|subject) + (1|subject:side)  # side HAS to be random

Thảo luận chi tiết về ví dụ của bạn

Các mặt và đối tượng trong thí nghiệm tưởng tượng của bạn có liên quan như các lớp học và trường học trong ví dụ mô hình phân cấp tiêu chuẩn. Có lẽ mỗi trường (# 1, # 2, # 3, v.v.) có lớp A và lớp B, và hai lớp này được cho là gần giống nhau. Bạn sẽ không mô hình hóa các lớp A và B như một hiệu ứng cố định với hai cấp độ; đây sẽ là một sai lầm Nhưng bạn sẽ không mô hình hóa các lớp A và B dưới dạng hiệu ứng ngẫu nhiên "riêng biệt" (nghĩa là giao nhau) với hai cấp độ; đây cũng là một sai lầm Thay vào đó, bạn sẽ mô hình hóa các lớp học như một hiệu ứng ngẫu nhiên lồng nhau trong các trường học.

Xem ở đây: Hiệu ứng ngẫu nhiên giao nhau và lồng nhau: chúng khác nhau như thế nào và chúng được chỉ định chính xác trong lme4 như thế nào?

i=1nj=1,2

Sizeijk=μ+αHeightijk+βWeightijk+γAgeijk+ϵi+ϵij+ϵijk
ϵiN(0,σsubjects2),Random intercept for each subject
ϵijN(0,σsubject-side2),Random int. for side nested in subject
ϵijkN(0,σnoise2),Error term

Như bạn đã tự viết, "không có lý do gì để tin rằng chân phải sẽ trung bình lớn hơn chân trái". Vì vậy, không nên có hiệu ứng "toàn cầu" (không cố định hay ngẫu nhiên bắt chéo) của chân phải hoặc chân trái; thay vào đó, mỗi đối tượng có thể được nghĩ là có chân "một" và "chân khác" và sự biến đổi này chúng ta nên đưa vào mô hình. Các chân "một" và "khác" này được lồng trong các đối tượng, do đó các hiệu ứng ngẫu nhiên lồng nhau.

Thêm chi tiết để đáp ứng với các ý kiến. [Ngày 26 tháng 9]

Mô hình của tôi ở trên bao gồm Side là hiệu ứng ngẫu nhiên lồng nhau trong Đối tượng. Đây là một mô hình thay thế, được đề xuất bởi @Robert, trong đó Side là hiệu ứng cố định:

Sizeijk=μ+αHeightijk+βWeightijk+γAgeijk+δSidej+ϵi+ϵijk

ij

Nó không thể.

Điều tương tự cũng đúng với mô hình giả thuyết của @ gung với Side là hiệu ứng ngẫu nhiên chéo:

Sizeijk=μ+αHeightijk+βWeightijk+γAgeijk+ϵi+ϵj+ϵijk

Nó không tính đến các phụ thuộc là tốt.

Trình diễn thông qua một mô phỏng [2 tháng 10]

Đây là một cuộc biểu tình trực tiếp trong R.

Tôi tạo ra một bộ dữ liệu đồ chơi với năm đối tượng được đo trên cả hai chân trong năm năm liên tiếp. Ảnh hưởng của tuổi tác là tuyến tính. Mỗi đối tượng có một đánh chặn ngẫu nhiên. Và mỗi đối tượng có một bàn chân (bên trái hoặc bên phải) lớn hơn một bàn chân khác.

set.seed(17)

demo = data.frame(expand.grid(age = 1:5,
                              side=c("Left", "Right"),
                              subject=c("Subject A", "Subject B", "Subject C", "Subject D", "Subject E")))
demo$size = 10 + demo$age + rnorm(nrow(demo))/3

for (s in unique(demo$subject)){
  # adding a random intercept for each subject 
  demo[demo$subject==s,]$size = demo[demo$subject==s,]$size + rnorm(1)*10

  # making the two feet of each subject different     
  for (l in unique(demo$side)){
    demo[demo$subject==s & demo$side==l,]$size = demo[demo$subject==s & demo$side==l,]$size + rnorm(1)*7
  }
}

plot(1:50, demo$size)

Xin lỗi cho kỹ năng R khủng khiếp của tôi. Đây là cách dữ liệu trông như thế nào (mỗi năm chấm liên tiếp là một chân của một người được đo trong nhiều năm; mỗi mười chấm liên tiếp là hai chân của cùng một người):

nhập mô tả hình ảnh ở đây

Bây giờ chúng ta có thể phù hợp với một loạt các mô hình:

require(lme4)
summary(lmer(size ~ age + side + (1|subject), demo))
summary(lmer(size ~ age + (1|side) + (1|subject), demo))
summary(lmer(size ~ age + (1|subject/side), demo))

Tất cả các mô hình bao gồm một hiệu ứng cố định agevà một hiệu ứng ngẫu nhiên subject, nhưng đối xử sidekhác nhau.

  1. sideaget=1.8

  2. sideaget=1.4

  3. sideaget=37

Điều này rõ ràng cho thấy rằng sidenên được coi là một hiệu ứng ngẫu nhiên lồng nhau.

Cuối cùng, trong các ý kiến ​​@Robert đề xuất bao gồm hiệu ứng toàn cầu sidenhư là một biến kiểm soát. Chúng ta có thể làm điều đó, trong khi vẫn giữ hiệu ứng ngẫu nhiên lồng nhau:

summary(lmer(size ~ age + side + (1|subject/side), demo))
summary(lmer(size ~ age + (1|side) + (1|subject/side), demo))

sidet= =0,5side


2
Tôi thực sự không nghĩ rằng, trong ví dụ này, sideđáp ứng bất kỳ định nghĩa / hướng dẫn thông thường nào về thời điểm một yếu tố nên được coi là ngẫu nhiên so với cố định. Cụ thể, làm cho các suy luận vượt quá mức lấy mẫu của yếu tố là vô nghĩa. Hơn nữa, chỉ với 2 cấp độ của yếu tố, coi nó là cố định dường như là một cách không tôn giáo và đơn giản để tiếp cận mô hình.
Robert Long

Robert, cảm ơn đã trả lời. Hoặc là tôi hoàn toàn bối rối hoặc tôi không thể giải thích chính xác những gì tôi muốn nói. Xử lý sidenhư một hiệu ứng cố định có nghĩa là giả sử rằng một trong hai bên (ví dụ Phải) luôn lớn hơn bên còn lại (Trái), bằng một số tiền nhất định. Số tiền này là như nhau cho tất cả mọi người. Đây rõ ràng không phải là những gì OP có trong tâm trí. Ông viết rằng ở một số người, Quyền có thể lớn hơn và ở một số người khác. Tuy nhiên, chúng ta cần tính đến sidevì các lỗi tương quan. Tại sao chúng ta không thể coi là một hiệu ứng ngẫu nhiên lồng nhau sau đó? Nó chính xác như các lớp học trong trường học.
amip nói rằng Phục hồi lại

Tôi không biết rằng nó nhất thiết phải ngụ ý điều đó. Điều nó nói là, trong mẫu này , có thể có sự khác biệt có hệ thống giữa các bên (có thể có hoặc không có thể là một tạo tác do biến thể lấy mẫu). Tôi thích nghĩ về việc bao gồm nó như một hiệu ứng cố định như "kiểm soát" sự không độc lập và không có gì hơn - giống như cách chúng ta sẽ thêm một kẻ gây nhiễu vào một mô hình và thậm chí không mơ ước diễn giải hệ số của nó.
Robert Long

2
Tôi đang nâng cao câu trả lời của bạn sau khi phản ánh thêm. Bạn nêu lên một số điểm thực sự thú vị. Tôi không có thời gian để nghiên cứu sâu về toán học này. Tôi muốn tìm một bộ dữ liệu đồ chơi để chơi cùng nếu có thể (nếu bạn biết về một thứ, xin vui lòng cho tôi biết)
Robert Long

2
+1, về sự phản ánh hơn nữa, bạn dường như đúng về đặc thù của nghiên cứu này. Có phải điểm lớn hơn là không có một câu trả lời duy nhất cho hiệu ứng cố định và ngẫu nhiên khi bao gồm tất cả các khả năng, và mỗi trường hợp phải được đánh giá riêng lẻ, tôi tự hỏi?
gung - Phục hồi Monica

7

Để thêm vào các câu trả lời khác:

Tôi không nghĩ rằng bạn có nghĩa vụ phải luôn luôn sử dụng hiệu ứng cố định theo cách được mô tả trong OP. Ngay cả khi các định nghĩa / hướng dẫn thông thường về thời điểm coi một yếu tố là ngẫu nhiên không được đáp ứng, tôi vẫn có xu hướng vẫn mô hình hóa nó là ngẫu nhiên khi có một số lượng lớn các cấp độ, do đó, việc xử lý yếu tố này là cố định sẽ tiêu tốn nhiều mức độ tự do và kết quả là một mô hình cồng kềnh và ít rắc rối hơn.


Đây có vẻ là một điểm hợp lý, và tôi đánh giá cao rằng bạn không bị làm mờ bởi ví dụ của tôi. Tôi tập hợp từ điều này, và nhận xét của bạn cho câu trả lời của @ amoeba, rằng "khi có một số lượng lớn các cấp độ" (so với "chỉ có 2 cấp độ của yếu tố") dường như là chìa khóa.
gung - Phục hồi Monica

1
+1 vì tôi đồng ý với điểm này, bit nó khiến tôi phát điên vì tôi không giải thích được quan điểm của mình và cả bạn và @gung đều không hiểu ý tôi. Điều trịside hoặc là cố định hoặc như là một hiệu ứng ngẫu nhiên vượt qua nhất thiết có nghĩa là giả định rằng một trong hai bên (ví dụ phải) luôn lớn hơn khác (Trái), cho mọi đối tượng. Đây rõ ràng không phải là những gì gung đã viết trong OP của mình, nói rằng "không có lý do gì để tin rằng chân phải sẽ trung bình lớn hơn chân trái". Tôi vẫn thấy ví dụ của gung là một trường hợp rõ ràng cho hiệu ứng ngẫu nhiên lồng nhau, tương tự hoàn toàn với các lớp học trong trường học.
amip nói rằng Phục hồi lại

@amoeba điểm thú vị nhưng tôi không đồng ý. Tôi sẽ bình luận trong các bình luận cho câu trả lời của bạn ...
Robert Long

4

Nếu bạn đang nói về tình huống mà bạn biết tất cả các mức độ có thể có của một yếu tố quan tâm và cũng có dữ liệu để ước tính các hiệu ứng, thì chắc chắn bạn không cần phải biểu thị các mức với các hiệu ứng ngẫu nhiên.

Lý do mà bạn muốn đặt hiệu ứng ngẫu nhiên cho một yếu tố là vì bạn muốn suy luận về tác động của tất cả các cấp độ của yếu tố đó, thường không được biết đến. Để thực hiện kiểu suy luận đó, bạn áp đặt giả định rằng các tác động của tất cả các cấp tạo thành một phân phối bình thường nói chung. Nhưng với thiết lập vấn đề của bạn, bạn có thể ước tính tác động của tất cả các cấp. Sau đó, chắc chắn không cần thiết lập hiệu ứng ngẫu nhiên và áp đặt giả định bổ sung.

Giống như tình huống bạn có thể nhận được tất cả các giá trị của dân số (do đó bạn biết ý nghĩa thực sự), nhưng bạn đang cố lấy một mẫu lớn từ dân số và sử dụng định lý giới hạn trung tâm để xấp xỉ phân phối lấy mẫu, và sau đó suy luận về ý nghĩa thực sự.


2
Một nhận xét: đôi khi bạn có tất cả các cấp nhưng vẫn sử dụng hiệu ứng ngẫu nhiên cho chúng. Ví dụ: bạn tiến hành nghiên cứu toàn quốc về giáo dục và có dữ liệu về tất cả các trường, nhưng bạn vẫn sẽ sử dụng hiệu ứng ngẫu nhiên cho các trường thay vì sử dụng các hình nộm cho mỗi trường.
Tim
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.