Sự khác biệt toán học giữa hiệu ứng ngẫu nhiên và cố định là gì?


26

Tôi đã tìm thấy rất nhiều trên internet về việc giải thích các hiệu ứng ngẫu nhiên và cố định. Tuy nhiên tôi không thể lấy nguồn ghim xuống như sau:

Sự khác biệt toán học giữa hiệu ứng ngẫu nhiên và cố định là gì?

Điều đó có nghĩa là công thức toán học của mô hình và cách các tham số được ước tính.


1
Vâng, hiệu ứng cố định ảnh hưởng đến giá trị trung bình của phân phối chung và hiệu ứng ngẫu nhiên ảnh hưởng đến phương sai và cấu trúc liên kết. Chính xác ý bạn là gì bởi "sự khác biệt toán học"? Bạn đang hỏi làm thế nào khả năng thay đổi? Bạn có thể cụ thể hơn không?
Macro



1
Câu hỏi dường như không phân biệt được nền tảng mà nó đang được rút ra. Thuật ngữ này trong Bảng điều khiển Kinh tế dữ liệu khác với thuật ngữ trong các ngành khoa học xã hội khác sử dụng Mô hình đa cấp. Câu hỏi yêu cầu làm rõ thêm. Khác, điều này là sai lệch cho những người đến đây từ một trong hai nền tảng không biết rằng có một định nghĩa thay thế trong một lĩnh vực liên quan.
luchonacho

Câu trả lời:


20

Mô hình đơn giản nhất với các hiệu ứng ngẫu nhiên là một chiều ANOVA mô hình với các hiệu ứng ngẫu nhiên, do những quan sát với giả định phân phối: ( y i j | μ i ) ~ IID N ( μ i , σ 2 w ) ,yij

(yijμi)iidN(μi,σw2),j=1,,J,μiiidN(μ,σb2),i=1,,I.

Ở đây các hiệu ứng ngẫu nhiên là . Chúng là các biến ngẫu nhiên, trong khi chúng là các số cố định trong mô hình ANOVA với các hiệu ứng cố định.μi

Ví dụ, mỗi ba kỹ thuật viên trong phòng thí nghiệm ghi lại một loạt các phép đo và y i j là phép đo thứ j của kỹ thuật viên i . Gọi μ i là "giá trị trung bình thực" của chuỗi được tạo bởi kỹ thuật viên i ; Đây là một tham số nhân tạo, bạn có thể thấy μ i là giá trị trung bình mà kỹ thuật viên tôi sẽ có được nếu anh ấy / cô ấy đã ghi lại một loạt các phép đo khổng lồ.i=1,2,3yijjiμiiμii

Nếu bạn đang quan tâm trong việc đánh giá , μ 2 , L 3 (ví dụ để đánh giá thiên vị giữa các nhà khai thác), sau đó bạn phải sử dụng mô hình ANOVA với các hiệu ứng cố định.μ1μ2μ3

Bạn phải sử dụng mô hình ANOVA với các hiệu ứng ngẫu nhiên khi bạn đang quan tâm đến các phương sai σ 2 b xác định mô hình, và tổng phương sai σ 2 b + σ 2 w (xem dưới đây). Phương sai σ 2 w là phương sai của các bản ghi được tạo bởi một kỹ thuật viên (nó được coi là giống nhau cho tất cả các kỹ thuật viên) và σ 2 b được gọi là phương sai giữa các kỹ thuật viên. Có lẽ lý tưởng, các kỹ thuật viên nên được chọn ngẫu nhiên.σw2σb2 σb2+σw2σw2σb2

Mô hình này phản ánh sự phân rã của công thức phương sai cho một mẫu dữ liệu: nhập mô tả hình ảnh ở đây

Tổng phương sai = phương sai của phương tiện phương tiện của phương sai+

được phản ánh bởi mô hình ANOVA với các hiệu ứng ngẫu nhiên: nhập mô tả hình ảnh ở đây

Thật vậy, sự phân bố của được xác định bởi phân phối có điều kiện của nó ( y i j ) cho μ i và sự phân bố của μ i . Nếu một tính toán "vô điều kiện" phân phối của y i j sau đó chúng ta thấy y i j ~ N ( μ , σ 2 b + σ 2 w ) .yij(yij)μiμiyijyijN(μ,σb2+σw2)

Xem slide 24 và slide 25 tại đây để có hình ảnh đẹp hơn (bạn phải lưu tệp pdf để đánh giá cao các lớp phủ, đừng xem phiên bản trực tuyến).


1
(+1) Những con số rất đẹp!
amip nói Phục hồi lại

1
Cảm ơn bạn @amoeba, mã của tôi cho những khoảnh khắc quán tính đã có sẵn trên blog của tôi: stla.github.io/stlapblog/posts/Variance_inertia.html
Stéphane Laurent

μσ

σ

σσμtôiσb2μtôiσw2

16

Về cơ bản, điều tôi nghĩ là sự khác biệt rõ rệt nhất nếu bạn mô hình hóa một yếu tố là ngẫu nhiên, là các hiệu ứng được giả định là được rút ra từ một phân phối bình thường.

Ví dụ: nếu bạn có một số mô hình liên quan đến điểm số và bạn muốn tính đến dữ liệu học sinh của mình đến từ các trường khác nhau và bạn mô hình trường là một yếu tố ngẫu nhiên, điều này có nghĩa là bạn cho rằng trung bình theo trường thường được phân phối. Điều đó có nghĩa là hai nguồn biến thể là mô hình hóa: sự biến động trong trường của các lớp học sinh và sự biến đổi giữa các trường.

Điều này dẫn đến một cái gì đó gọi là gộp một phần . Hãy xem xét hai thái cực:

  1. Trường học không có bất kỳ ảnh hưởng nào (giữa biến thiên của trường là bằng 0). Trong trường hợp này, một mô hình tuyến tính không tính đến trường học sẽ là tối ưu.
  2. Biến thiên của trường lớn hơn biến thiên của sinh viên. Sau đó, về cơ bản bạn cần phải làm việc ở cấp trường thay vì cấp độ sinh viên (ít mẫu #). Về cơ bản, đây là mô hình mà bạn tính đến trường bằng các hiệu ứng cố định. Điều này có thể có vấn đề nếu bạn có một vài mẫu cho mỗi trường.

Bằng cách ước tính độ biến thiên ở cả hai cấp, mô hình hỗn hợp tạo ra sự thỏa hiệp thông minh giữa hai phương pháp này. Đặc biệt, nếu bạn có số lượng #students mỗi trường không quá lớn, điều này có nghĩa là bạn sẽ bị thu hẹp các hiệu ứng cho từng trường theo ước tính của mô hình 2 đối với trung bình chung của mô hình 1.

Đó là bởi vì các mô hình nói rằng nếu bạn có một trường có hai học sinh tốt hơn so với mức "bình thường" đối với dân số của trường thì có khả năng một phần của hiệu ứng này được giải thích bởi trường đã may mắn được lựa chọn của hai học sinh nhìn vào. Nó không làm điều này một cách mù quáng, nó làm như vậy tùy thuộc vào ước tính của sự thay đổi trong trường học. Điều này cũng có nghĩa là các mức hiệu ứng với ít mẫu được kéo mạnh hơn về phía trung bình so với các trường lớn.

Điều quan trọng là bạn cần khả năng trao đổi trên các cấp độ của yếu tố ngẫu nhiên. Điều đó có nghĩa là trong trường hợp này, các trường (từ kiến ​​thức của bạn) có thể trao đổi và bạn không biết điều gì làm cho chúng khác biệt (ngoài một số loại ID). Nếu bạn có thêm thông tin, bạn có thể đưa thông tin này vào làm yếu tố bổ sung, điều đó đủ để các trường có thể trao đổi điều kiện trên các thông tin khác được hạch toán.

Ví dụ, sẽ hợp lý khi cho rằng những người trưởng thành 30 tuổi sống ở New York có thể trao đổi điều kiện về giới tính. Nếu bạn có thêm thông tin (tuổi, dân tộc, giáo dục), sẽ rất hợp lý nếu bao gồm thông tin đó.

OTH nếu bạn đã nghiên cứu với một nhóm đối chứng và ba nhóm bệnh khác nhau thì sẽ không có ý nghĩa đối với nhóm mô hình là ngẫu nhiên vì bệnh cụ thể không thể trao đổi. Tuy nhiên, nhiều người thích hiệu ứng co rút tốt đến mức họ vẫn sẽ tranh luận về một mô hình hiệu ứng ngẫu nhiên nhưng đó là một câu chuyện khác.

Tôi nhận thấy tôi đã không học quá nhiều vào toán học, nhưng về cơ bản, sự khác biệt là mô hình hiệu ứng ngẫu nhiên ước tính một lỗi phân phối bình thường cả về cấp độ trường học và cấp độ học sinh trong khi mô hình hiệu ứng cố định chỉ có lỗi trình độ học sinh Đặc biệt, điều này có nghĩa là mỗi trường có cấp độ riêng không được kết nối với các cấp khác bằng một phân phối chung. Điều này cũng có nghĩa là mô hình cố định không cho phép ngoại suy cho một học sinh trong trường không được bao gồm trong dữ liệu gốc trong khi mô hình hiệu ứng ngẫu nhiên làm như vậy, với một biến thiên là tổng của cấp độ học sinh và biến thiên cấp trường. Nếu bạn đặc biệt quan tâm đến khả năng chúng tôi có thể làm việc đó.


1
(+1) Một câu trả lời tuyệt vời, được bình chọn một cách đáng ngạc nhiên. Tôi nhận thấy một lỗi đánh máy khó hiểu: "loại trừ" nên đọc "bao gồm". Ngoài ra: điều gì sẽ là một sự khác biệt thực tế được mong đợi giữa việc coi trường học là hiệu quả ngẫu nhiên và cố định? Tôi hiểu rằng việc đối xử như cố định sẽ không cho phép dự đoán thành tích của học sinh từ một trường mới, nhưng còn sự khác biệt về dữ liệu có sẵn thì sao? Giả sử các hiệu ứng cố định khác là giới tính, chủng tộc và cân nặng của học sinh (bất cứ điều gì). Liệu đối xử với trường học là ngẫu nhiên / cố định có ảnh hưởng đến sức mạnh của các tác động chính hoặc tương tác lợi ích? Còn sự khác biệt nào khác không?
amip nói phục hồi Monica

3
Nếu . Clark và Linzer 2012 có mô phỏng kết quả.
liên hợp chiến binh

1
@conjugatep Warrior Wow, cảm ơn rất nhiều vì bình luận này! Tôi đọc bài báo được liên kết và đó là lời giải thích rõ ràng nhất về vấn đề mà tôi đã thấy. Tôi đã dành một lượng thời gian đáng kể để đọc các chủ đề khác nhau ở đây trên CV về các hiệu ứng cố định / ngẫu nhiên, nhưng không thể biết khi nào nên sử dụng cái này hơn cái khác và tại sao. Đọc C & L làm cho tôi rất nhiều điều rõ ràng hơn nhiều. Bạn có thể muốn viết một câu trả lời ở đâu đó trên CV trình bày tóm tắt về điều này và / hoặc các giấy tờ liên quan? Tôi đang chạy một tiền thưởng cho chủ đề [mô hình hỗn hợp] được bình chọn nhiều nhất và sẽ rất vui khi trao cho bạn một giải thưởng khác ở đó.
amip nói rằng Phục hồi lại

@Erik, tôi đã chỉnh sửa để sửa "học một phần" thành "gộp một phần". Tôi nghĩ đó là một lỗi đánh máy nhưng xin lỗi nếu đó là một ý định chơi chữ!
amip nói rằng Phục hồi lại

2

Trong vùng đất econ, các hiệu ứng như vậy là các chặn (hoặc hằng số) riêng biệt không quan sát được, nhưng có thể được ước tính bằng cách sử dụng dữ liệu bảng (quan sát lặp đi lặp lại trên cùng một đơn vị theo thời gian). Phương pháp ước tính hiệu ứng cố định cho phép tương quan giữa các lần chặn cụ thể của đơn vị và các biến giải thích độc lập. Các hiệu ứng ngẫu nhiên không. Chi phí sử dụng các hiệu ứng cố định linh hoạt hơn là bạn không thể ước tính hệ số trên các biến số bất biến theo thời gian (như giới tính, tôn giáo hoặc chủng tộc).

NB Các lĩnh vực khác có thuật ngữ riêng, có thể khá khó hiểu.


(-1) điều này không nói gì về sự khác biệt toán học giữa các hiệu ứng cố định và ngẫu nhiên
Macro

1
@Macro Đồng ý. Trước khi điều đó xuất hiện, sẽ rất hữu ích nếu bạn biết liệu thuật ngữ econ có phải là thứ mà OP đang tìm kiếm hay không. Tôi nên đã rõ ràng hơn về điều đó.
Dimitriy V. Masterov

ĐƯỢC. Trong trường hợp đó, điều này có thể phù hợp hơn như là một nhận xét, bạn sẽ không nói?
Macro

Câu lệnh "Chi phí sử dụng các hiệu ứng cố định linh hoạt hơn là bạn không thể ước tính hệ số trên các biến không thay đổi theo thời gian" chỉ là không đúng. Tôi vừa thực hiện một mô phỏng trong đó bạn đã lặp lại các phép đo trên các cá nhân và một công cụ dự đoán nhị phân duy nhất không thay đổi theo thời gian. Nếu bạn bao gồm một hiệu ứng cố định cho ID và một cho dự đoán nhị phân, bạn chắc chắn có thể ước tính hệ số trên công cụ dự đoán nhị phân (mặc dù, tôi sẽ thừa nhận, nếu bạn không có nhiều phép đo lặp lại, ước tính sẽ có lỗi tiêu chuẩn lớn).
Macro

3
Andrew Gelman (người không phải là nhà kinh tế), liệt kê 5 định nghĩa riêng biệt trong bài báo ANOVA của mình: stat.columbia.edu/~gelman/research/published/banova7.pdf .
Dimitriy V. Masterov

2

Trong gói phần mềm tiêu chuẩn (ví dụ: R lmer), sự khác biệt cơ bản là:

  • hiệu ứng cố định được ước tính theo khả năng tối đa (bình phương tối thiểu cho mô hình tuyến tính)
  • hiệu ứng ngẫu nhiên được ước tính bằng Bayes theo kinh nghiệm (bình phương nhỏ nhất với một số hao hụt cho mô hình tuyến tính, trong đó tham số co rút được chọn theo khả năng tối đa)

Nếu bạn là Bayes (ví dụ WinBUGS), thì không có sự khác biệt thực sự.


3
Tôi hoàn toàn không đồng ý về việc không có sự khác biệt. Bạn có thể phù hợp với một mô hình hiệu ứng cố định bayes với tất cả các hệ số có các linh mục riêng biệt hoặc một mô hình hỗn hợp bayesian nơi có các siêu đường kính.
Erik

Nếu bạn là Bayes, sự khác biệt trông như thế này .
liên hợp chiến binh

@Simon nó là một câu trả lời chính xác và giòn. Tôi nên đề cập đến nó lâu trở lại.
Subhash C. Davar

-3

@Joke Một mô hình hiệu ứng cố định ngụ ý rằng kích thước hiệu ứng được tạo ra bởi một nghiên cứu (hoặc thử nghiệm) là cố định, tức là các phép đo lặp lại cho một can thiệp tạo ra cùng kích thước hiệu ứng. Có thể, các điều kiện bên ngoài và bên trong của thử nghiệm không thay đổi. Nếu bạn có một số thử nghiệm và hoặc nghiên cứu theo các quy tắc khác nhau, bạn sẽ có các kích cỡ hiệu ứng khác nhau. Các ước tính tham số về giá trị trung bình và phương sai cho một tập hợp các kích thước hiệu ứng có thể được nhận ra bằng cách giả định rằng đây là các hiệu ứng cố định hoặc đây là các hiệu ứng ngẫu nhiên (được nhận ra từ một siêu dân số). Tôi nghĩ rằng đó là vấn đề có thể được giải quyết với sự trợ giúp của thống kê toán học.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.