Hiệu ứng ngẫu nhiên có thể chỉ áp dụng cho các biến phân loại?


9

Câu hỏi này nghe có vẻ ngu ngốc, nhưng ... có đúng không khi các hiệu ứng ngẫu nhiên chỉ có thể áp dụng cho các biến phân loại (như id cá nhân, id dân số, ...), ví dụ: là biến phân loại:xi

β x iyi ~βxi

N o r m ( μ , δ 2 )βxi ~Norm(μ,δ2)

nhưng theo nguyên tắc, hiệu ứng ngẫu nhiên không thể áp dụng cho biến liên tục (như chiều cao, khối lượng ...), giả sử :zi

α + beta z iyi ~α+βzi

bởi vì sau đó chỉ có một hệ số không thể bị hạn chế? Nghe có vẻ hợp lý nhưng tôi tự hỏi tại sao nó không bao giờ được đề cập trong tài liệu thống kê! Cảm ơn!β

EDIT: Nhưng nếu tôi hạn chế như ~ thì sao? Có phải sau đó nó có hiệu lực ngẫu nhiên? Nhưng điều này khác với ràng buộc mà tôi đã đặt - ở đây tôi giới hạn biến trong khi trong ví dụ trước tôi đã hạn chế hệ số ! Nó bắt đầu trông như một mớ hỗn độn lớn đối với tôi ... Dù sao đi nữa, sẽ không có ý nghĩa gì khi đặt ràng buộc này, bởi vì là các giá trị đã biết, vì vậy có lẽ ý tưởng này hoàn toàn kỳ lạ :-)z i N o r m ( μ , delta 2 ) β x i z iziziNorm(μ,δ2)βxizi


1
Câu hỏi liên quan thú vị: stats.stackexchange.com/q/61531/5509
Tò mò

Câu trả lời:


5

Đây là một câu hỏi hay và rất cơ bản.

Việc giải thích các hiệu ứng ngẫu nhiên rất cụ thể theo miền và phụ thuộc vào lựa chọn mô hình (mô hình thống kê hoặc là người Bayes hoặc người thường xuyên). Để có một cuộc thảo luận rất tốt, xem trang 245, Gelman và Hill (2007) . Đối với Bayes, mọi thứ đều ngẫu nhiên (mặc dù các tham số có thể có giá trị cố định thực sự, chúng được mô hình hóa là ngẫu nhiên) và một người thường xuyên cũng có thể chọn một giá trị tham số là hiệu ứng cố định được mô hình hóa là ngẫu nhiên (xem Casella, 2008 , thảo luận về các khối sẽ được cố định hoặc ngẫu nhiên trong ví dụ 3.2).

Chỉnh sửa (sau khi bình luận)

Dữ liệu được cố định sau khi bạn quan sát chúng. Nếu chúng liên tục, chúng nên được mô hình hóa là liên tục. Bạn có thể mô hình các biến phân loại là phân loại và đôi khi là liên tục (như trong cài đặt biến thứ tự). Các tham số không xác định và chúng có thể được mô hình hóa là cố định hoặc ngẫu nhiên. Các thông số về cơ bản liên quan đến phản ứng với các yếu tố dự đoán. Nếu bạn muốn độ dốc của từng yếu tố dự đoán (hoặc hệ số của nó trong mô hình tuyến tính) thay đổi theo từng phản hồi, hãy mô hình hóa nó là ngẫu nhiên, nếu không thì mô hình hóa nó là cố định. Tương tự, nếu bạn muốn đánh chặn thay đổi liên quan đến các nhóm, thì chúng nên được mô hình hóa là ngẫu nhiên; nếu không thì chúng nên được sửa.


1
Cảm ơn câu trả lời của bạn, nhưng hmmm .... Tôi đã đặt một câu hỏi đơn giản và mong đợi câu trả lời đơn giản hoặc chung chung nào đó :) Trong đoạn 2 của bạn, bạn nói rằng trong Bayesian mọi thứ đều ngẫu nhiên. Xin đừng phức tạp hóa nó quá nhiều :) Tôi cố tình hỏi ở cấp độ mô hình, xin vui lòng quên thường xuyên hoặc bayesian - Tôi quan tâm đến nguyên tắc - loại hiệu ứng ngẫu nhiên thường được sử dụng?
Tò mò

Trong đoạn thứ 3, bạn đặt một ứng dụng đặc biệt với chuỗi thời gian, tôi không chắc là tôi hiểu nhưng chuỗi thời gian AFAIK thường rời rạc (không liên tục) nếu bạn nói về tương quan nối tiếp ... Dù sao, nếu bạn có cách nào đó tổng quát hơn Trả lời, xin vui lòng chia sẻ. Một lần nữa, cảm ơn bạn đã trả lời!
Tò mò

Sự ngẫu nhiên là trong những điều chưa biết. Khi bạn có quan sát họ được biết đến! Điều duy nhất mà bạn biết là dữ liệu của bạn. Các ẩn số là các tham số và chúng có thể được mô hình hóa là ngẫu nhiên hoặc cố định. (xin lỗi vì sự nhầm lẫn; tôi đồng ý, tôi không cần thiết làm mọi thứ trở nên phức tạp.)
suncoolsu

cảm ơn vì đã đơn giản hóa câu trả lời của bạn Vì vậy, đến gốc của câu hỏi của tôi - điều này có nghĩa là câu trả lời là , tức là các hiệu ứng ngẫu nhiên chỉ áp dụng cho các biến phân loại, bởi vì các hiệu ứng ngẫu nhiên chỉ áp dụng cho các tham số (không phải dữ liệu) và các tham số duy nhất có thể được mô hình hóa là ngẫu nhiên là những người có nhiều cấp độ, tức là những người của một biến phân loại? Và các tham số của các biến liên tục không thể được mô hình hóa là ngẫu nhiên, bởi vì chỉ có 1 giá trị tham số cho biến liên tục? Cảm ơn!
Tò mò

Trong cài đặt cụ thể của bạn, câu trả lời là . Nhưng nói chung, câu trả lời, tôi muốn nói là KHÔNG vì các biến liên tục có thể thay đổi tùy theo nhóm. Ví dụ: thu nhập của người dân trong thành phố phải cao hơn làng (theo bạn đây có thể là hai biến phân loại riêng biệt cho vị trí).
suncoolsu

3

Câu hỏi của bạn có thể đã được giải quyết, nhưng nó thực sự được viết trong sách giáo khoa;

Hiệu ứng ngẫu nhiên là các biến phân loại có mức được xem là mẫu từ một số dân lớn hơn, ngược lại với hiệu ứng cố định, mức độ được quan tâm theo quyền riêng của họ,

trên trang 232 của: Alan Grafen và Rosie Hails (2002) "Số liệu thống kê hiện đại cho khoa học đời sống", Nhà xuất bản Đại học Oxford.


2
Điều này hoàn toàn đúng, nhưng tôi không nghĩ rằng điều này trả lời câu hỏi.
Patrick Coulombe

1
Tôi không đồng ý với nhận xét trên của @PatrickCoulombe, tôi nghĩ rằng điều này trả lời chính xác câu hỏi. +1.
amip

1

Tôi nghĩ vấn đề là có hai điều liên quan ở đây. Một ví dụ điển hình về hiệu ứng ngẫu nhiên có thể dự đoán điểm trung bình (GPA) của một sinh viên đại học dựa trên một số yếu tố bao gồm điểm trung bình của họ trong một loạt các bài kiểm tra ở trường trung học.

Điểm trung bình là liên tục . Thông thường, bạn sẽ có một đánh chặn khác nhau, hoặc đánh chặn và độ dốc, cho điểm trung bình cho mỗi cá nhân. Các cá nhân rõ ràng là phân loại .

Vì vậy, khi bạn nói "chỉ áp dụng cho các biến phân loại" thì hơi mơ hồ. Nói rằng bạn chỉ xem xét một đánh chặn ngẫu nhiên cho điểm trung bình. Trong trường hợp này, việc chặn ngẫu nhiên của bạn cho một đại lượng liên tục và trên thực tế có thể được mô hình hóa giống như một biến gaussian với độ lệch trung bình và độ lệch chuẩn được xác định theo thủ tục. Nhưng việc đánh chặn ngẫu nhiên này được xác định trong toàn bộ học sinh, trong đó mỗi học sinh được xác định bởi một biến phân loại.

Bạn có thể sử dụng biến "liên tục" thay vì ID sinh viên. Có lẽ bạn có thể chọn chiều cao của học sinh. Nhưng về cơ bản nó sẽ phải được đối xử như thể nó là phân loại. Nếu số đo chiều cao của bạn rất chính xác, bạn sẽ lại có một chiều cao duy nhất cho mỗi học sinh, do đó, sẽ không có gì khác biệt. Nếu số đo chiều cao của bạn không chính xác lắm, cuối cùng bạn sẽ kết hợp nhiều sinh viên với nhau ở mỗi độ cao. (Trộn điểm số của họ theo cách có thể không xác định.)

Đây là loại trái ngược với các tương tác. Trong một tương tác, bạn đang nhân hai biến và về cơ bản coi cả hai là liên tục. Một biến phân loại sẽ được chia thành một tập hợp các biến giả 0/1 và 0 hoặc 1 sẽ được nhân với số lần khác của biến khác trong tương tác.

Điểm mấu chốt là "hiệu ứng ngẫu nhiên" theo một nghĩa nào đó chỉ là một hệ số có phân phối (được mô hình hóa) chứ không phải là một giá trị cố định.


Vui lòng đăng nhập dưới tài khoản chính của bạn để có thể chỉnh sửa.
amip
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.