Tư vấn về giải thích sự không đồng nhất / không đồng nhất


8

Tôi đang tìm kiếm bất kỳ sự giúp đỡ, lời khuyên hoặc lời khuyên trong cách giải thích sự không đồng nhất / không đồng nhất cho các nhà sinh học trong bộ phận của tôi. Cụ thể tôi muốn giải thích tại sao điều quan trọng là tìm kiếm nó và đối phó với nó nếu nó tồn tại, tôi đang tìm kiếm ý kiến ​​về các câu hỏi sau đây.

  1. Có sự không đồng nhất ảnh hưởng đến độ tin cậy của ước tính hiệu ứng ngẫu nhiên? Tôi khá chắc chắn rằng nó làm, nhưng tôi không thể tìm thấy một bài báo.
  2. Làm thế nào nghiêm trọng một vấn đề là không đồng nhất? Tôi đã tìm thấy những quan điểm trái ngược nhau về vấn đề này, trong khi một số người nói rằng các lỗi tiêu chuẩn mô hình, v.v. sẽ không đáng tin cậy, tôi cũng đã đọc rằng đó chỉ là vấn đề nếu sự không đồng nhất nghiêm trọng. Làm thế nào là nghiêm trọng?
  3. Tư vấn về mô hình không đồng nhất. Hiện tại, tôi tập trung phần lớn vào gói nlme trong R và việc sử dụng các phương sai phương sai, điều này khá đơn giản và hầu hết mọi người ở đây đều sử dụng R nên việc cung cấp các tập lệnh là hữu ích. Tôi cũng đang sử dụng gói MCMCglmm, nhưng các đề xuất khác đều được chào đón, đặc biệt đối với dữ liệu không bình thường.
  4. Những đề nghị khác dều được hoan nghênh.

1
@ user3136, vui lòng làm rõ là sự không đồng nhất mối quan tâm chính của bạn (các loài khác nhau với các thuộc tính duy nhất, có thể được lấy từ phân phối đã biết) hoặc tính không đồng nhất (thuộc tính của quá trình ngẫu nhiên để có phương sai thay đổi theo thời gian), vì hai khái niệm này khác nhau rõ ràng. Cả hai vấn đề đều thú vị, trước đây dẫn đến các mô hình hiệu ứng hỗn hợp hoặc mô hình hệ số ngẫu nhiên, cái sau có nhiều cách xử lý (nhưng ít quan trọng hơn, vì chỉ không hiệu quả, nhưng ước tính không thiên vị). OLS
Dmitrij Celov

Xin chào, xin lỗi về điều đó. Mối quan tâm của tôi thực sự là về sự không đồng nhất. Một vấn đề tôi gặp phải là hai thuật ngữ này (tính không đồng nhất và tính không đồng nhất) được sử dụng gần như thay thế cho nhau. Trong bối cảnh này, cả hai được cho là đề cập đến tình huống khi lỗi trong phần dư không phải là hằng số
user3136

4
Không thực sự như vậy, các nguồn không đồng nhất có rất nhiều: sự khác biệt về tham số (ví dụ: tham số ngẫu nhiên), biến (điều hồi quy thông thường), phần dư (phần idiosyncratic có thể thuộc các phân phối khác nhau hoặc tham số phân phối có thể khác nhau, do đó không đồng nhất nó là một trường hợp riêng biệt của tính không đồng nhất), sự khác biệt về hình thức chức năng. Vì vậy, tôi sẽ chỉ để lại thuật ngữ cụ thể hơn - không đồng nhất.
Dmitrij Celov

Cảm ơn Dimitrij, một câu hỏi tôi muốn hỏi là về thuật ngữ chính xác trong lĩnh vực này.
dùng3136

Câu trả lời:


6

Allometry sẽ là một nơi tốt để bắt đầu sẽ quen thuộc với các nhà sinh học. Các phép biến đổi logarit thường được sử dụng trong phép đo bởi vì dữ liệu có dạng định luật công suất, nhưng cũng vì quá trình nhiễu là không đồng nhất (vì độ biến thiên tỷ lệ thuận với kích thước). Để biết ví dụ về điều này gây ra vấn đề nghiêm trọng, hãy xem "Phương trình dự tính sinh khối để dự đoán khối lượng khủng long cơ thể" , trong đó kết luận rằng khủng long chỉ bằng một nửa kích thước trước đây là không chính xác vì đã đưa ra giả thuyết không đồng nhất về tính đồng nhất (xem phần tương ứng chi tiết).


6

var(αi)=X¯i2σu2

αi=X¯iuiuiN(0,σu2)

Yij=αi+βXij+eijeijN(0,σe2)

(hy vọng ký hiệu này có ý nghĩa). Tôi tin rằng chơi xung quanh với một thiết lập như thế này sẽ giúp bạn trả lời câu hỏi 2). Vì vậy, bạn sẽ phù hợp với mô hình này bằng cách sử dụng một chặn ngẫu nhiên, trong khi thực tế nó phải là một độ dốc ngẫu nhiên (cung cấp cho bạn một câu trả lời một phần cho câu hỏi 3 - các lần chặn ngẫu nhiên có thể giải thích cho "quạt" ở mức độ - đây là "quạt cấp 2" ). Ý tưởng ở trên là cố gắng hết sức có thể để phá vỡ phương pháp mô hình hóa của bạn - thử các điều kiện khắc nghiệt phù hợp với những gì bạn biết về dữ liệu và xem điều gì sẽ xảy ra. Nếu bạn đang vật lộn để tìm những điều kiện này, thì đừng lo lắng.

Tôi đã kiểm tra nhanh về tính không đồng nhất đối với OLS và dường như nó không ảnh hưởng đến betas ước tính quá nhiều. Đối với tôi, có vẻ như sự không đồng nhất sẽ xảy ra ở một số nơi bằng cách ước tính thấp về lỗi có thể xảy ra, và ở những nơi khác, nó sẽ đưa ra ước tính quá mức về lỗi có thể xảy ra (theo thuật ngữ dự đoán). Xem bên dưới:

Đang chờ lô dữ liệu ở đây, người dùng hiện đang thất vọng với máy tính

Và một điều mà tôi luôn thấy thú vị là "tính phi quy tắc của dữ liệu" mà mọi người lo lắng. Dữ liệu không cần phải được phân phối bình thường, nhưng thuật ngữ lỗi thì có. Nếu điều này không đúng, thì GLM sẽ không hoạt động - GLM sử dụng xấp xỉ bình thường cho hàm khả năng để ước tính các tham số, cũng như GLMM.

Vì vậy, tôi muốn nói rằng nếu ước tính các tham số hiệu ứng cố định là mục tiêu chính thì không phải lo lắng nhiều, nhưng bạn có thể nhận được kết quả tốt hơn để dự đoán bằng cách tính đến tính không đồng nhất.


1
HI, cảm ơn vì lời khuyên. Tôi hiện đang làm việc trên một số mô phỏng vì vậy tôi hy vọng họ làm việc ra. Theo như tôi biết thì tính không đồng nhất không ảnh hưởng đến việc ước tính các hệ số hồi quy, nhưng nó có thể ước tính quá mức hoặc đánh giá thấp các lỗi tiêu chuẩn của các ước tính này.
dùng3136

Nó thực sự làm cả hai (ước tính quá mức và dưới mức ước tính) nếu có sự không đồng nhất - theo cách tương tự như "tính trung bình" của dữ liệu thông thường sẽ cả trên và dưới - ước tính các giá trị thực tế. Đối với độ dốc, bạn sẽ có độ chính xác khác nhau tại các điểm khác nhau trên đường.
xác suất

Trong lĩnh vực cụ thể của tôi cũng có một sự phụ thuộc lớn vào thử nghiệm quan trọng và do đó cũng có giá trị p. Vì vậy, tôi nghĩ rằng thực tế rằng SE có thể được ước tính quá mức và có thể gây ra một số vấn đề nếu bạn dựa trên tất cả các suy luận về giá trị p của bạn.
dùng3136

Tôi muốn nói rằng bạn có vấn đề lớn hơn lỗi tiêu chuẩn nếu tất cả suy luận dựa trên giá trị p và kiểm tra ý nghĩa. Những loại điều này khuyến khích "thống kê không suy nghĩ".
xác suất

Tôi không thể đồng ý nhiều hơn, tôi nghĩ rằng hầu hết những người tôi nói đều biết rằng cách tiếp cận như vậy là đáng ngờ, nhưng thật khó để ngăn họ chỉ tập trung vào giá trị p, thường phải trả giá bằng mọi thứ khác.
dùng3136

0

Tài nguyên trực tuyến MIỄN PHÍ tốt nhất mà tôi biết để tìm hiểu về tính không đồng nhất là các bài giảng ECON 421 của Giáo sư Thoma từ năm 2011. Các bài giảng cụ thể 1 - 7. Các bài giảng của ông rất có tổ chức và dễ theo dõi bất kể ngành học của bạn.

Đây là bài giảng đầu tiên. Bạn có thể Tìm phần còn lại của các bài giảng từ học kỳ mùa đông 2011 ở đây. http://www.youtube.com/watch?v=WK03XgoVsPM

Ngoài ra, trang web tương ứng cho khóa học 421 của Giáo sư Thoma có Vấn đề Bài tập về nhà và cũng như các giải pháp của họ. Đối với các giải pháp yêu cầu phần mềm, giải pháp được chi tiết từng bước bằng cách sử dụng kết hợp văn bản, công thức và ảnh chụp màn hình từ Eview.

Mặc dù các bước được sử dụng để giải quyết các vấn đề bài tập về nhà được chi tiết bằng cách sử dụng ảnh chụp màn hình từ chế độ xem E, các giải pháp dễ dàng dịch tốt sang các gói thống kê khác như thống kê STATA hoặc R.

Không có Giải pháp nào được liệt kê cho Bài tập về nhà từ học kỳ 2011, đây là video cuối cùng của Giáo sư Thoma ghi âm học kỳ. Tuy nhiên, có những bài tập về nhà cho học kỳ mùa đông 2012 của anh ấy .

Dưới đây là đường dẫn đến phần giải pháp Bài tập về nhà của lớp Giáo sư Thomas Winter 2012 421. Cụ thể ở đây là Giải pháp cho bài tập về nhà 3 trong đó tính không đồng nhất được giới thiệu cho các bộ bài tập về nhà. http://economistsview.typepad.com/economics421/2012/02/solution-to-homework-3.html


1
Cảm ơn bạn đã tham khảo, James. Tuy nhiên, ở đây, người hỏi đang yêu cầu giải thíchlời khuyên. Để câu trả lời của bạn có thể có liên quan, bạn có thể diễn giải "trợ giúp, lời khuyên hoặc mẹo" cụ thể trong các tài liệu tham khảo này không?
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.