Tôi có thể sử dụng phân phối bình thường GLM với chức năng liên kết LOG trên DV đã được chuyển đổi nhật ký không?
Đúng; nếu các giả định được thỏa mãn trên thang đo đó
Là thử nghiệm đồng nhất phương sai có đủ để biện minh cho việc sử dụng phân phối bình thường không?
Tại sao bình đẳng của phương sai ngụ ý bình thường?
Là quy trình kiểm tra dư có đúng để biện minh cho việc chọn mô hình chức năng liên kết không?
Bạn nên cẩn thận khi sử dụng cả biểu đồ và mức độ tốt của các bài kiểm tra phù hợp để kiểm tra sự phù hợp của các giả định của bạn:
1) Coi chừng sử dụng biểu đồ để đánh giá tính chuẩn. (Cũng xem tại đây )
Nói tóm lại, tùy thuộc vào một cái gì đó đơn giản như một thay đổi nhỏ trong lựa chọn băng thông của bạn, hoặc thậm chí chỉ là vị trí của ranh giới bin, có thể có những ấn tượng khá khác nhau về hình dạng của dữ liệu:
Đó là hai biểu đồ của cùng một bộ dữ liệu. Sử dụng một số băng thông khác nhau có thể hữu ích trong việc xem liệu ấn tượng có nhạy cảm với điều đó hay không.
2) Coi chừng sử dụng tính tốt của các bài kiểm tra phù hợp để kết luận rằng giả định về tính quy phạm là hợp lý. Các thử nghiệm giả thuyết chính thức không thực sự trả lời đúng câu hỏi.
ví dụ: xem các liên kết dưới mục 2. ở đây
Về phương sai, điều đó đã được đề cập trong một số bài báo sử dụng các bộ dữ liệu tương tự "bởi vì các bản phân phối có phương sai đồng nhất, một GLM với phân phối Gaussian đã được sử dụng". Nếu điều này không đúng, làm thế nào tôi có thể biện minh hoặc quyết định phân phối?
Trong trường hợp bình thường, câu hỏi không phải là 'lỗi của tôi (hoặc phân phối có điều kiện) có bình thường không?' - họ sẽ không, chúng tôi thậm chí không cần kiểm tra. Một câu hỏi phù hợp hơn là "mức độ phi bình thường hiện tại ảnh hưởng đến suy luận của tôi như thế nào?"
Tôi đề nghị một ước tính mật độ hạt nhân hoặc QQplot bình thường (âm mưu của phần dư so với điểm số bình thường). Nếu phân phối trông hợp lý bình thường, bạn không có gì phải lo lắng. Trên thực tế, ngay cả khi nó rõ ràng không bình thường, nó vẫn có thể không quan trọng lắm, tùy thuộc vào những gì bạn muốn làm (ví dụ, các khoảng dự đoán thông thường thực sự sẽ dựa vào tính quy tắc, nhưng nhiều thứ khác sẽ có xu hướng hoạt động ở cỡ mẫu lớn )
Thật thú vị, ở các mẫu lớn, tính quy phạm nói chung ngày càng ít quan trọng hơn (ngoài PI như đã đề cập ở trên), nhưng khả năng từ chối tính quy tắc của bạn ngày càng lớn hơn.
Chỉnh sửa: điểm về sự bình đẳng của phương sai là thực sự có thể tác động đến suy luận của bạn, ngay cả ở kích thước mẫu lớn. Nhưng có lẽ bạn không nên đánh giá điều đó bằng các bài kiểm tra giả thuyết. Nhận giả định phương sai sai là một vấn đề bất kể phân phối giả định của bạn.
Tôi đọc rằng độ lệch tỷ lệ nên ở xung quanh Np cho mô hình cho phù hợp phải không?
Khi bạn phù hợp với một mô hình bình thường, nó có một tham số tỷ lệ, trong trường hợp đó độ lệch tỷ lệ của bạn sẽ là về Np ngay cả khi phân phối của bạn không bình thường.
Theo ý kiến của bạn, phân phối bình thường với liên kết nhật ký là một lựa chọn tốt
Trong trường hợp tiếp tục không biết bạn đang đo lường cái gì hoặc bạn đang sử dụng suy luận để làm gì, tôi vẫn không thể đánh giá liệu có nên đề xuất phân phối khác cho GLM hay không, tính bình thường có thể quan trọng như thế nào đối với suy luận của bạn.
Tuy nhiên, nếu các giả định khác của bạn cũng hợp lý (tuyến tính và phương sai của phương sai ít nhất nên được kiểm tra và các nguồn phụ thuộc tiềm năng được xem xét), thì trong hầu hết các trường hợp, tôi sẽ rất thoải mái khi làm những việc như sử dụng TCTD và thực hiện các thử nghiệm về hệ số hoặc độ tương phản - chỉ có một ấn tượng rất nhỏ về độ lệch trong những phần dư đó, mà ngay cả khi đó là một hiệu ứng thực sự, sẽ không có tác động đáng kể đến những loại suy luận đó.
Tóm lại, bạn sẽ ổn thôi.
(Mặc dù chức năng phân phối và liên kết khác có thể làm tốt hơn một chút về mức độ phù hợp, nhưng chỉ trong những trường hợp hạn chế, chúng mới có khả năng cũng có ý nghĩa hơn.)