Hồi giáo ngược dòng Shapiro hạ Wilk


11

Thử nghiệm Sharipo-Wilk, theo wikipedia , kiểm tra giả thuyết null ( ) "Dân số thường được phân phối".H0

Tôi đang tìm kiếm một bài kiểm tra tính quy phạm tương tự với "Dân số không được phân phối bình thường".H0

Có một bài kiểm tra như vậy, tôi muốn tính giá trị để loại bỏ H 0 ở mức ý nghĩa α iff p < α ; chứng minh rằng dân số của tôi được phân phối bình thường.pH0αp<α

Xin lưu ý rằng sử dụng thử nghiệm Sharipo-Wilk và chấp nhận iff p > α là một cách tiếp cận không chính xác vì nó có nghĩa đen là "chúng tôi không có đủ bằng chứng để chứng minh rằng H0 không giữ".H0p>α

Chủ đề liên quan - ý nghĩa của giá trị p , là kiểm tra quy tắc vô dụng? , nhưng tôi không thể thấy một giải pháp cho vấn đề của mình.

Các câu hỏi: Tôi nên sử dụng thử nghiệm nào? Được thực hiện trong R?


6
Không thể sử dụng giả thuyết "không được phân phối bình thường". Không gian này sẽ bao gồm tất cả các phân phối tùy ý gần, nhưng không hoàn toàn, các phân phối bình thường. Bạn cho tôi bất kỳ bộ dữ liệu hữu hạn. Tôi chọn phân phối theo kinh nghiệm, không bình thường, và do đó thuộc về không gian rỗng. Không thể từ chối.
A. Webb

5
Câu hỏi này, giống như câu hỏi trước của bạn, yêu cầu điều không thể. Một câu trả lời thích hợp sẽ giải thích cách các bài kiểm tra giả thuyết thống kê hoạt động, đó là lý do tại sao tôi chỉ cho bạn đến stats.stackexchange.com/questions/31 trong một bình luận cho câu hỏi khác của bạn.
whuber

5
Trong khi một giả thuyết "không bình thường phân phối" là không thể, một giả thuyết "được phân phối với giá trị tuyệt đối của số liệu thống kê tốt lành-of-fit bình thường ít nhất là khác nhau như " dọc theo dòng của một thử nghiệm tương đương có vẻ hợp lý. Nói cách khác, người ta phải có khả năng kiểm tra một giá trị "không bình thường ít nhất là nhiều như vậy ". @gung đã gợi ý chính xác điều này trong câu trả lời của anh ấy. ε
Alexis

Câu trả lời:


10

H0:normal

Tất cả những gì bạn có thể làm là tìm ra loại sai lệch nào so với tính bình thường mà bạn quan tâm (ví dụ: độ lệch) và độ lệch đó sẽ lớn đến mức nào trước khi nó làm phiền bạn. Sau đó, bạn có thể kiểm tra xem liệu độ lệch so với tính quy tắc hoàn hảo trong dữ liệu của bạn có thấp hơn số lượng quan trọng hay không. Để biết thêm thông tin về ý tưởng chung, có thể giúp đọc câu trả lời của tôi ở đây: Tại sao các nhà thống kê nói rằng một kết quả không quan trọng có nghĩa là bạn không thể từ chối null null trái ngược với việc chấp nhận giả thuyết null?


5

Tôi muốn tính giá trị p để loại bỏ H0 ở mức ý nghĩa α iff p <α; chứng minh rằng dân số của tôi được phân phối bình thường.

Phân phối bình thường phát sinh khi dữ liệu được tạo bởi một loạt các sự kiện iid phụ gia (xem hình ảnh quincunx bên dưới). Điều đó có nghĩa là không có phản hồi và không có mối tương quan, điều đó có giống như quá trình dẫn dữ liệu của bạn không? Nếu không, nó có lẽ không bình thường.

Có khả năng loại quy trình có thể xảy ra trong trường hợp của bạn. Cách gần nhất mà bạn có thể đến để "chứng minh" đó là thu thập đủ dữ liệu để loại trừ bất kỳ phân phối nào khác mà mọi người có thể đưa ra (điều này có thể không thực tế). Một cách khác là suy ra phân phối bình thường từ một số lý thuyết cùng với một số dự đoán khác. Nếu dữ liệu phù hợp với tất cả chúng và không ai có thể nghĩ ra lời giải thích khác thì đó sẽ là bằng chứng tốt cho việc phân phối bình thường.

https://upload.wikidia.org/wikipedia/commons/7/7f/Quincunx_%28Galton_Box%29_-_Galton_1889_diagram.png https://en.wikipedia.org/wiki/Bean_machine

Bây giờ nếu bạn không mong đợi bất kỳ phân phối cụ thể nào, thì vẫn có thể sử dụng phân phối bình thường để tóm tắt dữ liệu, nhưng nhận ra rằng đây thực chất là một lựa chọn không biết gì ( https://en.wikipedia.org/wiki/ Nguyên tắc_of_maximum_entropy ). Trong trường hợp này, bạn không muốn biết liệu dân số có được phân phối bình thường hay không, thay vào đó bạn muốn biết liệu phân phối bình thường có phải là một xấp xỉ hợp lý cho bất kỳ bước tiếp theo nào của bạn không.

Trong trường hợp đó, bạn nên cung cấp dữ liệu của mình (hoặc dữ liệu được tạo tương tự) cùng với mô tả về những gì bạn dự định làm với dữ liệu đó, sau đó hỏi "Bằng cách nào có thể giả sử tính bình thường trong trường hợp này đánh lừa tôi?"


Tôi thực sự biết rằng dữ liệu là bình thường (đo lường độc lập trên các máy tính độc lập), tuy nhiên tôi cần đưa ra một số giả định cho luận án của mình .. cảm ơn bạn đã làm rõ và ví dụ :)
petrbel

1
Tình cờ, Krieger đã đưa ra một lời phê bình đáng yêu về việc sử dụng Quincunx của Galton ở Krieger, N. (2012). Ai và dân số là gì? các cuộc tranh luận lịch sử, các cuộc tranh luận hiện tại và những tác động để hiểu về sức khỏe dân số của người Hồi giáo và khắc phục sự bất bình đẳng về sức khỏe. Khu phố Milbank , 90 (4): 634 Từ681.
Alexis

@petrbel Tình huống đó thật tinh tế khác với những gì được mô tả ở trên. Bạn có thể tạo ra một quincunx trong đó mỗi quan sát là iid nhưng quá trình tạo ra dữ liệu thì không. Xem ở đây để biết ví dụ về log-normal: LIMPERT et al. Phân phối log-normal trên các Khoa học: Chìa khóa và Đầu mối. Tháng 5 năm 2001 / Tập. 51 số 5. ​​Kỹ thuật sinh học.
Sống

1
@Alexis Tôi thấy rằng Krieger (2012) sao chép hình từ Limpert et al. (2001) và làm cho điểm bị bỏ lỡ bởi petrbel: "thay đổi cấu trúc có thể thay đổi xác suất kết quả, ngay cả đối với các đối tượng giống hệt nhau, do đó tạo ra sự phân bố dân số khác nhau".
Sống động

2

Bạn sẽ không bao giờ có thể "chứng minh" một giả định Bình thường trong dữ liệu của mình. Chỉ đưa ra bằng chứng chống lại nó như một giả định. Thử nghiệm Shapiro-Wilk là một cách để làm điều này và được sử dụng mọi lúc để biện minh cho giả định Normality. Lý do là bạn bắt đầu bằng cách giả định Normality. Sau đó, bạn hỏi, dữ liệu của tôi cho thấy tôi đang đưa ra một giả định ngớ ngẩn? Vì vậy, bạn tiếp tục và thử nghiệm nó với Shapiro-Wilk. Nếu bạn không từ chối giả thuyết khống thì dữ liệu không cho thấy bạn đang đưa ra một giả định ngớ ngẩn.

Y,X


Đó là thực tế mà bạn từ chối chính xác là cách tiếp cận không chính xác mà petrbel đã đề cập. Các thử nghiệm thường nhất quán, vì vậy kích thước mẫu càng lớn, xác suất khai báo tính chuẩn tắc càng lớn, một ý tưởng ngớ ngẩn càng lớn. Điều này là ngớ ngẩn, bởi vì với kích thước mẫu lớn hơn, giả định về tính quy tắc ít quan trọng hơn do tính mạnh mẽ không có triệu chứng của hầu hết các quy trình.
Horst Grünbusch

@ HorstGrünbusch Bạn có không đồng ý rằng thử nghiệm Shapiro-Wilk là một cách hợp lệ để kiểm tra giả định của một người rằng dữ liệu là Bình thường?
TrynnaDoStat

Nếu bạn đồng ý rằng đó là một cách tiếp cận hợp lệ thì tôi không chắc bạn không đồng ý với câu trả lời của tôi.
TrynnaDoStat

2α

@ HorstGrünbusch Có vẻ như vấn đề của bạn với câu trả lời của tôi liên quan đến ý tưởng kiểm tra giả thuyết nói chung. Cụ thể, thực tế là trong nhiều tình huống, các thử nghiệm giả thuyết sẽ từ chối null với xác suất 1 khi kích thước mẫu đạt tới vô hạn.
TrynnaDoStat
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.