Tôi biết không tham số dựa vào trung bình thay vì trung bình
Hầu như bất kỳ bài kiểm tra không tham số nào thực sự "dựa vào" trung bình theo nghĩa này. Tôi chỉ có thể nghĩ về một cặp vợ chồng ... và người duy nhất tôi mong đợi bạn có thể thậm chí đã nghe nói sẽ là bài kiểm tra dấu hiệu.
để so sánh ... một cái gì đó.
Nếu họ dựa vào trung vị, có lẽ sẽ là so sánh trung vị. Nhưng - bất chấp những gì một số nguồn cố gắng nói với bạn - các bài kiểm tra như bài kiểm tra xếp hạng đã ký, hoặc Wilcoxon-Mann-Whitney hoặc Kruskal-Wallis hoàn toàn không phải là bài kiểm tra về trung vị; nếu bạn đưa ra một số giả định bổ sung, bạn có thể coi Wilcoxon-Mann-Whitney và Kruskal-Wallis là các thử nghiệm về trung vị, nhưng theo các giả định tương tự (miễn là phương tiện phân phối tồn tại), bạn có thể coi chúng như một thử nghiệm phương tiện .
Ước tính vị trí thực tế có liên quan đến thử nghiệm Xếp hạng đã ký là trung bình của trung bình theo cặp trong mẫu, một mẫu cho Wilcoxon-Mann-Whitney (và theo ngụ ý, trong Kruskal-Wallis) là trung vị của các khác biệt giữa các mẫu .
Tôi cũng tin rằng nó dựa vào "mức độ tự do?" thay vì độ lệch chuẩn. Sửa tôi nếu tôi sai.
Hầu hết các bài kiểm tra không tham số không có 'bậc tự do', mặc dù phân phối nhiều thay đổi theo cỡ mẫu và bạn có thể coi đó là phần nào giống với mức độ tự do theo nghĩa các bảng thay đổi theo cỡ mẫu. Các mẫu tất nhiên giữ lại các thuộc tính của chúng và có n bậc tự do theo nghĩa đó, nhưng mức độ tự do trong phân phối thống kê kiểm tra không phải là điều chúng ta thường quan tâm. Điều đó có thể xảy ra khi bạn có thứ gì đó giống như mức độ tự do hơn - ví dụ, bạn chắc chắn có thể đưa ra lập luận rằng Kruskal-Wallis có mức độ tự do về cơ bản giống như một hình vuông chi, nhưng nó thường không được nhìn theo cách đó (ví dụ, nếu ai đó nói về mức độ tự do của Kruskal-Wallis, họ sẽ luôn luôn có nghĩa là df
Một cuộc thảo luận tốt về mức độ tự do có thể được tìm thấy ở đây /
Tôi đã thực hiện nghiên cứu khá tốt, hoặc vì vậy tôi đã nghĩ, cố gắng hiểu khái niệm, hoạt động đằng sau nó, kết quả kiểm tra thực sự có ý nghĩa gì và / hoặc phải làm gì với kết quả kiểm tra; tuy nhiên dường như không ai từng mạo hiểm vào khu vực đó.
Tôi không chắc ý của bạn là gì
Tôi có thể đề xuất một số cuốn sách, như Số liệu thống kê phi thực tế của Conover , và nếu bạn có thể lấy nó, cuốn sách của Neave và Worthington ( Bài kiểm tra không phân phối ), nhưng có nhiều cuốn khác - Marascuilo & McSweeney, Hollander & Wolfe, hoặc cuốn sách của Daniel chẳng hạn. Tôi đề nghị bạn nên đọc ít nhất 3 hoặc 4 trong số những cuốn nói với bạn tốt nhất, tốt nhất là những cuốn giải thích mọi thứ khác nhau nhất có thể (điều này có nghĩa là ít nhất là đọc một ít trong số 6 hoặc 7 cuốn sách để tìm ra 3 điều phù hợp).
Vì mục đích đơn giản, hãy gắn bó với bài kiểm tra Mann Whitney U, điều mà tôi nhận thấy là khá phổ biến
Đó là, điều khiến tôi bối rối về câu nói của bạn "dường như không ai từng mạo hiểm vào khu vực đó" - nhiều người sử dụng các bài kiểm tra này đã 'mạo hiểm vào khu vực' mà bạn đang nói đến.
- và dường như cũng bị lạm dụng và lạm dụng
Tôi muốn nói rằng các xét nghiệm không theo dõi thường được sử dụng nếu có bất cứ điều gì (bao gồm cả Wilcoxon-Mann-Whitney) - đặc biệt nhất là các xét nghiệm hoán vị / ngẫu nhiên, mặc dù tôi không nhất thiết phải tranh luận rằng chúng thường xuyên bị lạm dụng (nhưng cũng là các xét nghiệm tham số nhiều hơn như vậy).
Giả sử tôi chạy thử nghiệm không tham số với dữ liệu của mình và tôi nhận lại kết quả này:
[bắn tỉa]
Tôi quen thuộc với các phương pháp khác, nhưng có gì khác ở đây?
Những phương pháp khác có nghĩa là gì? Bạn muốn tôi so sánh điều này với cái gì?
Chỉnh sửa: Bạn đề cập đến hồi quy sau; Tôi giả sử rằng bạn đã quen thuộc với thử nghiệm t hai mẫu (vì đây thực sự là một trường hợp hồi quy đặc biệt).
Theo các giả định cho thử nghiệm t hai mẫu thông thường, giả thuyết null cho rằng hai quần thể giống hệt nhau, chống lại sự thay thế mà một trong các phân phối đã thay đổi. Nếu bạn nhìn vào bộ đầu tiên trong hai giả thuyết về Wilcoxon-Mann-Whitney dưới đây, điều cơ bản đang được thử nghiệm ở đó gần như giống hệt nhau; chỉ là thử nghiệm t dựa trên giả định các mẫu đến từ các phân phối bình thường giống hệt nhau (ngoài khả năng dịch chuyển vị trí). Nếu giả thuyết null là đúng và các giả định kèm theo là đúng, thì thống kê kiểm tra có phân phối t. Nếu giả thuyết thay thế là đúng, thì thống kê kiểm tra có nhiều khả năng lấy các giá trị không phù hợp với giả thuyết null nhưng có vẻ phù hợp với giải pháp thay thế - chúng tôi tập trung vào điều bất thường nhất,
Tình huống rất giống với Wilcoxon-Mann-Whitney, nhưng nó đo độ lệch so với null có phần khác nhau. Trong thực tế, khi các giả định của bài kiểm tra t là đúng *, thì nó gần như là bài kiểm tra tốt nhất có thể (đó là bài kiểm tra t).
* (trong thực tế là không bao giờ, mặc dù điều đó không thực sự nhiều vấn đề như nó có vẻ)
Thật vậy, có thể coi Wilcoxon-Mann-Whitney là "thử nghiệm t" được thực hiện trên hàng ngũ dữ liệu - mặc dù sau đó nó không có phân phối t; thống kê là một hàm đơn điệu của thống kê t hai mẫu được tính trên các cấp bậc của dữ liệu, do đó, nó tạo ra thứ tự tương tự ** trên không gian mẫu (đó là "kiểm tra t" trên các cấp bậc - được thực hiện một cách thích hợp - sẽ tạo ra các giá trị p giống như Wilcoxon-Mann-Whitney), vì vậy nó từ chối chính xác các trường hợp tương tự.
** (đúng, đặt hàng một phần, nhưng hãy để nó qua một bên)
[Bạn sẽ nghĩ rằng chỉ cần sử dụng các cấp bậc sẽ làm mất đi rất nhiều thông tin, nhưng khi dữ liệu được rút ra từ các quần thể bình thường có cùng phương sai, hầu như tất cả thông tin về dịch chuyển vị trí đều nằm trong mô hình của các cấp bậc. Các giá trị dữ liệu thực tế (có điều kiện trên hàng ngũ của chúng) thêm rất ít thông tin bổ sung vào đó. Nếu bạn đi đuôi nặng hơn bình thường, không lâu trước khi thử nghiệm Wilcoxon-Mann-Whitney có sức mạnh tốt hơn, cũng như giữ được mức ý nghĩa danh nghĩa của nó, do đó, thông tin 'thêm' trên hàng ngũ cuối cùng sẽ không chỉ là không chính xác mà còn ở một số ý thức, gây hiểu lầm. Tuy nhiên, đuôi nặng gần đối xứng là một tình huống hiếm gặp; những gì bạn thường thấy trong thực tế là sự lệch lạc.]
Các ý tưởng cơ bản khá giống nhau, các giá trị p có cùng cách hiểu (xác suất kết quả là, hoặc cực đoan hơn, nếu giả thuyết null là đúng) - ngay đến cách giải thích dịch chuyển vị trí, nếu bạn thực hiện các giả định cần thiết (xem phần thảo luận về các giả thuyết gần cuối bài này).
Nếu tôi thực hiện mô phỏng giống như trong các ô trên cho phép thử t, các ô sẽ trông rất giống nhau - tỷ lệ trên các trục x và y sẽ trông khác nhau, nhưng bề ngoài cơ bản sẽ giống nhau.
Chúng ta có nên muốn giá trị p thấp hơn 0,05 không?
Bạn không nên "muốn" bất cứ điều gì ở đó. Ý tưởng là tìm hiểu xem các mẫu có khác nhau hơn (theo nghĩa địa điểm) hơn là có thể được giải thích một cách tình cờ, không phải là 'mong muốn' một kết quả cụ thể.
Nếu tôi nói "Bạn có thể đi xem xe của Raj có màu gì không?", Nếu tôi muốn một đánh giá khách quan về nó, tôi không muốn bạn đi "Man, tôi thực sự, thực sự hy vọng nó có màu xanh! Nó chỉ có được màu xanh da trời". Tốt nhất là chỉ xem tình huống là gì, thay vì đi vào một số 'Tôi cần nó là một cái gì đó'.
Nếu mức ý nghĩa được chọn của bạn là 0,05, thì bạn sẽ từ chối giả thuyết khống khi giá trị p dưới 0,05. Nhưng việc không từ chối khi bạn có cỡ mẫu đủ lớn để gần như luôn luôn phát hiện các kích cỡ hiệu ứng có liên quan ít nhất là thú vị, bởi vì nó nói rằng bất kỳ sự khác biệt nào tồn tại đều nhỏ.
Số "mann whitley" có nghĩa là gì?
Thống kê Mann-Whitney .
Nó thực sự chỉ có ý nghĩa so với phân phối các giá trị mà nó có thể nhận được khi giả thuyết null là đúng (xem sơ đồ trên) và điều đó phụ thuộc vào định nghĩa cụ thể nào mà bất kỳ chương trình cụ thể nào có thể sử dụng.
Có sử dụng cho nó?
Thông thường, bạn không quan tâm đến giá trị chính xác như vậy, nhưng nó nằm ở đâu trong phân phối null (cho dù đó là ít nhiều điển hình của các giá trị bạn sẽ thấy khi giả thuyết null là đúng hay không, hay nó cực hơn)
P(X<Y)
Dữ liệu này ở đây chỉ xác minh hay không xác minh rằng một nguồn dữ liệu cụ thể mà tôi có nên hay không nên sử dụng?
Thử nghiệm này không nói gì về "một nguồn dữ liệu cụ thể mà tôi nên hoặc không nên sử dụng".
Xem thảo luận của tôi về hai cách nhìn vào các giả thuyết WMW dưới đây.
Tôi có một lượng kinh nghiệm hợp lý với hồi quy và những điều cơ bản, nhưng tôi rất tò mò về thứ không đặc biệt "đặc biệt" này
Không có gì đặc biệt về các bài kiểm tra không tham số (tôi muốn nói các bài kiểm tra 'tiêu chuẩn' theo nhiều cách thậm chí còn cơ bản hơn các bài kiểm tra tham số điển hình) - miễn là bạn thực sự hiểu về kiểm tra giả thuyết.
Đó có lẽ là một chủ đề cho một câu hỏi khác, tuy nhiên.
Có hai cách chính để xem xét thử nghiệm giả thuyết Wilcoxon-Mann-Whitney.
i) Một là nói "Tôi quan tâm đến dịch chuyển vị trí - đó là theo giả thuyết khống, hai quần thể có cùng phân phối (liên tục) , chống lại sự thay thế là một thay đổi 'tăng hoặc giảm' so với thay thế khác "
Wilcoxon-Mann-Whitney hoạt động rất tốt nếu bạn đưa ra giả định này (rằng sự thay thế của bạn chỉ là một sự thay đổi vị trí)
Trong trường hợp này, Wilcoxon-Mann-Whitney thực sự là một thử nghiệm cho các trung vị ... nhưng cũng là một thử nghiệm về phương tiện, hoặc thực sự là bất kỳ thống kê tương đương vị trí nào khác (ví dụ, phần trăm thứ 90, hoặc phương tiện cắt xén, hoặc bất kỳ số nào những thứ khác), vì tất cả chúng đều bị ảnh hưởng theo cùng một cách bởi sự thay đổi vị trí.
Điều hay ho về điều này là nó rất dễ hiểu - và thật dễ dàng để tạo ra khoảng tin cậy cho sự thay đổi vị trí này.
Tuy nhiên, xét nghiệm Wilcoxon-Mann-Whitney nhạy cảm với các loại khác biệt hơn là thay đổi vị trí.
1212