Chính xác thì một bài kiểm tra không tham số thực hiện được những gì & Bạn làm gì với kết quả?


22

Tôi có cảm giác điều này có thể đã được hỏi ở nơi khác, nhưng không thực sự với loại mô tả cơ bản tôi cần. Tôi biết không tham số dựa vào trung vị thay vì trung bình để so sánh ... một cái gì đó. Tôi cũng tin rằng nó dựa vào "mức độ tự do" (?) Thay vì độ lệch chuẩn. Mặc dù vậy, tôi sẽ sửa nếu tôi sai.

Tôi đã thực hiện nghiên cứu khá tốt, hoặc vì vậy tôi nghĩ, cố gắng hiểu khái niệm, hoạt động đằng sau nó, kết quả kiểm tra thực sự có ý nghĩa gì và / hoặc phải làm gì với kết quả kiểm tra; tuy nhiên, dường như không ai từng mạo hiểm vào khu vực đó.

Để đơn giản, chúng ta hãy gắn bó với bài kiểm tra Mann-Whitney U, điều mà tôi nhận thấy là khá phổ biến (và dường như cũng bị lạm dụng và sử dụng quá mức để buộc "mô hình vuông vào lỗ tròn"). Nếu bạn muốn mô tả các bài kiểm tra khác cũng cảm thấy thoải mái, mặc dù tôi cảm thấy một khi tôi hiểu một bài kiểm tra, tôi có thể hiểu các bài kiểm tra khác theo cách tương tự đối với các bài kiểm tra t khác nhau, v.v.

Giả sử tôi chạy thử nghiệm không tham số với dữ liệu của mình và tôi nhận lại kết quả này:

2 Sample Mann-Whitney - Customer Type       

Test Information        
H0: Median Difference = 0       
Ha: Median Difference ≠ 0       

Size of Customer    Large   Small
Count                    45    55
Median                    2     2

Mann-Whitney Statistic: 2162.00 
p-value (2-sided, adjusted for ties):   0.4156  

Tôi quen thuộc với các phương pháp khác, nhưng có gì khác ở đây? Chúng ta có nên muốn giá trị p thấp hơn 0,05 không? "Thống kê Mann-Whitney" nghĩa là gì? Có sử dụng cho nó? Thông tin này ở đây chỉ xác minh hay không xác minh rằng một nguồn dữ liệu cụ thể mà tôi có nên hay không nên sử dụng?

Tôi có một lượng kinh nghiệm hợp lý với hồi quy và những điều cơ bản, nhưng tôi rất tò mò về thứ không tham số "đặc biệt" này - mà tôi biết sẽ có những thiếu sót riêng.

Chỉ cần tưởng tượng tôi là một học sinh lớp năm và xem nếu bạn có thể giải thích nó cho tôi.


4
Vâng, tôi đã đọc nó nhiều lần. Đôi khi biệt ngữ mà wikipedia sử dụng có thể trở nên áp đảo và mặc dù nó có một mô tả chính xác - nó không nhất thiết phải có một mô tả rõ ràng cho một người bắt đầu cố gắng tìm hiểu khu vực. Không chắc ai đã đánh giá thấp, nhưng tôi thực sự muốn chỉ là một lời giải thích cơ bản, RAR RÀNG, hầu như ai cũng có thể hiểu được. Có, tôi đã cố gắng hết sức để tìm một người tin hay không. Không cần phải ngay lập tức downvote tôi và liên kết tôi với wikipedia. Bất cứ ai cũng nhận thấy làm thế nào một số giáo viên tốt hơn so với những người khác? Tôi đang tìm kiếm một "giáo viên" tốt cho một khái niệm mà tôi đang mắc kẹt.
Taal

1
Chuyển sang sau đó đến một văn bản thống kê phi tham số cơ bản tốt như Sprent và Smeeton, Hollander và Wolfe, Conover. hoặc tìm một văn bản giới thiệu bao gồm Mann-Whitney.
Nick Cox

1
Từ việc xem xét câu hỏi của bạn và câu hỏi khác mà bạn đã hỏi gần đây chỉ sử dụng internet không hiệu quả với bạn, vì rõ ràng bạn đang rất bối rối. Đó là lý do tại sao @Peter Flom và tôi đang giới thiệu sách. Tôi không có đề xuất khác trong dự trữ. Tôi cũng khuyên bạn - chân thành và vì lợi ích tốt nhất của bạn - cố gắng viết những câu hỏi ngắn gọn hơn, ít trò chuyện hơn. Phong cách lạc đề của bạn không giúp làm rõ câu hỏi của bạn.
Nick Cox

1
Internet một mình thực sự hoạt động tốt hơn bất kỳ cuốn sách hay lớp học nào từng làm cho tôi thành thật - và điều đó đúng với bất kỳ chủ đề nào. Tôi xin lỗi vì đã viết những câu hỏi "tán gẫu".
Taal

3
Không, nó dường như không hoạt động tốt như một cuốn sách hay. Để diễn giải Stephen Senn, thật kỳ lạ khi thống kê là khoa học duy nhất mà mọi người yêu cầu có thể hiểu được ngay từ cái nhìn đầu tiên.
Frank Harrell

Câu trả lời:


41

Tôi biết không tham số dựa vào trung bình thay vì trung bình

Hầu như bất kỳ bài kiểm tra không tham số nào thực sự "dựa vào" trung bình theo nghĩa này. Tôi chỉ có thể nghĩ về một cặp vợ chồng ... và người duy nhất tôi mong đợi bạn có thể thậm chí đã nghe nói sẽ là bài kiểm tra dấu hiệu.

để so sánh ... một cái gì đó.

Nếu họ dựa vào trung vị, có lẽ sẽ là so sánh trung vị. Nhưng - bất chấp những gì một số nguồn cố gắng nói với bạn - các bài kiểm tra như bài kiểm tra xếp hạng đã ký, hoặc Wilcoxon-Mann-Whitney hoặc Kruskal-Wallis hoàn toàn không phải là bài kiểm tra về trung vị; nếu bạn đưa ra một số giả định bổ sung, bạn có thể coi Wilcoxon-Mann-Whitney và Kruskal-Wallis là các thử nghiệm về trung vị, nhưng theo các giả định tương tự (miễn là phương tiện phân phối tồn tại), bạn có thể coi chúng như một thử nghiệm phương tiện .

Ước tính vị trí thực tế có liên quan đến thử nghiệm Xếp hạng đã ký là trung bình của trung bình theo cặp trong mẫu, một mẫu cho Wilcoxon-Mann-Whitney (và theo ngụ ý, trong Kruskal-Wallis) là trung vị của các khác biệt giữa các mẫu .

Tôi cũng tin rằng nó dựa vào "mức độ tự do?" thay vì độ lệch chuẩn. Sửa tôi nếu tôi sai.

Hầu hết các bài kiểm tra không tham số không có 'bậc tự do', mặc dù phân phối nhiều thay đổi theo cỡ mẫu và bạn có thể coi đó là phần nào giống với mức độ tự do theo nghĩa các bảng thay đổi theo cỡ mẫu. Các mẫu tất nhiên giữ lại các thuộc tính của chúng và có n bậc tự do theo nghĩa đó, nhưng mức độ tự do trong phân phối thống kê kiểm tra không phải là điều chúng ta thường quan tâm. Điều đó có thể xảy ra khi bạn có thứ gì đó giống như mức độ tự do hơn - ví dụ, bạn chắc chắn có thể đưa ra lập luận rằng Kruskal-Wallis có mức độ tự do về cơ bản giống như một hình vuông chi, nhưng nó thường không được nhìn theo cách đó (ví dụ, nếu ai đó nói về mức độ tự do của Kruskal-Wallis, họ sẽ luôn luôn có nghĩa là df

Một cuộc thảo luận tốt về mức độ tự do có thể được tìm thấy ở đây /

Tôi đã thực hiện nghiên cứu khá tốt, hoặc vì vậy tôi đã nghĩ, cố gắng hiểu khái niệm, hoạt động đằng sau nó, kết quả kiểm tra thực sự có ý nghĩa gì và / hoặc phải làm gì với kết quả kiểm tra; tuy nhiên dường như không ai từng mạo hiểm vào khu vực đó.

Tôi không chắc ý của bạn là gì

Tôi có thể đề xuất một số cuốn sách, như Số liệu thống kê phi thực tế của Conover , và nếu bạn có thể lấy nó, cuốn sách của Neave và Worthington ( Bài kiểm tra không phân phối ), nhưng có nhiều cuốn khác - Marascuilo & McSweeney, Hollander & Wolfe, hoặc cuốn sách của Daniel chẳng hạn. Tôi đề nghị bạn nên đọc ít nhất 3 hoặc 4 trong số những cuốn nói với bạn tốt nhất, tốt nhất là những cuốn giải thích mọi thứ khác nhau nhất có thể (điều này có nghĩa là ít nhất là đọc một ít trong số 6 hoặc 7 cuốn sách để tìm ra 3 điều phù hợp).

Vì mục đích đơn giản, hãy gắn bó với bài kiểm tra Mann Whitney U, điều mà tôi nhận thấy là khá phổ biến

Đó là, điều khiến tôi bối rối về câu nói của bạn "dường như không ai từng mạo hiểm vào khu vực đó" - nhiều người sử dụng các bài kiểm tra này đã 'mạo hiểm vào khu vực' mà bạn đang nói đến.

- và dường như cũng bị lạm dụng và lạm dụng

Tôi muốn nói rằng các xét nghiệm không theo dõi thường được sử dụng nếu có bất cứ điều gì (bao gồm cả Wilcoxon-Mann-Whitney) - đặc biệt nhất là các xét nghiệm hoán vị / ngẫu nhiên, mặc dù tôi không nhất thiết phải tranh luận rằng chúng thường xuyên bị lạm dụng (nhưng cũng là các xét nghiệm tham số nhiều hơn như vậy).

Giả sử tôi chạy thử nghiệm không tham số với dữ liệu của mình và tôi nhận lại kết quả này:

[bắn tỉa]

Tôi quen thuộc với các phương pháp khác, nhưng có gì khác ở đây?

Những phương pháp khác có nghĩa là gì? Bạn muốn tôi so sánh điều này với cái gì?

Chỉnh sửa: Bạn đề cập đến hồi quy sau; Tôi giả sử rằng bạn đã quen thuộc với thử nghiệm t hai mẫu (vì đây thực sự là một trường hợp hồi quy đặc biệt).

Theo các giả định cho thử nghiệm t hai mẫu thông thường, giả thuyết null cho rằng hai quần thể giống hệt nhau, chống lại sự thay thế mà một trong các phân phối đã thay đổi. Nếu bạn nhìn vào bộ đầu tiên trong hai giả thuyết về Wilcoxon-Mann-Whitney dưới đây, điều cơ bản đang được thử nghiệm ở đó gần như giống hệt nhau; chỉ là thử nghiệm t dựa trên giả định các mẫu đến từ các phân phối bình thường giống hệt nhau (ngoài khả năng dịch chuyển vị trí). Nếu giả thuyết null là đúng và các giả định kèm theo là đúng, thì thống kê kiểm tra có phân phối t. Nếu giả thuyết thay thế là đúng, thì thống kê kiểm tra có nhiều khả năng lấy các giá trị không phù hợp với giả thuyết null nhưng có vẻ phù hợp với giải pháp thay thế - chúng tôi tập trung vào điều bất thường nhất,

Tình huống rất giống với Wilcoxon-Mann-Whitney, nhưng nó đo độ lệch so với null có phần khác nhau. Trong thực tế, khi các giả định của bài kiểm tra t là đúng *, thì nó gần như là bài kiểm tra tốt nhất có thể (đó là bài kiểm tra t).

* (trong thực tế là không bao giờ, mặc dù điều đó không thực sự nhiều vấn đề như nó có vẻ)

ww dưới null và thay thế

Thật vậy, có thể coi Wilcoxon-Mann-Whitney là "thử nghiệm t" được thực hiện trên hàng ngũ dữ liệu - mặc dù sau đó nó không có phân phối t; thống kê là một hàm đơn điệu của thống kê t hai mẫu được tính trên các cấp bậc của dữ liệu, do đó, nó tạo ra thứ tự tương tự ** trên không gian mẫu (đó là "kiểm tra t" trên các cấp bậc - được thực hiện một cách thích hợp - sẽ tạo ra các giá trị p giống như Wilcoxon-Mann-Whitney), vì vậy nó từ chối chính xác các trường hợp tương tự.

** (đúng, đặt hàng một phần, nhưng hãy để nó qua một bên)

[Bạn sẽ nghĩ rằng chỉ cần sử dụng các cấp bậc sẽ làm mất đi rất nhiều thông tin, nhưng khi dữ liệu được rút ra từ các quần thể bình thường có cùng phương sai, hầu như tất cả thông tin về dịch chuyển vị trí đều nằm trong mô hình của các cấp bậc. Các giá trị dữ liệu thực tế (có điều kiện trên hàng ngũ của chúng) thêm rất ít thông tin bổ sung vào đó. Nếu bạn đi đuôi nặng hơn bình thường, không lâu trước khi thử nghiệm Wilcoxon-Mann-Whitney có sức mạnh tốt hơn, cũng như giữ được mức ý nghĩa danh nghĩa của nó, do đó, thông tin 'thêm' trên hàng ngũ cuối cùng sẽ không chỉ là không chính xác mà còn ở một số ý thức, gây hiểu lầm. Tuy nhiên, đuôi nặng gần đối xứng là một tình huống hiếm gặp; những gì bạn thường thấy trong thực tế là sự lệch lạc.]

Các ý tưởng cơ bản khá giống nhau, các giá trị p có cùng cách hiểu (xác suất kết quả là, hoặc cực đoan hơn, nếu giả thuyết null là đúng) - ngay đến cách giải thích dịch chuyển vị trí, nếu bạn thực hiện các giả định cần thiết (xem phần thảo luận về các giả thuyết gần cuối bài này).

Nếu tôi thực hiện mô phỏng giống như trong các ô trên cho phép thử t, các ô sẽ trông rất giống nhau - tỷ lệ trên các trục x và y sẽ trông khác nhau, nhưng bề ngoài cơ bản sẽ giống nhau.

Chúng ta có nên muốn giá trị p thấp hơn 0,05 không?

Bạn không nên "muốn" bất cứ điều gì ở đó. Ý tưởng là tìm hiểu xem các mẫu có khác nhau hơn (theo nghĩa địa điểm) hơn là có thể được giải thích một cách tình cờ, không phải là 'mong muốn' một kết quả cụ thể.

Nếu tôi nói "Bạn có thể đi xem xe của Raj có màu gì không?", Nếu tôi muốn một đánh giá khách quan về nó, tôi không muốn bạn đi "Man, tôi thực sự, thực sự hy vọng nó có màu xanh! Nó chỉ được màu xanh da trời". Tốt nhất là chỉ xem tình huống là gì, thay vì đi vào một số 'Tôi cần nó là một cái gì đó'.

Nếu mức ý nghĩa được chọn của bạn là 0,05, thì bạn sẽ từ chối giả thuyết khống khi giá trị p dưới 0,05. Nhưng việc không từ chối khi bạn có cỡ mẫu đủ lớn để gần như luôn luôn phát hiện các kích cỡ hiệu ứng có liên quan ít nhất là thú vị, bởi vì nó nói rằng bất kỳ sự khác biệt nào tồn tại đều nhỏ.

Số "mann whitley" có nghĩa là gì?

Thống kê Mann-Whitney .

Nó thực sự chỉ có ý nghĩa so với phân phối các giá trị mà nó có thể nhận được khi giả thuyết null là đúng (xem sơ đồ trên) và điều đó phụ thuộc vào định nghĩa cụ thể nào mà bất kỳ chương trình cụ thể nào có thể sử dụng.

Có sử dụng cho nó?

Thông thường, bạn không quan tâm đến giá trị chính xác như vậy, nhưng nó nằm ở đâu trong phân phối null (cho dù đó là ít nhiều điển hình của các giá trị bạn sẽ thấy khi giả thuyết null là đúng hay không, hay nó cực hơn)

P(X<Y)

Dữ liệu này ở đây chỉ xác minh hay không xác minh rằng một nguồn dữ liệu cụ thể mà tôi có nên hay không nên sử dụng?

Thử nghiệm này không nói gì về "một nguồn dữ liệu cụ thể mà tôi nên hoặc không nên sử dụng".

Xem thảo luận của tôi về hai cách nhìn vào các giả thuyết WMW dưới đây.

Tôi có một lượng kinh nghiệm hợp lý với hồi quy và những điều cơ bản, nhưng tôi rất tò mò về thứ không đặc biệt "đặc biệt" này

Không có gì đặc biệt về các bài kiểm tra không tham số (tôi muốn nói các bài kiểm tra 'tiêu chuẩn' theo nhiều cách thậm chí còn cơ bản hơn các bài kiểm tra tham số điển hình) - miễn là bạn thực sự hiểu về kiểm tra giả thuyết.

Đó có lẽ là một chủ đề cho một câu hỏi khác, tuy nhiên.


Có hai cách chính để xem xét thử nghiệm giả thuyết Wilcoxon-Mann-Whitney.

i) Một là nói "Tôi quan tâm đến dịch chuyển vị trí - đó là theo giả thuyết khống, hai quần thể có cùng phân phối (liên tục) , chống lại sự thay thế là một thay đổi 'tăng hoặc giảm' so với thay thế khác "

Wilcoxon-Mann-Whitney hoạt động rất tốt nếu bạn đưa ra giả định này (rằng sự thay thế của bạn chỉ là một sự thay đổi vị trí)

Trong trường hợp này, Wilcoxon-Mann-Whitney thực sự là một thử nghiệm cho các trung vị ... nhưng cũng là một thử nghiệm về phương tiện, hoặc thực sự là bất kỳ thống kê tương đương vị trí nào khác (ví dụ, phần trăm thứ 90, hoặc phương tiện cắt xén, hoặc bất kỳ số nào những thứ khác), vì tất cả chúng đều bị ảnh hưởng theo cùng một cách bởi sự thay đổi vị trí.

Điều hay ho về điều này là nó rất dễ hiểu - và thật dễ dàng để tạo ra khoảng tin cậy cho sự thay đổi vị trí này.

thay đổi vị trí

Tuy nhiên, xét nghiệm Wilcoxon-Mann-Whitney nhạy cảm với các loại khác biệt hơn là thay đổi vị trí.

1212

thay đổi P (X <Y) từ 1/2


Tôi đã vẽ phân phối null gần đúng (một màu đỏ trong biểu đồ trên cùng mới) như thể nó liên tục ... nhưng phân phối thực tế là rời rạc. Hình ảnh ít lộn xộn theo cách đó.
Glen_b -Reinstate Monica

3
+1 Câu trả lời tuyệt vời. Một trong những lời giải thích tốt nhất và dễ tiếp cận nhất về bài kiểm tra Wilcoxon-Mann-Whitney mà tôi biết. Cảm ơn bạn.
COOLSerdash

"Trong trường hợp này, Wilcoxon-Mann-Whitney thực sự là một thử nghiệm cho trung vị ... nhưng cũng không phải là thử nghiệm cho phương tiện" Tuy nhiên, một số phân phối không có nghĩa là trong khi trung vị của chúng được xác định rõ (ví dụ Cauchy).
caracal

@caracal Mặc dù đúng (đó là một điểm tôi đã thực hiện một số lần ở đây), nếu ai đó kiểm tra sự bình đẳng của dân số có nghĩa là, có lẽ họ đã cho rằng họ có nghĩa là dân số là hữu hạn. Nếu họ không, họ có một vấn đề tốt trước khi họ đến điểm chọn một bài kiểm tra. Giả sử rằng có một giả thuyết về các phương tiện dân số bằng nhau (và do đó là hữu hạn), theo các giả định tương tự thường được sử dụng để biến nó thành một thử nghiệm về trung vị (thay thế thay thế), WMW cũng là một thử nghiệm về phương tiện.
Glen_b -Reinstate Monica

17

Giả sử bạn và tôi đang huấn luyện các đội theo dõi. Các vận động viên của chúng tôi đến từ cùng một trường, có cùng độ tuổi và cùng giới tính (nghĩa là họ được rút từ cùng một dân số), nhưng tôi khẳng định đã phát hiện ra một Hệ thống đào tạo mới mang tính cách mạng sẽ giúp các thành viên trong đội của tôi chạy nhanh hơn nhiều của bạn. Làm thế nào tôi có thể thuyết phục bạn rằng nó thực sự làm việc?

Chúng tôi có một cuộc đua.

Sau đó, tôi ngồi xuống và tính thời gian trung bình cho các thành viên trong nhóm của tôi và thời gian trung bình cho các thành viên của bạn. Tôi sẽ tuyên bố chiến thắng nếu thời gian trung bình cho các vận động viên của tôi không chỉ nhanh hơn thời gian trung bình của bạn, mà sự khác biệt cũng lớn so với "độ phân tán", hoặc độ lệch chuẩn của kết quả của chúng tôi.


t


"Nhưng Matt", bạn phàn nàn, "điều này không công bằng lắm. Các đội của chúng tôi khá giống nhau, nhưng bạn - do cơ hội thuần túy - đã kết thúc với người chạy nhanh nhất trong quận. Anh ấy không ở cùng một giải đấu như mọi người Mặt khác, anh ấy thực sự là một kẻ lập dị của Tự nhiên. Anh ấy đã hoàn thành 3 phút trước khi hoàn thành nhanh nhất tiếp theo, điều này làm giảm thời gian trung bình của bạn rất nhiều, nhưng các đối thủ còn lại khá hỗn tạp. Thay vào đó, hãy nhìn vào thứ tự kết thúc. thực sự hoạt động, những người hoàn thành trước đó chủ yếu là từ đội của bạn, nhưng nếu nó không phải là thứ tự kết thúc sẽ khá ngẫu nhiên. Điều này không mang lại trọng lượng quá đáng cho siêu sao của bạn! "


t

p

ttt


Bạn thực sự đã trả lời chính xác câu hỏi của tôi, và ý tôi là chính xác, cách tôi muốn nó được trả lời. Glen nghiêng về phía toán học nhiều hơn nữa, và sự kết hợp của hai phản ứng này đã tạo ra nhấp chuột cho tôi. Mặc dù vậy, tôi không thể nhận phần thưởng từ anh ấy - ý tôi là ... anh ấy đang vẽ đồ thị, bất chấp sự rõ ràng của câu trả lời của bạn. Tôi có cảm giác bạn đã có một số loại công việc giảng dạy trong quá khứ. Tôi biết có thể có một số khái quát trong các câu trả lời ở đây, nhưng tôi biết rằng tôi đã không phải mua một cuốn sách và nghiên cứu nó một cách mạnh mẽ để bắt đầu thực tế có thể áp dụng phi thông số ở một mức độ nào đó
Taal

t

Điều trớ trêu cho tất cả những điều này là tôi hoàn toàn không sử dụng nó, điều đó chỉ khiến tôi bận tâm rằng tôi không thể nhận được câu trả lời thẳng về nó là gì. Câu trả lời của Glen nhiều hơn tôi mong đợi và có được ban đầu - những câu trả lời hay nhất tôi cảm thấy không thể mô tả vì bất kỳ mô tả nào sẽ chứng minh không đầy đủ. Giống như nói với ai đó màu xanh trông như thế nào. Nếu bạn đã đọc bất kỳ nội dung nào của whuber, có vẻ như bạn có thể có một hương vị tương tự ...
Taal


6

Bạn yêu cầu được sửa nếu sai. Dưới đây là một số nhận xét dưới tiêu đề đó để bổ sung cho các đề xuất tích cực của @Peter Flom.

  • "Không tham số dựa vào trung vị thay vì trung bình": thường trong thực tế, nhưng đó không phải là một định nghĩa. Một số xét nghiệm không tham số (ví dụ chi-vuông) không liên quan gì đến trung bình.

  • dựa vào mức độ tự do thay vì độ lệch chuẩn; Điều đó rất bối rối. Ý tưởng về mức độ tự do không có nghĩa là một sự thay thế cho độ lệch chuẩn; mức độ tự do như một ý tưởng áp dụng ngay trên thống kê.

  • "Một nguồn dữ liệu cụ thể mà tôi nên hoặc không nên sử dụng": câu hỏi này không liên quan gì đến bài kiểm tra quan trọng mà bạn đã áp dụng, đó chỉ là về sự khác biệt giữa các tập hợp dữ liệu và được đặt theo cụm từ khác biệt giữa các trung vị.


Tôi tin rằng bạn đưa tôi yêu cầu "được sửa chữa sai ở đâu" là câu trả lời tốt nhất cho đến nay. Tôi cho rằng tôi cần một vài giả thuyết khống đã bác bỏ hoặc tìm hiểu theo quá trình loại bỏ. Phản hồi của bạn đã cho tôi thông tin mới mà tôi hiểu - vẫn còn một số lỗ hổng lớn trong cách hiểu về chủ đề này, nhưng tôi không thể mong đợi sự hoàn hảo. Có lẽ những lỗ hổng đó lớn hơn tôi dự đoán ban đầu khi viết câu hỏi này và stackexchange sẽ không đủ, cho dù tôi có "trò chuyện" như thế nào đi chăng nữa.
Taal

4

Bạn "muốn" những điều tương tự từ giá trị p ở đây mà bạn muốn trong bất kỳ thử nghiệm nào khác.

Thống kê U là kết quả của một phép tính, giống như thống kê t, tỷ lệ chênh lệch, thống kê F hoặc những gì có bạn. Công thức có thể được tìm thấy rất nhiều nơi. Nó không trực quan lắm, nhưng sau đó, không phải là số liệu thống kê kiểm tra khác cho đến khi bạn quen với chúng (chúng tôi nhận ra ở mức 2 là trong phạm vi quan trọng bởi vì chúng tôi luôn thấy chúng).

Phần còn lại của đầu ra trong văn bản khối của bạn phải rõ ràng.

Để có phần giới thiệu tổng quát hơn về các bài kiểm tra không tham số, tôi lặp lại @NickCox .... hãy lấy một cuốn sách hay. Không tham số đơn giản có nghĩa là "không có tham số"; có nhiều thử nghiệm và thống kê phi tham số cho nhiều mục đích khác nhau.


Vâng, lý tưởng, một cuốn sách tốt sẽ giúp; tuy nhiên, dường như không cần thiết với các tài nguyên ngày nay (như stackexchange), wikipedia (đôi khi), cạnh tranh thị trường youtube (bạn có biết với mỗi triệu lượt xem ai đó sẽ được trả 4000 đô la không?), cũng như nhiều loại tài nguyên khác. Tôi nói chung, giống như cách học của tôi, cũng thất bại khá nhiều khi học sách đơn giản.
Taal

1
Tôi đánh giá cao bài viết của bạn, tuy nhiên nó thực sự đã nhắc lại hầu hết những gì tôi đã biết hoặc không may giả định. Dường như có một số kiểu mẫu mà hầu như mọi lời giải thích tôi nhận được đều dừng lại ở một điểm cụ thể này. Có lẽ điểm này là nơi nó trở nên quá phức tạp để giải thích hoặc quá nhiều nỗ lực - tôi không chắc chắn. Dù bằng cách nào, đó là một mô hình mà tôi đã trải nghiệm từ mọi nguồn thông tin tôi thường sử dụng - điều này sẽ mỉa mai nhắc lại tuyên bố về sách của mọi người. Có lẽ tôi đã không nhận ra câu trả lời quá phức tạp; sau đó một lần nữa tôi đã thấy một số câu trả lời mãnh liệt về SE.
Taal

2
Đầu tiên bạn yêu cầu chúng tôi đơn giản hóa, sau đó bạn phàn nàn rằng câu trả lời của chúng tôi rất đơn giản! Nếu bạn muốn hiểu công thức cho U (hoặc bất cứ điều gì khác) HÃY NHÌN nó. Nếu bạn muốn một cái gì đó đơn giản, thì đừng yêu cầu sự phức tạp! Mục nhập Wikipedia là một mục xuất sắc, chi tiết với tất cả các chi tiết. Bạn không hiểu nó. Vì thế. Bạn muốn gì?
Peter Flom - Tái lập Monica

1
Tôi cho rằng một nơi nào đó ở giữa. Tôi thừa nhận không phải là người giỏi nhất trong giao tiếp, và tôi có thể hiểu bạn đang thất vọng, heh. Đó là một đặc điểm của tôi mà tôi thực sự nhận thức được. Thành thật mà nói, tôi nghĩ rằng tôi sẽ phải suy nghĩ về những gì tôi thực sự muốn - vì gần như tôi đang cố gắng đẩy câu hỏi đủ để nó nằm ở đâu trong khu vực mà tôi không biết hoặc trước đây không biết trong khoảng. Thật khó để hỏi về những điều bạn không hiểu nói chung. Tôi sẽ phải quay lại vấn đề này.
Taal

1

Như một phản ứng với câu hỏi đóng gần đây , điều này cũng giải quyết ở trên. Dưới đây là một trích dẫn từ các thử nghiệm thống kê phân phối miễn phí phân phối cổ điển của Bradley (năm 1968, trang 15 cạn16), trong khi hơi dài, là một lời giải thích khá rõ ràng, tôi tin.

Các thuật ngữ không theo tỷ lệ và không phân phối không đồng nghĩa với nhau, và nonterm cung cấp một mô tả hoàn toàn thỏa đáng về loại thống kê mà chúng dự định tham khảo. Nói một cách đơn giản, một bài kiểm tra không tham số là một giả thuyết không đưa ra giả thuyết về giá trị của một tham số trong một hàm mật độ thống kê, trong khi thử nghiệm không phân phối là một thử nghiệm không đưa ra giả định nào về hình thức chính xác của dân số được lấy mẫu. Các định nghĩa không loại trừ lẫn nhau và một thử nghiệm có thể là không phân phối và tham số. Để có thể hoàn toàn rõ ràng về ý nghĩa của phân phối miễn phí, cần phân biệt giữa ba phân phối: (a) dân số lấy mẫu; (b) đặc tính quan sát thực tế được sử dụng trong thử nghiệm; và (c) của thống kê kiểm tra. Phân phối mà từ đó các bài kiểm tra là "miễn phí" là của (a), dân số được lấy mẫu. Và sự tự do mà họ được hưởng thường là tương đối. Tuy nhiên, các giả định không bao giờ phức tạp đến mức ám chỉ một dân số có phân phối hoàn toàn cụ thể. Lý do Lý rất đơn giản: độ lớn không được sử dụng như vậy trong thử nghiệm [không đối xứng], cũng không phải là bất kỳ thuộc tính dân số được liên kết mạnh mẽ khác của phương sai. Thay thế cũng không phải là bất kỳ thuộc tính dân số được liên kết mạnh mẽ khác của phương sai. Thay thế cũng không phải là bất kỳ thuộc tính dân số được liên kết mạnh mẽ khác của phương sai. Thay thếmẫu -linked charachteristics của quan sát thu được ... cung cấp các informatikon sử dụng bởi các kiểm định thống kê. ... Vì vậy trong khi cả hai bài kiểm tra tham số và phi tham đòi hỏi rằng hình thức f một phân phối, kết hợp với quan sát, được biết đầy đủ, kiến thức đó, trong trường hợp tham số, Do đó, nói chung không phải là quảng cáo sắp tới, phân phối cường độ cần thiết phải được "giả định" hoặc suy ra trên cơ sở thông tin gần đúng hoặc không đầy đủ. Trong trường hợp không tham số, mặt khác và, sự phân biệt của đặc tính quan sátthường được biết chính xác từ những cân nhắc tiên nghiệm và do đó, không cần phải "giả định". Sự khác biệt, sau đó, không phải là một trong những yêu cầu mà là những gì được yêu cầu và chắc chắn rằng yêu cầu sẽ được đáp ứng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.