Theo Fritz, Morris và Richler (2011; xem bên dưới), có thể được tính là kích thước hiệu ứng cho phép thử Mann-Whitney U bằng cách sử dụng công thức Điều này thuận tiện cho tôi, như tôi báo cáo cũng vào những dịp khác Tôi muốn báo cáo khoảng tin cậy cho ngoài thước đo kích thước hiệu ứng.
Đây là câu hỏi của tôi :
- Tôi có thể tính các khoảng tin cậy cho r như đối với r Pearson không, mặc dù nó được sử dụng như một thước đo kích thước hiệu ứng cho phép thử không đối xứng?
- Những khoảng tin cậy nào phải được báo cáo cho thử nghiệm một đầu so với hai đuôi?
Chỉnh sửa liên quan đến câu hỏi thứ hai: "Khoảng tin cậy nào phải được báo cáo cho thử nghiệm một đầu so với thử nghiệm hai đuôi?"
Tôi tìm thấy một số thông tin mà IMHO có thể trả lời câu hỏi này. "Trong khi giới hạn tin cậy hai mặt tạo thành một khoảng tin cậy, thì các đối tác một phía của chúng được gọi là giới hạn tin cậy thấp hơn hoặc cao hơn." ( http://en.wikipedia.org/wiki/Confidence_interval ). Từ thông tin này, tôi kết luận rằng đây không phải là vấn đề chính cho dù thử nghiệm quan trọng (ví dụ: -test) là một hoặc hai đuôi, nhưng thông tin nào người ta quan tâm đến CI về kích thước hiệu ứng. Kết luận của tôi (vui lòng sửa lại cho tôi nếu bạn không đồng ý):
- CI hai mặt quan tâm trên và cận dưới (do đó, nó có thể là một CI hai mặt đòi hỏi 0 mặc dù thử nghiệm một đuôi có ý nghĩa là p <0,05, đặc biệt là trong trường hợp giá trị là gần 0,05.)
- một chiều "CI" chỉ quan tâm trên hoặc thấp hơn giới hạn (do lập luận lý thuyết); tuy nhiên, đây không nhất thiết là câu hỏi quan tâm chính sau khi thử nghiệm một giả thuyết được định hướng. CI hai mặt là hoàn toàn phù hợp nếu trọng tâm là phạm vi có thể có của kích thước hiệu ứng. Đúng?
Xem bên dưới để biết đoạn văn bản từ Fritz, Morris, & Richler (2011) về ước tính kích thước hiệu ứng cho thử nghiệm Mann-Whitney từ bài viết tôi đề cập ở trên.
"Hầu hết các ước tính kích thước hiệu ứng mà chúng tôi đã mô tả ở đây đều cho rằng dữ liệu có phân phối bình thường. Tuy nhiên, một số dữ liệu không đáp ứng các yêu cầu của các thử nghiệm tham số, ví dụ, dữ liệu trên thang đo thứ tự nhưng không theo thang đo. thường chuyển sang các thử nghiệm thống kê không theo tỷ lệ, chẳng hạn như các thử nghiệm MannTHER Whitney và Wilcoxon. Tầm quan trọng của các thử nghiệm này thường được đánh giá thông qua việc phân phối các thống kê thử nghiệm cho phân phối khi kích thước mẫu không quá nhỏ và thống kê các gói, chẳng hạn như SPSS, chạy các thử nghiệm này báo cáo giá trị thích hợp bên cạnh các giá trị cho hoặc ;cũng có thể được tính bằng tay (ví dụ: Siegel & Castellan, 1988). Các giá trị có thể được sử dụng để tính toán kích thước thực tế, chẳng hạn như bởi Cohen (1988) đề xuất; Hướng dẫn của Cohen cho r là hiệu ứng lớn là 0,5, hiệu ứng trung bình là .3 và hiệu ứng nhỏ là .1 (Coolican, 2009, trang 395). Thật dễ dàng để tính , hoặc từ các giá trị này vì và
Các ước tính kích thước hiệu ứng này vẫn độc lập với kích thước mẫu mặc dù có sự hiện diện của N trong các công thức. Điều này là do z nhạy cảm với kích thước mẫu; chia cho hàm N sẽ loại bỏ ảnh hưởng của cỡ mẫu khỏi ước tính kích thước hiệu ứng tổng hợp. "(trang 12)