Hiển thị dữ liệu thông thường - Phương tiện, trung bình và xếp hạng trung bình


11

Tôi có một số dữ liệu thứ tự không được phân phối bình thường, vì vậy tôi quyết định thực hiện kiểm tra không tham số bằng cách sử dụng Thử nghiệm Mann-Whitney U. Tôi đang xem xét sự khác biệt giữa các nhóm cho bảy điểm - những điểm này là 0, 1, 2 hoặc 3 cho mỗi môn. Tôi đang có một thời gian khó khăn để tìm ra cách hiển thị dữ liệu của tôi!

Nếu tôi trình bày dữ liệu bằng cách sử dụng các giá trị trung bình (và IQR của các trung vị), thì không rõ ràng về sự khác biệt ở đâu vì phần lớn các trung vị rơi vào 0 hoặc 1. Vì vậy, mặc dù Thử nghiệm Mann-Whitney U cho thấy sự khác biệt đáng kể, cái bàn trông không thú vị

Tôi cũng có thể trình bày dữ liệu bằng các phương tiện . Có một số bài báo khoa học nói rằng bạn có thể sử dụng phương tiện với dữ liệu thứ tự, nhưng bạn không thể đưa ra cùng một loại giả định về sự khác biệt giữa các điểm số (ví dụ: sự khác biệt giữa 0 và 1 không giống nhau giữa 1 và 2). Sử dụng phương tiện sẽ gây tranh cãi một chút, mặc dù các con số trong bảng kể câu chuyện hay khi tôi sử dụng chúng.

Tùy chọn thứ ba đang sử dụng các cấp bậc trung bình mà SPSS mang lại cho tôi trong đầu ra của Mann-Whitney. Các cấp bậc trung bình là những gì đang được so sánh giữa các nhóm, vì vậy có lẽ tôi chỉ nên sử dụng chúng? Vấn đề duy nhất tôi gặp phải ở đây là thứ hạng trung bình không thực sự có ý nghĩa gì đối với dữ liệu thực tế (ví dụ: tôi không thể thấy các đối tượng gần với 3 hơn trong khi các điều khiển gần với 1 bằng cách sử dụng thứ hạng trung bình.)

Và một lựa chọn cuối cùng là thực hiện phân tích chi bình phương so sánh các đối tượng và kiểm soát sau khi chia điểm thành hai nhóm (0 và 1 cho thấp và 2 và 3 cho cao). Tuy nhiên, khi tôi làm điều này, sự khác biệt không được phát âm (có thể vì một số lý do).


Bạn đang hỏi về cách tốt nhất để trình bày dữ liệu của bạn trong văn bản, trong một bảng hoặc trong một hình?
gung - Phục hồi Monica

Cả văn bản và bảng. Trong văn bản tôi sẽ nói có sự khác biệt đáng kể giữa các nhóm trên một số thành phần của khảo sát giấc ngủ của tôi. Những khác biệt đó là thông qua một bài kiểm tra Mann-Whitney, vì vậy họ đang so sánh thứ hạng trung bình. Những gì tôi không biết là làm thế nào tôi nên trình bày những khác biệt này trong một bảng. Sử dụng trung bình không hoạt động vì chúng quá giống nhau và bạn không thể thấy sự khác biệt. Phương tiện hoạt động tốt hơn, nhưng có vẻ lạ khi sử dụng các biện pháp tham số trong một bảng nên nói về các trung vị không tham số. Và có nghĩa là các cấp bậc sẽ hoạt động, nhưng chúng không đại diện cho các giá trị thực tế.
Eric

1
Tôi tự hỏi liệu một số câu trả lời từ Biểu đồ cho mối quan hệ giữa hai biến số thứ tự có thể được điều chỉnh cho mục đích của bạn không? Các biểu đồ ví dụ cho thấy mối quan hệ giữa hai biến số với năm cấp độ, nhưng nếu bạn ví dụ so sánh hai nhóm và bạn có bốn cấp độ có thể, bạn có thể tưởng tượng lại một số hình ảnh đó là 4 nhân thay vì 5 nhân đôi thay vì 5 cấp 5, có lẽ.
Cá bạc

Nó có thể hữu ích nếu bạn có thể đăng một số dữ liệu ví dụ (có thể hoàn toàn không có thật), để những người muốn chứng minh một kỹ thuật có thể có một cái gì đó để làm việc.
Cá bạc

1
Theo định nghĩa của Eric, một thử nghiệm không theo tỷ lệ, cụ thể là Mann-Whitney, so sánh (đối với sự thống trị) hai phân phối nói chung, nó không so sánh một giá trị tham số cụ thể của phân phối, như trung bình hoặc trung bình. Không tồn tại một số duy nhất nào là đặc trưng của phân phối và đồng thời là những gì đang được so sánh, trong trường hợp này. Bạn có thể sử dụng công cụ ước tính 2 mẫu Hodges-Lehmann, nhưng đó là đặc điểm của sự khác biệt giữa hai phân phối và không phải của hai phân phối.
ttnphns 5/2/2015

Câu trả lời:


8

1,2,=3

Tính chính xác của việc sử dụng giá trị trung bình để tóm tắt các biến số thứ tự có thể hiếm khi đến từ chính dữ liệu. Đó là chủ quan.

Dxyγxy


1
Xin chào Frank, cảm ơn bạn đã phản hồi chu đáo. Nếu bạn không phiền, tôi có một vài câu hỏi tiếp theo. Về phương tiện - Tôi tin rằng các danh mục ít nhất có ý nghĩa nửa chừng, vì về cơ bản chúng đề cập đến "không, suy yếu nhẹ, trung bình và suy giảm nghiêm trọng". Có bất kỳ tài liệu tham khảo nào bạn biết rằng tôi có thể sử dụng làm tiền lệ cho việc này không? Tôi cũng ngần ngại sử dụng các phương tiện chỉ trong một bảng và trung bình trong các bảng khác vì mục đích nhất quán. VÀ cho thứ hạng trung bình - Tôi tin rằng tôi đang so sánh các nhóm - môn so với kiểm soát trên 7 điểm. Là so sánh xếp hạng trung bình có thể chấp nhận / hữu ích?
Eric

Đối với dữ liệu thứ tự số với một vài cấp độ, chẳng hạn như số lượng và có lẽ ví dụ về suy yếu của bạn, có nghĩa là hữu ích và trung bình thì không (vì có quá nhiều mối quan hệ). Có nhiều lần tôi đã sử dụng các phương tiện cho dữ liệu thứ tự và trung bình cho các dữ liệu liên tục bị lệch, trong cùng một bảng.
Frank Harrell
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.