Làm thế nào để kiểm tra sự khác biệt giữa các trung vị của nhiều mặt hàng Likert?


8

Trong một nghiên cứu câu hỏi, chúng tôi đã yêu cầu người trả lời bày tỏ thái độ của họ đối với các yếu tố khí hậu mùa đông khác nhau như tuyết, trơn trượt có thể ảnh hưởng đến sự lựa chọn của họ để đi bộ và đạp xe đi làm. Mẫu bao gồm 500 cá nhân và câu trả lời ở dạng 5 thang đánh giá từ rất âm đến rất dương (thang đo thứ tự).

Nếu tôi muốn so sánh các câu trả lời với các câu hỏi khác nhau, tôi đoán trung vị là một công cụ thích hợp vì dữ liệu là thứ tự. Tôi biết rằng để so sánh có nghĩa là có các thử nghiệm thống kê khác nhau để chỉ ra nếu xác suất chênh lệch là đáng kể (thử nghiệm t hoặc thử nghiệm không tham số ..). Nhưng tôi hơi bối rối nếu tôi có thể sử dụng các thử nghiệm này trên loại dữ liệu tôi đã giải thích ở đây.

  • Có một số liệu thống kê kiểm tra để sử dụng để so sánh trung bình?
  • Hoặc tôi nên chuyển dữ liệu sang thang đo khoảng nếu nó phù hợp?

Câu trả lời:


4

Tôi thấy giá trị trung bình là một chỉ báo hữu ích hơn nhiều về xu hướng trung tâm của các mặt hàng Likert so với trung vị. Tôi đã giải thích về lập luận của mình ở đây về một câu hỏi hỏi về việc nên sử dụng giá trị trung bình hay trung bình cho các mục Likeert .

Một bản tóm tắt một số trong những lý do sau:

  • Có nghĩa là nhiều thông tin hơn; trung vị là quá thô cho các mặt hàng Likert. Ví dụ: trung vị của 1 1 3 3 3giống như 3 3 3 5 5(nghĩa là 3) nhưng giá trị trung bình phản ánh sự khác biệt.
  • Các mục Likert thường được đặt theo cách mà khoảng cách bằng nhau giữa các giả định danh mục là điểm bắt đầu hữu ích.
  • Ngay cả khi các câu trả lời riêng lẻ rời rạc, phép đo ở cấp độ nhóm tiếp cận liên tục (với 500 người và thang điểm 5, giá trị trung bình của bạn có thể mang 500 * 4 + 1 = 2001các giá trị khác nhau)
  • Có rất ít tranh cãi rằng một tỷ lệ phần trăm là một bản tóm tắt hữu ích trong các câu hỏi loại không có (ví dụ: bỏ phiếu). Đây chỉ là ý nghĩa nơi các câu trả lời đã được mã hóa 0 and 1. Đối xử với thang điểm Likeert 5 điểm 1 2 3 4 5dường như là điều tự nhiên đối với tôi.
  • Các tỷ lệ hợp lý khác của các mục Likert có thể sẽ không thay đổi suy luận về việc có tồn tại sự khác biệt giữa các phương tiện hay không (nhưng bạn có thể kiểm tra điều này).

Nếu bạn bị thuyết phục rằng giá trị trung bình là thước đo thích hợp của xu hướng trung tâm, thì bạn sẽ muốn cấu trúc các bài kiểm tra giả thuyết của mình để chúng kiểm tra sự khác biệt giữa các phương tiện. Một thử nghiệm t mẫu được ghép nối sẽ cho phép so sánh các phương tiện theo cặp, nhưng sẽ có những vấn đề xoay quanh độ chính xác của các giá trị p khi phân phối lỗi rời rạc và không bình thường. Tuy nhiên, việc áp dụng một phương pháp không tham số không phải là một giải pháp, bởi vì nó thay đổi giả thuyết.

Tôi hy vọng rằng thử nghiệm t-sample mẫu được ghép nối sẽ khá mạnh mẽ ít nhất là đối với mặt hàng Likert điển hình có nghĩa là tránh được cực đoan trên thang đo, nhưng tôi không có bất kỳ nghiên cứu mô phỏng nào trong tay.


2

Nói chung, tôi đồng ý với lập luận của Jeromy rằng giá trị trung bình là một thống kê hợp lý cho thang đo Likert. Những gì có thể nói cho trung vị, là trung vị là một thước đo vị trí mạnh mẽ hơn nhiều vì nó bảo vệ chống lại các ngoại lệ (nó có điểm phá vỡ cao nhất có thể là 50%). Tuy nhiên, vì thang đo Likert là thang đo giới hạn, khả năng các ngoại lệ cực đoan là rất thấp (chỉ khi dữ liệu của bạn bị lệch rất nhiều). Hơn nữa, trung vị thường cắt quá nhiều từ dữ liệu, vì vậy bạn có thể xem xét sử dụng các phương tiện cắt xén thay thế. Một số lượng 20% ​​cắt tỉa thường được đề nghị [1].

Nếu bạn muốn tính toán một phép thử ghép đôi về sự khác biệt của trung vị, tôi khuyên bạn nên so sánh các phương tiện bằng cách sử dụng phương pháp bootstrap phần trăm (đây là phương pháp duy nhất để so sánh các trung vị hoạt động tốt trong trường hợp giá trị được gắn, xem Wilcox, 2005 [ 1]).

Trong gói WRS cho R, có một hàm được gọi là trimpb2phép tính này cho hai mẫu độc lập (bạn cũng có thể tính giá trị ap cho phương tiện trimmend với hàm đó). Tuy nhiên, trong trường hợp của bạn, bạn cần so sánh các nhóm phụ thuộc. Trong trường hợp này, bạn cũng có thể thực hiện phương pháp bootstrap phần trăm được điều chỉnh theo độ lệch [2].

Tuy nhiên, lưu ý rằng sự khác biệt của các trung vị của các phân phối biên không giống như nhìn vào trung vị của các điểm khác biệt. Câu hỏi đầu tiên trả lời câu hỏi 'Phản ứng điển hình của nhóm thứ nhất khác với nhóm thứ hai như thế nào và được thực hiện bởi chức năng WRS rmmcppb. Câu hỏi thứ hai trả lời câu hỏi 'Điểm khác biệt điển hình' là gì và được thực hiện bởi chức năng WRS rmmcppbd.

[1] Wilcox, RR (2005). Giới thiệu về ước tính mạnh mẽ và kiểm tra giả thuyết. San Diego: Nhà xuất bản học thuật.

[2] Wilcox, RR (2006). So sánh cặp của các nhóm phụ thuộc dựa trên trung bình. Thống kê tính toán & phân tích dữ liệu, 50, 2933-2941. doi: 10.1016 / j.csda.2005.04.017


0

Một lựa chọn để so sánh trung bình là kiểm tra hoán vị . Tuy nhiên, nếu bạn đang so sánh 2 câu trả lời được điền bởi cùng một nhóm người (dữ liệu được ghép nối) thì bạn cũng có thể muốn xem xét nghiệm của McNemar và các biến thể của nó.

Để giải thích một chút, ý tưởng của bài kiểm tra McNemar (và phần mở rộng của nó) là xem xét một ma trận với số lượng người trả lời đã chọn các kết hợp, do đó, một cá nhân sẽ đóng góp vào số lượng trong ô có cột được xác định bởi câu trả lời của họ cho câu hỏi 1 và hàng được xác định bởi câu trả lời của họ cho câu hỏi 2 (các lệnh bảng hoặc bảng chéo tạo ma trận). Các mô hình trong ma trận này có thể sẽ có nhiều thông tin hơn một trung bình hoặc trung bình đơn giản. Đường chéo đại diện cho những người trả lời giống nhau cho 2 câu hỏi, tam giác trên là những câu trả lời cao hơn ở câu hỏi thứ nhất so với câu hỏi thứ 2 và tam giác dưới khác biệt. Khoảng cách từ đường chéo cho thấy 2 câu trả lời khác nhau như thế nào. Biến thể trong bài kiểm tra McNemar xem xét số đếm trong 2 hình tam giác có khác nhau không, hoặc nếu ma trận đối xứng. Để tính đến tính chất thứ tự (so với danh nghĩa) của dữ liệu, khoảng cách từ đường chéo được tính đến.

Chỉ cần nhìn vào các mẫu trong bảng có thể đủ cho mục đích của bạn, nhưng nếu bạn cần một bài kiểm tra chính thức, thì bạn có thể thực hiện các bài kiểm tra được đề xuất hoặc thực hiện một số hình thức kiểm tra hoán vị (chính xác như thế nào phụ thuộc vào những gì bạn đang tìm kiếm hoặc cố gắng thể hiện).


3
Thử nghiệm của McNemar là cho dữ liệu danh nghĩa. Đối với dữ liệu thứ tự, như ở đây, mọi người thường chọn kiểm tra xếp hạng Wilcoxon hoặc kiểm tra ký hiệu (nhưng sức mạnh của thứ hai có xu hướng thấp).
whuber

Vấn đề với câu hỏi của Saeed là họ yêu cầu so sánh các trung vị có liên quan , không độc lập, không tin tưởng. Kiểm tra t- cặp mẫu, chúng tôi có thể nói nó, so sánh các phương tiện , bởi vì tử số của nó - giá trị trung bình của các trường hợp khác nhau - có cùng giá trị với sự khác biệt giữa hai phương tiện. Nhưng đối với trung vị, trung vị của sự khác biệt theo từng trường hợp không có giá trị tương đương với sự khác biệt giữa hai trung vị. Do đó, tôi nghi ngờ có tồn tại một thử nghiệm có thể được gọi chính xác là "thử nghiệm trung vị cho các mẫu được ghép nối".
ttnphns
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.