Số liệu thống kê cơ bản tốt để sử dụng cho dữ liệu thứ tự là gì?


67

Tôi có một số dữ liệu thứ tự thu được từ các câu hỏi khảo sát. Trong trường hợp của tôi, họ là những phản ứng theo kiểu Likert (Rất không đồng ý-Không đồng ý-Trung lập-Đồng ý-Rất đồng ý). Trong dữ liệu của tôi, chúng được mã hóa là 1-5.

Tôi không nghĩ có nghĩa là có ý nghĩa nhiều ở đây, vậy những thống kê tóm tắt cơ bản nào được coi là hữu ích?


2
Các lựa chọn phổ biến bao gồm - trung vị, chế độ, tỷ lệ hoặc tỷ lệ tích lũy trong mỗi nhóm
Glen_b

Câu trả lời:


29

Một bảng tần số là một nơi tốt để bắt đầu. Bạn có thể thực hiện đếm và tần suất tương đối cho mỗi cấp độ. Ngoài ra, tổng số và số lượng giá trị còn thiếu có thể được sử dụng.

Bạn cũng có thể sử dụng bảng dự phòng để so sánh hai biến cùng một lúc. Có thể hiển thị bằng cách sử dụng một âm mưu khảm.


32

Tôi sẽ tranh luận từ góc độ ứng dụng rằng giá trị trung bình thường là lựa chọn tốt nhất để tóm tắt xu hướng trung tâm của một mặt hàng Likert. Cụ thể, tôi đang nghĩ đến các bối cảnh như khảo sát sự hài lòng của sinh viên, thang đo nghiên cứu thị trường, khảo sát ý kiến ​​nhân viên, các mục kiểm tra tính cách và nhiều mục khảo sát khoa học xã hội.

Trong bối cảnh như vậy, người tiêu dùng nghiên cứu thường muốn câu trả lời cho các câu hỏi như:

  • Những tuyên bố có ít nhiều thỏa thuận liên quan đến những người khác?
  • Những nhóm nào đồng ý nhiều hay ít với một tuyên bố nhất định?
  • Theo thời gian, thỏa thuận đã tăng hay giảm?

Đối với những mục đích này, giá trị trung bình có một số lợi ích:

1. Có nghĩa là dễ tính toán:

  • Thật dễ dàng để thấy mối quan hệ giữa dữ liệu thô và giá trị trung bình.
  • Đó là thực tế dễ dàng để tính toán. Do đó, giá trị trung bình có thể dễ dàng được nhúng vào các hệ thống báo cáo.
  • Nó cũng tạo điều kiện so sánh giữa các bối cảnh và cài đặt.

2. Ý nghĩa tương đối được hiểu và trực quan:

  • Giá trị trung bình thường được sử dụng để báo cáo xu hướng trung tâm của các mặt hàng Likert. Do đó, người tiêu dùng nghiên cứu có nhiều khả năng hiểu ý nghĩa (và do đó tin tưởng nó, và hành động theo nó).
  • Một số nhà nghiên cứu thích tùy chọn, thậm chí còn trực quan hơn, tùy chọn báo cáo tỷ lệ phần trăm của mẫu trả lời 4 hoặc 5. Tức là, nó có cách giải thích tương đối trực quan về "thỏa thuận tỷ lệ phần trăm". Về bản chất, đây chỉ là một hình thức thay thế của trung bình, với 0, 0, 0, 1, 1mã hóa.
  • Ngoài ra, theo thời gian, người tiêu dùng nghiên cứu xây dựng các khung tham chiếu. Ví dụ: khi bạn so sánh hiệu suất giảng dạy của mình từ năm này sang năm khác hoặc qua các môn học, bạn xây dựng một ý nghĩa sắc thái về ý nghĩa của 3.7, 3.9 hoặc 4.1 cho thấy gì.

3. Giá trị trung bình là một số duy nhất:

  • Một số duy nhất đặc biệt có giá trị, khi bạn muốn đưa ra yêu cầu như "sinh viên hài lòng với Chủ đề X hơn Chủ đề Y".
  • Tôi cũng thấy rằng, theo kinh nghiệm, một con số thực sự là thông tin chính được quan tâm trong một mục Likert. Độ lệch chuẩn có xu hướng liên quan đến mức độ trung bình gần với điểm trung tâm (ví dụ: 3.0). Tất nhiên, theo kinh nghiệm, điều này có thể không áp dụng trong bối cảnh của bạn. Ví dụ, tôi đọc được ở đâu đó rằng khi xếp hạng You Tube có hệ thống sao, có một số lượng lớn xếp hạng thấp nhất hoặc cao nhất. Vì lý do này, điều quan trọng là kiểm tra tần số danh mục.

4. Nó không tạo ra nhiều khác biệt

  • Mặc dù tôi chưa chính thức kiểm tra nó, tôi sẽ đưa ra giả thuyết rằng với mục đích so sánh xếp hạng xu hướng trung tâm giữa các mặt hàng, hoặc nhóm người tham gia hoặc theo thời gian, bất kỳ lựa chọn hợp lý nào để tạo ra giá trị trung bình sẽ đưa ra kết luận tương tự.

4
Bài đăng hay! Bạn có suy nghĩ gì về việc các nền văn hóa / quốc gia khác nhau có thể sử dụng thang đo như thế nào sẽ tác động mạnh mẽ đến các loại kết quả này không?
Đuổi theo

@chase Có nghiên cứu về điều này, nhưng đã được một thời gian kể từ khi tôi xem nó. Dưới đây là một tìm kiếm mẫu trên học giả Google scholar.google.com.vn/au
Jeromy Anglim

Tôi đồng ý với biện minh ông Jeromy Anglim về việc sử dụng trung bình (ví dụ, trọng nghĩa là để được chính xác) là đáng tin cậy nhất không thiên vị giải thích mô tả nhiều hơn các biến phân loại ra lệnh như việc sử dụng thang Likert nơi mỗi người trong số các điểm dữ liệu góp phần vào việc trung bình cuối cùng.

3
Tôi đã hỏi câu hỏi về sự khác biệt
Jeromy Anglim

28

Đối với các bản tóm tắt cơ bản, tôi đồng ý rằng các bảng tần suất báo cáo và một số dấu hiệu về xu hướng trung tâm là ổn. Để suy luận, một bài báo gần đây được xuất bản trong PARE đã thảo luận về bài kiểm tra MWW, Bài kiểm tra Likert năm điểm: bài kiểm tra so với Mann-Whitney-Wilcoxon .

Để xử lý công phu hơn, tôi khuyên bạn nên đọc đánh giá của Agresti về các biến phân loại được đặt hàng:

Liu, Y và Agresti, A (2005). Phân tích dữ liệu phân loại theo thứ tự: Tổng quan và khảo sát các phát triển gần đây . Sociedad de Estadística e Investigación Operativa Test , 14 (1), 1-73.

Nó phần lớn vượt ra ngoài các số liệu thống kê thông thường, như mô hình dựa trên ngưỡng (ví dụ: tỷ lệ chênh lệch tỷ lệ) và đáng để đọc thay cho sách CDA của Agresti .

Dưới đây tôi cho thấy một hình ảnh của ba cách khác nhau để đối xử với một mặt hàng Likert; từ trên xuống dưới, chế độ xem "tần số" (danh nghĩa), chế độ xem "số" và chế độ xem "xác suất" ( Mô hình tín dụng một phần ):

văn bản thay thế

Dữ liệu đến từ Sciencedữ liệu trong ltmgói, trong đó mục liên quan đến công nghệ ("Công nghệ mới không phụ thuộc vào nghiên cứu khoa học cơ bản", với phản ứng "không đồng ý mạnh mẽ" với "đồng ý mạnh mẽ", trên thang điểm bốn)


14

Thực tiễn thông thường là sử dụng tổng xếp hạng thống kê không tham sốthứ hạng trung bình để mô tả dữ liệu thứ tự.

Đây là cách họ làm việc:

Xếp hạng tổng

  • chỉ định một cấp bậc cho mỗi thành viên trong mỗi nhóm;

  • ví dụ: giả sử bạn đang xem xét các mục tiêu cho mỗi cầu thủ ở hai đội bóng đối nghịch, sau đó xếp hạng từng thành viên trên cả hai đội từ đầu đến cuối;

  • tính tổng xếp hạng bằng cách thêm các cấp bậc cho mỗi nhóm ;

  • độ lớn của tổng xếp hạng cho bạn biết các cấp bậc gần nhau như thế nào

Có nghĩa là thứ hạng

M / R là một thống kê phức tạp hơn R / S vì nó bù cho các kích thước không đồng đều trong các nhóm bạn đang so sánh. Do đó, ngoài các bước trên, bạn chia mỗi khoản tiền cho số lượng thành viên trong nhóm.

Ví dụ, khi bạn có hai thống kê này, bạn có thể kiểm tra tổng thứ hạng để xem sự khác biệt giữa hai nhóm có ý nghĩa thống kê hay không (tôi tin rằng đó là phép thử tổng thứ hạng Wilcoxon , có thể hoán đổi cho nhau, nghĩa là về mặt chức năng tương đương với bài kiểm tra Mann-Whitney U).

Hàm R cho các thống kê này (dù sao tôi cũng biết):

wilcox.test trong bản cài đặt R tiêu chuẩn

nghĩa là trong gói cranks


3

Dựa trên bản tóm tắt Bài viết này có thể hữu ích để so sánh một số biến có thang đo Likert. Nó so sánh hai loại thử nghiệm so sánh nhiều không tham số: Một loại dựa trên cấp bậc và một loại dựa trên thử nghiệm của Chacko. Nó bao gồm các mô phỏng.


Hiện tại, điều này gần như là một bình luận, @PeterFlom. Mặc dù thư viện kỹ thuật số ACM có lẽ ít bị ảnh hưởng bởi liên kết thối, bạn có phiền khi nói điều gì đó về bài viết này không, có lẽ là tiền đề của thông tin hữu ích mà nó cung cấp?
gung - Tái lập Monica

2
Xin chào @gung Tôi không chắc chắn nơi để bình luận trong chuỗi dài này. Tôi đã thêm trích dẫn ở đây vì câu hỏi được đăng ngày hôm nay đã bị đóng và bài viết này có vẻ hữu ích (và bao gồm các vấn đề tôi chưa từng thấy ở nơi khác)
Peter Flom - Rebstate Monica

2

Tôi thường thích sử dụng cốt truyện khảm. Bạn có thể tạo chúng bằng cách kết hợp các đồng biến quan tâm khác (chẳng hạn như: giới tính, các yếu tố phân tầng, v.v.)


2

Tôi đồng ý với đánh giá của Jeromy Anglim. Hãy nhớ rằng các phản hồi của Likert là ước tính - bạn không sử dụng thước đo hoàn toàn đáng tin cậy để đo lường một đối tượng vật lý có kích thước ổn định. Giá trị trung bình là một biện pháp mạnh mẽ khi sử dụng cỡ mẫu hợp lý.

Trong nghiên cứu và phát triển sản phẩm và kinh doanh, giá trị trung bình là số liệu thống kê phổ biến nhất được sử dụng với thang đo Likert. Khi sử dụng thang đo Likert tôi thường chọn một biện pháp lý tưởng phù hợp với câu hỏi nghiên cứu. Chẳng hạn, nếu bạn đang nói về "sở thích" hoặc "thái độ", bạn có thể sử dụng nhiều chỉ số dựa trên Likert, với mỗi chỉ số cung cấp cái nhìn sâu sắc hơi khác nhau.

Để đánh giá câu hỏi "mọi người trong phân khúc phản ứng thế nào với việc cung cấp dịch vụ ", tôi có thể xem xét (1) trung bình số học, (2) trung bình chính xác, (3) phần trăm phản ứng có lợi nhất (hộp trên cùng), (4)% hai hộp trên cùng, (5) tỷ lệ của hai hộp trên cùng với hai hộp dưới cùng, (6) tỷ lệ phần trăm trong các hộp tầm trung ... vv Mỗi biện pháp cho một phần khác nhau của câu chuyện. Trong một dự án rất quan trọng, tôi sử dụng nhiều chỉ số dựa trên Likert. Tôi cũng sẽ sử dụng nhiều chỉ báo với các mẫu nhỏ và khi một tab chéo cụ thể có cấu trúc "thú vị" hoặc có vẻ giàu thông tin. Ahhh ... nghệ thuật thống kê.iX


1

"Điểm số hộp" thường được sử dụng để tóm tắt dữ liệu thứ tự, đặc biệt khi nó đi kèm với các neo bằng lời nói có ý nghĩa. Nói cách khác, bạn có thể báo cáo "hộp 2 trên cùng", tỷ lệ phần trăm đã chọn "đồng ý" hoặc "đồng ý mạnh mẽ".

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.