Trong những điều kiện nào nên sử dụng thang đo Likert làm dữ liệu thứ tự hoặc khoảng thời gian?


52

Nhiều nghiên cứu trong khoa học xã hội sử dụng thang đo Likert. Khi nào thì thích hợp để sử dụng dữ liệu Likert làm thông thường và khi nào thì thích hợp để sử dụng dữ liệu đó làm dữ liệu khoảng?


6
Về mặt kỹ thuật, thang đo Likert là tổng của các vật phẩm loại Likert và do đó cuối cùng là một xấp xỉ hợp lý (ít nhất là theo nhiều nhà tâm lý học trong Tâm lý học) của một điểm dữ liệu khoảng.
russellpierce

2
@drknexus - Vì vậy, nhiều mặt hàng phục vụ như một tam giác đo lường cho quy mô xây dựng? Nếu có, các tiêu chí để xác định rằng một nhà nghiên cứu có đủ các điểm dữ liệu liên quan (nghĩa là các mục) để sử dụng thang đo làm phép đo khoảng thời gian là gì?
Một con sư tử

2
Tôi không chắc; đó có thể là một câu hỏi xứng đáng cho cộng đồng nói chung. Tôi đoán rằng nó có lẽ là một phần đánh giá giá trị về phía nhà nghiên cứu & khu vực. Một số khu vực hoàn toàn sẵn sàng coi một vật phẩm Likert là khoảng thời gian mặc dù rõ ràng nó là thứ tự. Một câu trả lời hợp lý có thể là sử dụng một phương pháp phân tích khác, ví dụ như phép thử hoán vị hoặc bootstrapping. Một câu trả lời khác có thể là tiến hành một thử nghiệm đơn giản về tính quy tắc, miễn là tổng hợp không rời khỏi quy tắc một cách đáng kể, bạn có thể ổn.
russellpierce

1
... nhưng nói chung có vẻ như người ta có thể gợi lên định lý giới hạn trung tâm và đề nghị rằng 20 đến 30 mặt hàng là đủ để sử dụng thang đo như một phép đo khoảng.
russellpierce

Câu trả lời:


41

Có lẽ đã quá muộn nhưng tôi vẫn thêm câu trả lời của mình ...

Nó phụ thuộc vào những gì bạn định làm với dữ liệu của mình: Nếu bạn quan tâm đến việc hiển thị điểm số khác nhau khi xem xét nhóm người tham gia khác nhau (giới tính, quốc gia, v.v.), bạn có thể coi điểm số của mình là giá trị số, miễn là họ đáp ứng các giả định thông thường về phương sai (hoặc hình dạng) và kích thước mẫu. Nếu bạn khá quan tâm đến việc làm nổi bật cách các mẫu phản ứng khác nhau giữa các nhóm phụ, thì bạn nên xem điểm số của mục là lựa chọn rời rạc trong số các tùy chọn trả lời và tìm mô hình log-linear, hồi quy logistic, mô hình phản hồi vật phẩm hoặc bất kỳ mô hình thống kê nào khác cho phép đối phó với các mặt hàng đa hình.

Theo nguyên tắc thông thường, người ta thường cho rằng có 11 điểm khác biệt trên thang đo là đủ để xấp xỉ thang đo khoảng (đối với mục đích giải thích, xem bình luận của @ xmjx)). Các mục Likert có thể được coi là thang đo thứ tự thực sự, nhưng chúng thường được sử dụng dưới dạng số và chúng ta có thể tính giá trị trung bình hoặc SD của chúng. Điều này thường được thực hiện trong các khảo sát thái độ, mặc dù nên báo cáo cả trung bình / SD và% phản hồi trong đó, ví dụ như hai loại cao nhất.

Khi sử dụng điểm tỷ lệ tổng (nghĩa là chúng tôi cộng điểm trên từng mục để tính "tổng điểm"), số liệu thống kê thông thường có thể được áp dụng, nhưng bạn phải nhớ rằng bạn hiện đang làm việc với một biến tiềm ẩn để xây dựng cơ bản nên có ý nghĩa Trong tâm lý học, chúng tôi thường kiểm tra xem (1) tính không đồng nhất của thang đo, (2) độ tin cậy của thang đo là đủ. Khi so sánh hai thang điểm như vậy (đối với hai công cụ khác nhau), chúng tôi thậm chí có thể xem xét sử dụng các biện pháp tương quan suy yếu thay vì hệ số tương quan Pearson cổ điển.

Sách giáo khoa cổ điển bao gồm:
1. Nunnally, JC và Bernstein, IH (1994). Lý thuyết tâm lý học (tái bản lần 3). Dòng McGraw-Hill trong Tâm lý học.
2. Streiner, DL và Norman, GR (2008). Cân đo sức khỏe. Hướng dẫn thực tế để phát triển và sử dụng chúng (tái bản lần thứ 4). Oxford.
3. Rao, CR và Sinharay, S., Eds. (2007). Sổ tay Thống kê, Tập. 26: Tâm lý học . Khoa học Elsevier
4. Dunn, G. (2000). Thống kê trong Tâm thần học . Hodder Arnold.

Bạn cũng có thể xem qua Ứng dụng của các mô hình lớp học đặc điểm tiềm ẩn và tiềm ẩn trong khoa học xã hội , từ trang web của Rost & Langeheine và W. Revelle về nghiên cứu tính cách .

Khi xác thực thang đo tâm lý, điều quan trọng là phải xem xét cái gọi là hiệu ứng trần / sàn (sự bất cân xứng lớn do những người tham gia chấm ở mức phản hồi thấp nhất / cao nhất), có thể ảnh hưởng nghiêm trọng đến bất kỳ thống kê nào được tính khi coi chúng là biến số ( ví dụ: tổng hợp quốc gia, kiểm tra t). Điều này đặt ra những vấn đề cụ thể trong các nghiên cứu đa văn hóa vì người ta biết rằng phân phối phản ứng tổng thể trong các khảo sát về thái độ hoặc sức khỏe khác nhau giữa các quốc gia (ví dụ như người Trung Quốc so với những người đến từ các nước phương Tây có xu hướng làm nổi bật mô hình phản ứng cụ thể, trước đây nhìn chung các điểm cực đoan hơn ở cấp độ vật phẩm, xem ví dụ: Song, X.-Y. (2007) Phân tích các mô hình phương trình cấu trúc đa mẫu với các ứng dụng cho dữ liệu Chất lượng cuộc sống, trongCẩm nang về các mô hình biến đổi và liên quan tiềm ẩn , Lee, S.-Y. (Ed.), Trang 279-302, Bắc Hà Lan).

Tổng quát hơn, bạn nên xem các tài liệu liên quan đến tâm lý học sử dụng rộng rãi các vật phẩm Likert nếu bạn quan tâm đến vấn đề đo lường. Các mô hình thống kê khác nhau đã được phát triển và hiện đang đứng đầu trong khuôn khổ Lý thuyết đáp ứng vật phẩm.


2
Chỉ cần làm rõ: Nunnally / Bernstein đề nghị coi một biến là liên tục nếu nó có ít nhất 11 giá trị riêng biệt (trang 115). Trường hợp quy tắc "12 điểm ngụ ý quy mô khoảng" từ đâu?
xmjx

12

Câu trả lời đơn giản là thang đo Likert luôn luôn là thứ tự. Các khoảng giữa các vị trí trên thang đo là đơn điệu nhưng không bao giờ được xác định rõ ràng như là gia số thống nhất về số.

Điều đó nói rằng, sự khác biệt giữa thứ tự và khoảng được dựa trên nhu cầu cụ thể của phân tích được thực hiện. Trong những trường hợp đặc biệt, bạn có thể xử lý các câu trả lời như thể chúng rơi vào thang điểm. Để làm điều này, thông thường người trả lời cần phải thống nhất chặt chẽ về ý nghĩa của các câu trả lời theo thang đo và phân tích (hoặc các quyết định đưa ra dựa trên phân tích) nên tương đối không nhạy cảm với các vấn đề có thể phát sinh.


8
John Tukey đã viết khác (trở lại năm 1960) trong một chuyên khảo "Phân tích dữ liệu và khoa học hành vi" (xuất bản trong Sưu tập Tác phẩm v. III). Một kết quả mà anh ta đạt được là nếu bạn nhận được tốt hơn khoảng 10% thỏa thuận kiểm tra lại, quy mô của bạn không đủ hẹp!
whuber

Câu trả lời này dường như nhầm lẫn thang đo Likert với các mục đánh giá ban đầu. Xem bình luận của @ russellpierce.
rolando2

9

Ngoài những gì đã được nói ở trên về thang đo tổng, tôi cũng đề cập rằng vấn đề có thể thay đổi khi phân tích dữ liệu ở cấp độ nhóm. Ví dụ, nếu bạn đang kiểm tra

  • sự hài lòng về cuộc sống của các tiểu bang hoặc quốc gia
  • sự hài lòng công việc của các tổ chức hoặc bộ phận,
  • sự hài lòng của sinh viên trong các môn học.

Trong tất cả các trường hợp này, mỗi thước đo tổng hợp (có lẽ là giá trị trung bình) dựa trên nhiều phản hồi riêng lẻ (ví dụ: n = 50, 100, 1000, v.v.). Trong những trường hợp này, mục Likert ban đầu bắt đầu có các thuộc tính giống với thang đo khoảng ở cấp độ tổng hợp.


-2

likeert scale luôn ở dạng thứ tự: Một phương pháp xác định giá trị định lượng cho dữ liệu định tính, để làm cho nó phù hợp với phân tích thống kê. Một giá trị số được gán cho mỗi lựa chọn tiềm năng và một con số trung bình cho tất cả các câu trả lời được tính vào cuối cuộc đánh giá hoặc khảo sát.


5
Chào mừng đến với trang web của chúng tôi! Vui lòng ghi lời trích dẫn của bạn hoặc, nói chung, bất kỳ từ nào bạn đang mượn từ người khác.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.