Là 0 một giá trị hợp lệ trong thang đo Likert?


8

Tôi đã thực hiện nghiên cứu thí điểm về động lực học ngôn ngữ bằng thang đo Likert 6 điểm nhưng từ 0 (rất không đồng ý) đến 5 (rất đồng ý). Tôi nhận thấy một đồng nghiệp trong khảo sát của anh ta đã sử dụng 1 đến 6. Các biến được tính toán (tổng và trung bình) của tôi có giống như khi tôi đã sử dụng 1 đến 6 không? Thông thường không nên sử dụng 0 vì một số lý do? Tôi chưa quen với SPSS nhưng đã cố gắng làm hầu hết những gì tôi cần làm nhưng hiện tại tôi đang lo lắng giá trị của mình bị 'bóp méo'. Tôi không hiểu làm thế nào SPSS thêm 0 vào một phương trình.


6
Tôi nghi ngờ - nhưng không thể đưa ra bằng chứng - rằng có thể có sự khác biệt về tâm lý giữa thang đo 1..6 và 0..5, nguyên nhân chính là do sự khác biệt về cách 0 được mọi người trải nghiệm và hiểu so với nhận thức của họ của các số nguyên dương và có lẽ vì mọi người có thể nghĩ về các giá trị tương đối với mức tối đa, do đó, trong một trường hợp, sự thay đổi từ 5 đến 6 là 1/6 của mức tối đa trong khi trong trường hợp khác, nó sẽ được coi là (sai) 1/5 mức tối đa. Có lẽ các nhà tâm lý học trong cộng đồng của chúng ta có thể đưa ra một số suy nghĩ về điều này?
whuber

2
@whuber Thật vậy, đây là một chủ đề lâu dài trong thiết kế bảng câu hỏi - đặc biệt là liên quan đến quy mô lưỡng cực so với quy mô lưỡng cực. Để biết tổng quan, xem Schwarz. 1996. Nhận thức và giao tiếp: Những thành kiến ​​phán đoán, phương pháp nghiên cứu và logic của cuộc trò chuyện. Mahwah, NJ: Lawrence Erlbaum. Một số tài liệu tham khảo thêm .
caracal

Tôi nghĩ rằng bài viết trước đây về các loại quy mô Likert có thể giúp đỡ.
David

7
Mục loại Likert 5 điểm thường được sử dụng, trong đó các loại phản hồi là "Rất không đồng ý", "Không đồng ý", "Không phải là ag. Cũng không bất đồng.", "Ag." Và "Agly ag.", Mà không có số rõ ràng ghi bàn. Thể loại thứ 6 của bạn là gì? Mã hóa đáp ứng là không quan trọng, để hồi quy, kiểm tra dữ liệu hoặc thống kê tóm tắt. Bất kỳ phương pháp chia tỷ lệ, liên kết hoặc phương trình đều có thể tính đến điều đó. Điều thực sự quan trọng là mô hình đo lường cơ bản mà bạn sẵn sàng đảm nhận, bởi vì nó sẽ xác định liệu điểm số sẽ được coi là điểm rời rạc phụ thuộc mẫu hay 'phản xạ' của một đặc điểm tiềm ẩn trên thang đo rời rạc.
chl

Tôi là người đăng câu hỏi ban đầu. Toàn bộ quesitonnaire về động lực được tạo thành từ 80 mục được nhóm thành 16 tiểu cảnh với một tiêu chí đánh giá nỗ lực cũng được đánh giá theo thang độ thích. Tất cả các repons là 0 (hoàn toàn không đồng ý) đến 5 (hoàn toàn đồng ý). cảm ơn tất cả các bạn rất nhiều vì đã trả lời sâu sắc, dựa trên những điều này tôi đã duy trì xếp hạng ban đầu.

Câu trả lời:


8

Hãy để tôi làm cho một vài điểm. Thứ nhất, nếu bạn chỉ có 1 câu hỏi, bạn không về mặt kỹ thuật có một Likert quy mô , nhưng chỉ cần một đánh giá thứ tự. Ở mức độ nào, tôi không thể thấy làm thế nào sẽ có bất kỳ sự khác biệt có ý nghĩa. Đây chỉ là một sự thay đổi tuyến tính. Điều này sẽ không tạo ra sự khác biệt cho dù bạn sử dụng phân tích thứ tự như hồi quy logistic thông thường hoặc kiểm tra Mann-Whitney U, hoặc một tùy chọn tiêu chuẩn hơn như hồi quy OLS hoặc kiểm tra t.


7

Tôi phải không đồng ý một phần với @MichaelCécick. Trong khi các câu trả lời cho một câu hỏi Likert duy nhất (cho dù từ 0 đến 5 hoặc 1 đến 6 hoặc bất cứ điều gì) rõ ràng là thứ tự, thường có một số mục của thang đo Likert. Tại một số điểm, số lượng giá trị có thể trở nên cao đến mức về cơ bản là liên tục.

Như bạn đã biết (nhưng người đăng câu hỏi có thể không) Hồi quy OLS không cho rằng biến phụ thuộc thường được phân phối, chỉ có các lỗi (theo ước tính của phần dư).

Nếu chúng ta tổng hợp một loạt các vật phẩm Likert, chúng ta có biết rằng các khoảng thực sự bằng nhau không? Không thật sự lắm. Nhưng chúng ta có biết rằng, nói IQ không? Hay thậm chí là thu nhập? Sự khác biệt giữa chỉ số IQ 130 và 140 có giống với 100 và 110 không? Liệu câu hỏi đó thậm chí có ý nghĩa? Còn mức tăng 10.000 đô la cho người kiếm được 10.000 đô la so với 100.000 đô la mỗi năm thì sao?

Tôi đã viết cả một bài blog về điều này.

Ngoài ra, tôi không rõ liệu thang đo Likert này sẽ là một biến phụ thuộc hay độc lập.


Tôi đoán nó phụ thuộc vào việc OP muốn so sánh các câu hỏi hoặc nhóm câu hỏi riêng lẻ (thường được gọi là tên miền trong tài liệu khảo sát). Nhưng làm thế nào để tổng số nguyên bscome liên tục. Chúng lớn hơn nhưng chúng vẫn là số nguyên và không liên tục. Ngoài ra, tổng không thay đổi một cách kỳ diệu từ thứ tự sang danh nghĩa nên tôi không hiểu những gì bạn đang cố nói. OLS giả định các hiệp phương sai là cố định và phần dư là bình thường. Trong thực tế, điều đó có nghĩa là biến phụ thuộc được điều hòa trên các hiệp phương sai là bình thường.
Michael R. Chernick

2
@Michael Bạn có thể muốn xem xét một số cuộc thảo luận trước đó về việc nên coi thang đo Likert là liên tục hay rời rạc . Điểm số biến đôi khi phản ánh cách chúng ta hình dung dữ liệu. Tôi cũng có thể giới thiệu De Boeck, P., Wilson, M. và Acton, GS (2005). Khung khái niệm và tâm lý học để phân biệt danh mục và kích thước . Đánh giá tâm lý , 112 (1): 129-158.
chl

5

Theo dõi các đề xuất tham khảo của @ caracal, tôi đã tìm thấy một câu trả lời gần như trực tiếp ( không, hai hệ thống xếp hạng này không tương đương nếu được trình bày dưới dạng tùy chọn số cho người trả lời ) từ Schwarz, Knäuper, Hippler, Noelle-Neumann và Clark (1991) . Họ trình bày dữ liệu về câu trả lời cho câu hỏi "Cho đến nay bạn đã thành công như thế nào trong cuộc sống?" Một phiên bản đã đưa ra các tùy chọn xếp hạng từ 01010 đến 480 người tham gia; phiên bản khác có các tùy chọn từ (-5) - (+ 5) với số 0 là điểm giữa và được 552 người tham gia nhìn thấy. Các thiết bị đầu cuối được gắn nhãn là không hoàn toàn thành công và thành công trong các phiên bản. "Chưa quyết định" cũng là một lựa chọn cho cả hai. Đây là cách mọi thứ rung chuyển:

0–10 Scale5 to +5 ScaleScale ValuePercentageCumulativeScale ValuePercentageCumulative0......5111......4...1222312357213471411452034091361448+192272068+2234582088+335809694+4149410397+5498Undecided3100Undecided2100

χ2(10)=105.1,p<.0001


Có các phương pháp thiết kế khảo sát đơn giản cho phép người ta tránh lo lắng về tác động tâm lý của việc đánh giá các neo đánh giá với các con số. Về cơ bản, bạn chỉ có thể tránh sử dụng số! Ví dụ:

  1. Cho phép người trả lời kiểm tra các ô trong một bảng tương ứng với sở thích trả lời của họ: mỗi hàng có thể là một mục khác nhau và mỗi cột có thể được gắn nhãn với neo xếp hạng của bạn hoặc ngược lại - không có số liên quan. Đây là cách nó có thể trông (nếu một người trả lời một cách khôn ngoan):

    Strongly DisagreeDisagreeMildly DisagreeMildly AgreeAgreeStrongly AgreeTumblers: better than pumpers!I look fat in this dress.

    Wikipedia đưa ra một phong cách khác bằng cách sử dụng các tùy chọn được đánh dấu (của Nicholas Smith ):

  2. Mã chữ cái cũng có thể được thay thế cho các tùy chọn số nếu các khoảng trống được điền vào danh sách rất nhiều mục; ví dụ, { SD, D, MD, MA, A, SA}. Chỉ cần đừng quên bao gồm các huyền thoại!


Tham khảo
Schwarz, N., Knäuper, B., Hippler, HJ, Noelle-Neumann, E., & Clark, L. (1991). Thang đánh giá các giá trị số có thể thay đổi ý nghĩa của nhãn tỷ lệ. Ý kiến ​​công chúng hàng quý, 55 (4), 570 Lâu582.


Bất kỳ lý do để xem quy mô vô số là tốt hơn ?
Scortchi - Phục hồi Monica

1
@Scortchi: ít nhất họ phải giảm sự mơ hồ của các câu trả lời. Tôi dường như không chắc rằng những người trả lời và các nhà nghiên cứu sẽ đạt được sự hiểu biết lớn hơn về nhau bằng cách trộn lẫn các ngôn ngữ của các neo bằng lời nói và số. Dường như nhiều khả năng các nhà nghiên cứu sẽ thiết kế các chỉ số của họ một cách tùy tiện và ngây thơ, và những người được hỏi sẽ quyết định cách trả lời không nhất quán (theo cả nghĩa giữa và và bên trong ) dựa trên bất kỳ bộ neo nào có ý nghĩa hơn đối với cá nhân họ nói chung, hoặc tệ hơn, đối với một số mặt hàng . Cảm ơn bạn đã chỉnh sửa BTW sâu sắc. Mắt sắc!
Nick Stauner

1
Đây chỉ là trực giác của tôi khi nói BTW, nhưng ví dụ, một mục như "Đây là một câu trả lời hay", có thể thu hút nhiều hơn với thang điểm 01010 bằng cách liên kết với hệ thống phân loại học thuật điển hình nằm trong khoảng từ tín dụng 0% 100% ... Trong khi đó, "Obama là một tổng thống tốt", có thể thu hút nhiều hơn vào hệ thống (-5) - (+ 5) bởi vì nó sẽ mang lại cho những người bảo thủ một cách thể hiện cảm giác tổn thương của họ, không chỉ là sự bất mãn của họ. Tôi đoán là câu hỏi sau sẽ không tạo ra sự ưu tiên giữa các hệ thống xếp hạng bằng lời nói và số, trong khi đó hệ thống số có thể được ưu tiên hơn một chút cho câu hỏi trước ..
Nick Stauner

1
... Chỉ xét về cách mọi người sẽ nghĩ về lựa chọn câu trả lời của họ, lựa chọn của họ giữa các hệ thống xếp hạng bằng lời nói và số có thể được thực hiện ở mức độ tự nguyện / tự động / ít hơn so với chủ ý thường xuyên ở những người tham gia với mức độ tự nhận thức khác nhau , chú ý đến chi tiết, hoặc " tâm lý tâm lý ". Một số lượng học tập xảy ra trong quá trình điền vào một câu hỏi dài. IIRC, điều này dẫn đến các câu trả lời nhất quán hơn (có thể sai lệch) khi các mục bắt đầu mờ đi cùng nhau. </ suy đoán và phỏng đoán hoang dã>
Nick Stauner

1
Điều đó nghe có vẻ rất hợp lý - Tôi sẽ thừa nhận rằng tôi đang tức giận vì một nghiên cứu khác giải quyết câu hỏi. (Tôi nhớ lại một ý định thể hiện sự tồn tại của hiệu ứng "ngồi hàng rào" trong đó mức trung bình của một vật phẩm có mức số lẻ được biểu thị quá mức so với hai cấp độ trung bình của một vật phẩm thậm chí không có. . - Tôi sẽ đăng bài giới thiệu khi tôi tìm thấy nó.)
Scortchi - Tái lập Monica

2

Để thực hiện phân tích với các thang đo thứ tự như Likert, bạn sẽ sử dụng các phương pháp không tham số dựa trên các cấp bậc. Điều quan trọng với thang đo thứ tự là thứ tự nếu 5 là tốt nhất, 0 là tồi tệ nhất, 1 tốt hơn 0, 2 tốt hơn 1 v.v ... Cả hai tỷ lệ và khoảng đều vô nghĩa đối với dữ liệu thứ tự. Vì vậy, tỷ lệ 1-6 so với 0-5 không quan trọng và sẽ không ảnh hưởng đến phân tích. Bắt đầu với 1 là do truyền thống chứ không phải là cần thiết.


2
"Cả hai tỷ lệ và khoảng đều vô nghĩa đối với dữ liệu thứ tự" phụ thuộc vào mô hình đo lường cơ bản mà bạn sẵn sàng giả định.
chl

@Chl Quan điểm của bạn là gì?
Michael R. Chernick

3
Quan điểm của tôi là các mô hình tâm lý nhất định xem xét rõ ràng phản ứng rời rạc như một proxy phản ánh vị trí (hoặc trách nhiệm pháp lý) của một người trên một đặc điểm tiềm ẩn, như chi tiết trong câu trả lời của tôi . Tôi đồng ý với phần còn lại của câu trả lời của bạn, về cơ bản dựa trên ý tưởng xử lý tổng (không phải trong trường hợp này, nhưng bạn sẽ có ý tưởng) điểm số có nghĩa là xếp hạng các cá nhân theo cấu trúc nhất định (theo khung CTT ).
chl

3
Nhưng các biến thường không nghiêm ngặt theo quy tắc hoặc khoảng. Ứng dụng mù của phân loại học của Stevens cũng tệ như ứng dụng mù của bất kỳ quy tắc nào khác. Đối với thứ tự nghiêm ngặt, bạn có thể mã hóa lại thành 0, 2, 2.1, 2.2, 2.3, 19288191. Nhưng bạn sẽ không? Và, ngoài các phép đo vật lý, khoảng thời gian thực sự là gì?
Peter Flom

2
@Peter Điều này nhắc nhở tôi về chủ đề cũ hơn này: Có bao giờ có ý nghĩa khi coi dữ liệu phân loại là liên tục không?
chl

-1

Tôi nghĩ rằng các điểm nên được xác định theo khung của câu hỏi. Giống như, nếu các câu hỏi liên quan đến thái độ thì điểm nên được đưa ra từ 1 đến 5, chứ không phải 0 đến 4 vì chúng ta đang cố gắng để biết thái độ. Và thái độ không thể nói dối ở mức 0; thậm chí đánh dấu người trả lời về tùy chọn Rất không đồng ý nhưng chúng tôi không thể đề cập đến 0 (không) cho phản hồi này. Tương tự có thể là các biến khác. Vì vậy, là một nhà nghiên cứu, chúng ta nên cố gắng xác định các điểm từ 1-5; 1-7 v.v.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.