Làm cách nào để đánh giá độ lệch chuẩn?


15

Tôi đã thu thập phản hồi từ 85 người về khả năng của họ để thực hiện một số nhiệm vụ.

Các câu trả lời theo thang điểm Likert năm điểm:

5 = Rất tốt, 4 = Tốt, 3 = Trung bình, 2 = Kém, 1 = Rất kém,

Điểm trung bình là 2,8 và độ lệch chuẩn là 0,54.

Tôi hiểu những gì có nghĩa là độ lệch chuẩn và tiêu chuẩn.

Câu hỏi của tôi là: độ lệch chuẩn (hoặc xấu) này tốt như thế nào?

Nói cách khác, có bất kỳ hướng dẫn nào có thể giúp đánh giá độ lệch chuẩn.


Điều này có ý nghĩa gì với SD là tốt hay xấu ở đây?
gung - Tái lập Monica

7
Nó là khá khó khăn để có được như vậy một SD nhỏ với dữ liệu như thế này: cho một trung bình 2.8, SD có được ít nhất . (Ngay cả khi 2,8 đại diện cho giá trị làm tròn, SD vẫn phải vượt quá 0,357.) SD 0,54 ngụ ý rằng không quá hai người có thể trả lời bằng 5 (với 21 2 và 62 3) và không quá sáu có thể trả lời với 1 (với 5 2 và 74 3). Điều này cho thấy câu hỏi có thể cung cấp rất ít thông tin vì thang đo không phân biệt đối xử một cách hiệu quả. 0,2×0,8= =0,4
whuber

@whuber dữ liệu tuyệt vời forsensics! Nhưng tôi cũng có thể tưởng tượng rằng anh ta trung bình với các câu hỏi khác nhau hoặc đã làm điều gì đó sai trong tính toán của mình. Có vẻ khó tưởng tượng rằng mọi người đã thực sự phản hồi rất đồng đều, đặc biệt là khi nói về khả năng được cho là của họ.
Erik

Câu trả lời:


17

Độ lệch chuẩn không "tốt" hay "xấu". Chúng là các chỉ số về mức độ lan truyền dữ liệu của bạn. Đôi khi, trong thang điểm xếp hạng, chúng tôi muốn trải rộng vì nó cho thấy rằng các câu hỏi / xếp hạng của chúng tôi bao gồm phạm vi của nhóm chúng tôi đang xếp hạng. Những lần khác, chúng tôi muốn có một sd nhỏ vì chúng tôi muốn mọi người đều "cao".

Ví dụ: nếu bạn đang kiểm tra các kỹ năng toán học của sinh viên trong một khóa học tính toán, bạn có thể nhận được một sd rất nhỏ bằng cách hỏi họ các câu hỏi về số học cơ bản như . Nhưng giả sử bạn đã thực hiện bài kiểm tra xếp lớp nghiêm túc hơn cho phép tính (nghĩa là, những sinh viên đỗ sẽ vào Giải tích I, những người không tham gia các khóa học cấp thấp hơn trước). Bạn có thể mong đợi một sd thấp hơn (và trung bình cao hơn) trong số sinh viên năm nhất tại MIT so với tại South Podunk State, được đưa ra thử nghiệm tương tự.3+2

Vì thế. Mục đích của bài kiểm tra của bạn là gì? Ai đang ở trong mẫu?


2
(+1) Chỉ cần thêm một chút vào nhận xét "Độ lệch chuẩn không phải là" tốt "hay" xấu "- có một yếu tố dự đoán với độ lệch chuẩn lớn có thể là" tốt "bởi vì, trong hồi quy, nó liên quan ngược với tiêu chuẩn lỗi của một ước tính hệ số hồi quy. Mặt khác, nếu bạn quan tâm đến độ chính xác của phép đo, thì độ lệch chuẩn lớn là "xấu". Tôi đoán rằng sự quan tâm của người đăng ban đầu gần với cái trước hơn nhưng không rõ ràng.
Macro

10

Câu trả lời ngắn, nó ổn và thấp hơn một chút so với tôi có thể mong đợi từ dữ liệu khảo sát. Nhưng có lẽ câu chuyện kinh doanh của bạn có ý nghĩa nhiều hơn hoặc phần trăm 2 hộp hàng đầu.

Đối với các thang đo rời rạc từ nghiên cứu khoa học xã hội, trong thực tế, độ lệch chuẩn là một hàm trực tiếp của giá trị trung bình. Cụ thể, tôi đã tìm thấy thông qua phân tích thực nghiệm của nhiều nghiên cứu như vậy rằng độ lệch chuẩn thực tế trong các khảo sát trên thang đo 5 điểm là 40% -60% biến thiên tối đa có thể có (không có tài liệu ở đây).

Ở cấp độ đơn giản nhất, hãy xem xét các cực trị, hãy tưởng tượng rằng giá trị trung bình là 5.0. Độ lệch chuẩn phải bằng 0, vì cách duy nhất để trung bình 5 là cho mọi người trả lời 5. Ngược lại, nếu giá trị trung bình là 1.0 thì sai số chuẩn cũng phải là 0. Vì vậy, độ lệch chuẩn được xác định chính xác với giá trị trung bình.

Bây giờ ở giữa có nhiều khu vực màu xám hơn. Hãy tưởng tượng rằng mọi người có thể trả lời 5.0 hoặc 1.0 nhưng không có gì ở giữa. Thì độ lệch chuẩn là một hàm chính xác của giá trị trung bình:

stdev = sqrt ((5 nghĩa) * (trung bình-1))

Độ lệch chuẩn tối đa cho các câu trả lời trên bất kỳ tỷ lệ giới hạn nào là một nửa chiều rộng tỷ lệ. Đây là sqrt ((5-3) (3-1)) = sqrt (2 * 2) = 2.

Bây giờ tất nhiên mọi người có thể trả lời các giá trị ở giữa. Từ sự di căn của dữ liệu khảo sát trong công ty của chúng tôi, tôi thấy rằng độ lệch chuẩn cho thang đo số trong thực tế là 40% -60% mức tối đa. Đặc biệt

  • 40% cho thang điểm 100%,
  • 50% cho thang điểm 10 và
  • 60% cho thang điểm 5 và
  • 100% cho quy mô nhị phân

Vì vậy, đối với tập dữ liệu của bạn, tôi sẽ mong đợi độ lệch chuẩn là 60% x 2.0 = 1.2. Bạn nhận được 0,54, đó là khoảng một nửa những gì tôi mong đợi nếu kết quả là xếp hạng tự khám phá. Là các kết quả xếp hạng kỹ năng của pin phức tạp hơn của các bài kiểm tra trung bình và do đó sẽ có phương sai thấp hơn?

Tuy nhiên, câu chuyện thực tế có lẽ là khả năng rất thấp hoặc quá cao so với các nhiệm vụ khác. Báo cáo các phương tiện hoặc tỷ lệ phần trăm 2 hộp hàng đầu giữa các kỹ năng và tập trung phân tích của bạn vào đó.


-1

Nếu dữ liệu được phân phối bình thường, bạn có thể thấy dân số được định vị như thế nào.

  • 68% tất cả mọi người nằm trong phạm vi 1 độ lệch chuẩn của giá trị trung bình ( 2.26 - 3.34):

nhập mô tả hình ảnh ở đây

  • 95% tất cả mọi người nằm trong 2 độ lệch chuẩn của giá trị trung bình ( 1.72 - 3.88):

nhập mô tả hình ảnh ở đây

Nó cho bạn biết làm thế nào "trải ra" số của bạn.


1
Câu trả lời này chưa được nêu lên vì nó không chính xác: nó sử dụng quy tắc gần đúng (như thể nó chính xác) trong trường hợp không thể áp dụng được. Câu trả lời sẽ là đúng nếu được thay thế bằng kết luận về Bất bình đẳng của Ch Quashev (trong đó nêu rõ rằng ít nhất 75% các quan sát nằm trong hai SD của quan sát trung bình, tức là, ít nhất 75% các câu trả lời là 2 hoặc 3 giây), nhưng điều này sẽ không cung cấp nhiều cái nhìn sâu sắc.
whuber

Thêm vào đó, nó chỉ đúng với dân số thực sự phân phối bình thường. Từ đó, bạn có thể tính toán các con số một cách chính xác bằng cách đánh giá tích phân so với pdf thông thường với các ranh giới được cung cấp bởi sd xung quanh giá trị trung bình. Thực sự không hữu ích ở đây.
Douba
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.