Độ lệch chuẩn của điểm số thô có thể được báo cáo là độ lệch chuẩn của tỷ lệ phần trăm không?


8

Giả sử chúng tôi có một bài kiểm tra bao gồm 30 câu hỏi và 10 người làm bài kiểm tra này. Điểm kiểm tra trung bình của 10 người này là 17 và độ lệch chuẩn của tất cả các điểm trong mẫu là 4. Khi báo cáo thống kê mô tả ở trường, chúng tôi sử dụng các điểm số thô này và viết ( M = 17, SD = 4); nhưng trong một số trường hợp tôi có cảm giác rằng báo cáo tỷ lệ phần trăm sẽ tốt hơn. Bởi vì tôi nghĩ rằng chúng ta nắm bắt trực quan hơn về ý nghĩa của việc đạt điểm 56,7 trên 100 so với điểm 17 trên 30 (có lẽ vì chúng ta đã quen với hệ thập phân).

Vì vậy, đối với ví dụ đã nêu ở trên, có thể báo cáo độ lệch trung bình và độ lệch chuẩn là ( M = 56,7%, SD = 13,3%) không?

Liệu có ý nghĩa khi nói rằng điểm thi trong một mẫu có độ lệch chuẩn là 13,3%?

Các tỷ lệ phần trăm này tương đương với số học của điểm số thô tôi đã tạo ra và đưa ra ở trên, nhưng tôi không chắc liệu có nên thực hiện trực tiếp để chuyển đổi chúng thành tỷ lệ phần trăm như vậy hay không.


AFAIK bạn có thể chuyển đổi các biến liên tục sang thang đo khác và hiển thị phân phối trên thang đo đó miễn là bạn rõ ràng cách bạn đến đó. Tuy nhiên, trong trường hợp của bạn, bạn có thể tự hỏi liệu điểm số đạt được từ 30 câu hỏi có cung cấp đủ thông tin để chuyển đổi sang thang đo liên tục từ 0-100 (%) hay không (vì dữ liệu chỉ hỗ trợ mức tăng 3,33%).
IWS

Vâng đó là sự thật. Điểm trên 30 không có nhiều thông tin như điểm được chuyển đổi (trên 100), vì số gia của 100 nhỏ hơn (1) và do đó, bài kiểm tra trên 100 điểm sẽ "nhạy cảm" hơn với điều kiện tất cả các lớp đều là số nguyên. Tuy nhiên, với câu trả lời của bạn, tôi nghĩ rằng nó sẽ không được coi là "sơ suất" trong trường hợp của tôi để báo cáo chúng theo cách này. (Tôi thực sự đang chuẩn bị bài tập cho trường học và tôi sẽ báo cáo trung bình thô & SD trong văn bản, nhưng tôi chỉ tin rằng sẽ có ý nghĩa hơn khi hiển thị các điểm số này dưới dạng phần trăm trong bảng và biểu đồ). Từ những gì tôi hiểu, điều này sẽ có thể làm được.
Freya

Chỉ cần hoàn thành: lưu ý rằng một số biến đổi có thể thực sự thay đổi hình dạng phân phối, vì vậy bạn không nên chỉ áp dụng biến đổi bạn muốn áp dụng trực tiếp vào dữ liệu của mình vào vị trí đo và lan truyền. Thay vào đó, áp dụng chuyển đổi cho dữ liệu của bạn và sau đó đánh giá các biện pháp vị trí và lan truyền như thể đây là dữ liệu gốc (nghĩa là xác định lại giá trị trung bình và sd trong trường hợp của bạn).
IWS

Về mặt kỹ thuật, như một thước đo khoảng cách chứ không phải vị trí, SD sẽ là điểm phần trăm (pp) chứ không phải là phần trăm. Tôi cũng nên cảnh giác khi diễn giải nó trong bối cảnh này vì mô hình lỗi sẽ tính đến việc quy mô là rời rạc như @freya đã đề cập.
James

Câu trả lời:


13

Độ lệch chuẩn chỉ là một thuộc tính thống kê mà bạn có thể đo cho một tập hợp các điểm dữ liệu. Độ lệch chuẩn không tự nó đưa ra bất kỳ giả định nào rằng dữ liệu của bạn thường được phân phối hoặc có / chưa được chuyển qua bất kỳ biến đổi, tuyến tính hay cách khác.

Do đó, hoàn toàn chấp nhận được khi sử dụng độ lệch chuẩn trên bất kỳ dữ liệu nào, bao gồm cả tỷ lệ phần trăm.

Lưu ý rằng, trong trường hợp cụ thể của bạn, phép biến đổi bạn đang áp dụng là biến đổi tuyến tính, có dạng:

y= =Mộtx+b

tức là một biến đổi affine. Vì vậy, bạn có thể tính độ lệch chuẩn trên dữ liệu gốc, chưa được dịch và sau đó nhân Avới để có độ lệch chuẩn sau khi chuyển đổi. Dường như không có lợi thế đặc biệt nào để làm điều này hơn là chỉ đơn giản là tính toán độ lệch chuẩn trên dữ liệu đã được chuyển đổi, nhưng nó có thể được trấn an.

Một

{X1,X2,...,Xn}σ

σX2= =1nΣTôi= =1n(XTôi-1nΣj= =1nXj)2

Y= =MộtX+b

σY2= =1nΣTôi= =1n(MộtXTôi+b-1nΣj= =1n(MộtXj+b))2

= =1nΣTôi= =1n(MộtXTôi+b-n1nb-1nΣj= =1n(MộtXj))2

= =1nΣTôi= =1n(MộtXTôi-1nΣj= =1n(MộtXj))2

= =Một2(1nΣTôi= =1n(XTôi-1nΣj= =1n(Xj))2)

= =Một2σX2

vì thế

σY= =MộtσX.

Điều này thực sự rất hữu ích và chiếu sáng. Cảm ơn bạn.
Freya
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.