Trực giác và sử dụng cho hệ số biến đổi


11

Tôi hiện đang tham gia khóa học Giới thiệu về Quản lý hoạt động tại Coursera.org. Tại một số điểm trong khóa học, giáo sư bắt đầu đối phó với sự thay đổi trong thời gian của các hoạt động.

Phép đo anh ta sử dụng là Hệ số biến thiên , tỷ lệ giữa độ lệch chuẩn và giá trị trung bình:

cv=σμ

Tại sao phép đo này sẽ được sử dụng? Những lợi thế và bất lợi của việc làm việc với CV bên cạnh việc làm việc với độ lệch chuẩn là gì? Trực giác đằng sau phép đo này là gì?

Câu trả lời:


8

Tôi nghĩ về nó như một thước đo tương đối của sự lan truyền hoặc tính biến đổi trong dữ liệu. Nếu bạn nghĩ về tuyên bố, "Độ lệch chuẩn là 2,4" thì nó thực sự không cho bạn biết gì mà không liên quan đến giá trị trung bình (và do đó là đơn vị đo lường, tôi cho rằng). Nếu giá trị trung bình bằng 104, độ lệch chuẩn của 2,4 truyền đạt một hình ảnh lan truyền khác so với giá trị trung bình là 25.452 với độ lệch chuẩn là 2.4 ..

Cùng một lý do bạn bình thường hóa dữ liệu (trừ giá trị trung bình và chia cho độ lệch chuẩn) để đặt dữ liệu được biểu thị theo các đơn vị khác nhau trên một bàn đạp có thể so sánh hoặc bằng nhau, do đó, biện pháp biến đổi này được chuẩn hóa để so sánh.


2

Hệ số biến đổi thực sự là thước đo chuẩn hóa hoặc tương đối của biến thể trong tập dữ liệu, (ví dụ: chuỗi thời gian) theo đó là tỷ lệ (và do đó có thể được biểu thị dưới dạng phần trăm). Theo trực giác, nếu giá trị trung bình là giá trị mong đợi, thì hệ số biến thiên là độ biến thiên dự kiến ​​của phép đo, so với giá trị trung bình.

Điều này hữu ích khi so sánh các phép đo trên nhiều bộ dữ liệu không đồng nhất hoặc trên nhiều phép đo được thực hiện trên cùng một bộ dữ liệu - hệ số biến đổi giữa hai bộ dữ liệu hoặc được tính cho hai bộ đo có thể được so sánh trực tiếp, ngay cả khi dữ liệu trong mỗi bộ được đo đo trên các thang đo rất khác nhau, tỷ lệ lấy mẫu hoặc độ phân giải. Ngược lại, độ lệch chuẩn là đặc trưng cho phép đo / mẫu mà nó thu được, nghĩa là nó là một phép đo tuyệt đối chứ không phải là một phép đo tương đối.


Bạn có thể giải thích phần này nhiều hơn xin vui lòng: "Hệ số biến đổi là độ biến thiên dự kiến ​​của phép đo trong một khoảng"?
B_Miner

@B_Miner Tôi có nghĩa là khoảng trong ý nghĩa xử lý tín hiệu và đã chỉnh sửa ở trên. Std dev có hiệu quả là sự thay đổi trung bình hoặc dự kiến.
BGreene

-2

theo sự hiểu biết của tôi, có nghĩa là tham số vị trí. sd / trung bình không nên coi là hệ số biến đổi. tại sao? lập luận đơn giản là khoảng cách thống kê khác với khoảng cách euclide. để đo khoảng cách thống kê, chúng tôi sử dụng sd; khoảng cách thô cho một biến. giả sử 50 là trung bình và 2 là sd thì 4% sẽ là cv. bây giờ có nghĩa là 5 và sd là 2 cv = 40%. thuật ngữ biến thể thống kê là độc lập với nguồn gốc. Vì vậy, sd chính nó là biện pháp tốt của sự thay đổi. và nhớ một quy tắc từ vật lý không so sánh hai hệ thống đơn vị trong một vấn đề duy nhất.


2
Thật khó để thấy bất kỳ đối số mạch lạc ở đây. Chúng ta không nên coi sd / có nghĩa là hệ số biến đổi? Đó là cách nó được định nghĩa. Nếu bạn có nghĩa là nó không hữu ích, hãy giải thích tại sao. (Nếu bạn nghĩ rằng nó được đặt tên sai, đó là một câu chuyện khác.) Khoảng cách thống kê khác với khoảng cách Euclide? Đó chỉ là một sự khẳng định và bản lề để biết ý của bạn về khoảng cách thống kê. Khi nhiều loại khoảng cách xuất hiện trong thống kê, khẳng định vẫn còn mơ hồ. (Tôi đã không downvote, nhưng tôi khuyên bạn nên viết lại điều này. Bạn có thể cần phải làm việc với một người bạn có khả năng viết tiếng Anh tốt hơn.)
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.