Có nên sử dụng giá trị trung bình khi dữ liệu bị lệch?


14

Thông thường các văn bản thống kê áp dụng giới thiệu phân biệt trung bình với trung bình (thường trong bối cảnh thống kê mô tả và thúc đẩy việc tóm tắt xu hướng trung tâm bằng cách sử dụng giá trị trung bình, trung bình và chế độ) bằng cách giải thích rằng giá trị trung bình nhạy cảm với các ngoại lệ trong dữ liệu mẫu và / hoặc để phân phối dân số bị lệch, và điều này được sử dụng như một sự biện minh cho một khẳng định rằng trung vị sẽ được ưu tiên khi dữ liệu không đối xứng.

Ví dụ:

Thước đo tốt nhất của xu hướng trung tâm cho một tập hợp dữ liệu nhất định thường phụ thuộc vào cách phân phối các giá trị .... Khi dữ liệu không đối xứng, trung vị thường là thước đo tốt nhất của xu hướng trung tâm. Bởi vì giá trị trung bình rất nhạy cảm với các quan sát cực đoan, nó được kéo theo hướng của các giá trị dữ liệu bên ngoài, và kết quả là có thể bị thổi phồng quá mức hoặc xì hơi quá mức. "
TiếtPagano và Gauvreau, (2000) Nguyên tắc Sinh học , tái bản lần thứ 2. (P & G đã có trong tay, BTW, không chỉ ra chúng mỗi lần .)

Các tác giả định nghĩa "xu hướng trung tâm", do đó: "Đặc điểm được điều tra phổ biến nhất của một tập hợp dữ liệu là trung tâm của nó, hoặc điểm mà các quan sát có xu hướng co cụm".

Điều này gây ấn tượng với tôi như một cách nói ít hơn hoàn toàn chỉ sử dụng trung bình, thời gian , bởi vì chỉ sử dụng giá trị trung bình khi dữ liệu / phân phối đối xứng là điều tương tự như chỉ sử dụng giá trị trung bình khi nó bằng trung bình. Chỉnh sửa: whuber đúng chỉ ra rằng tôi đang kết hợp các biện pháp mạnh mẽ của xu hướng trung tâm với trung bình. Vì vậy, điều quan trọng cần lưu ý là tôi đang thảo luận về việc định khung cụ thể của trung bình số học so với trung bình trong thống kê áp dụng giới thiệu (trong đó, chế độ sang một bên, các biện pháp khác của xu hướng trung tâm không được thúc đẩy).

Thay vì đánh giá sự hữu ích của giá trị trung bình bằng cách nó rời khỏi hành vi của trung vị, chúng ta không nên hiểu đơn giản đây là hai biện pháp trung tâm khác nhau? Nói cách khác, nhạy cảm với độ lệch là một tính năng của giá trị trung bình. Người ta có thể lập luận một cách hợp lệ "tốt, trung vị là không tốt bởi vì nó phần lớn không nhạy cảm với độ lệch, vì vậy chỉ sử dụng nó khi nó bằng giá trị trung bình."

(Chế độ khá hợp lý khi không tham gia vào câu hỏi này.)


3
Cá nhân, tôi thích bao gồm cả hai biện pháp, trung bình và trung bình, sẽ cung cấp cho người đọc không chỉ một số thông tin về xu hướng trung tâm, mà còn là một ý tưởng về việc dữ liệu bị lệch như thế nào.
bdeonovic

1
Một số bối cảnh và làm rõ sẽ cải thiện câu hỏi này. (1) Trong bối cảnh nào các văn bản giới thiệu (giả thuyết) này khẳng định giá trị trung bình được ưu tiên, và cho mục đích gì? (2) Chính xác thì các văn bản này "đánh giá sự hữu ích của trung bình bằng cách nó rời khỏi hành vi của trung bình" như thế nào? Bạn có thể cung cấp một ví dụ hoặc một trích dẫn để chúng ta có thể hiểu rõ hơn?
whuber

2
Tại một thời điểm bạn giải thích sai: trung vị không phải là thống kê duy nhất mạnh mẽ đối với một vài quan sát cực đoan. Do đó, giá trị trung bình được xác định dựa trên đặc tính không mong muốn (thường) và không bằng bất kỳ so sánh nào với trung vị. Nhưng tôi cũng nhận được một cái nhìn thoáng qua về mối quan tâm của bạn, và có lẽ nó có liên quan đến sự kết hợp ngầm của sự bất cân xứng và sự tồn tại của các ngoại lệ xảy ra trong trích dẫn này. Điều đó đáng tiếc là không được quan niệm, bởi vì mặc dù có những ngoại lệ đôi khi ngụ ý sự bất cân xứng, nhưng điều ngược lại thường không đúng.
whuber


2
Theo định nghĩa được đưa ra cho "xu hướng trung tâm", có vẻ như rõ ràng lý do tại sao giá trị trung bình sẽ không phải là một biện pháp hữu ích khi có sự sai lệch hoặc ngoại lệ. Có hay không bạn thực sự muốn ước tính khái niệm này về xu hướng trung tâm dường như là một vấn đề khác!
JSK

Câu trả lời:


16

Tôi không đồng ý với lời khuyên như một quy tắc thẳng thừng. (Nó không phổ biến cho tất cả các cuốn sách.)

Các vấn đề là tinh tế hơn.

Nếu bạn thực sự quan tâm đến việc suy luận về ý nghĩa dân số, thì trung bình mẫu ít nhất là một công cụ ước tính không thiên vị của nó và có một số lợi thế khác. Trong thực tế, xem định lý Gauss-Markov - đó là không thiên vị tuyến tính tốt nhất.

Nếu các biến của bạn bị sai lệch nhiều, thì vấn đề đi kèm với 'tuyến tính' - trong một số trường hợp, tất cả các công cụ ước tính tuyến tính có thể xấu, do đó, các biến số tốt nhất có thể vẫn không hấp dẫn, do đó, một công cụ ước tính của trung bình không tuyến tính có thể tốt hơn , nhưng nó sẽ đòi hỏi phải biết một cái gì đó (hoặc thậm chí khá nhiều) về phân phối. Chúng ta không phải lúc nào cũng có sự xa xỉ đó.

Nếu bạn không nhất thiết quan tâm đến suy luận liên quan đến dân số (" độ tuổi điển hình là gì? ", Hãy nói hoặc liệu có sự thay đổi vị trí chung hơn từ dân số này sang dân số khác, có thể được đặt theo cụm từ bất kỳ vị trí nào, hoặc thậm chí về một thử nghiệm của một biến lớn hơn ngẫu nhiên so với biến khác), sau đó đưa ra rằng về mặt dân số có nghĩa là không cần thiết hoặc có khả năng phản tác dụng (trong trường hợp cuối cùng).

Vì vậy, tôi nghĩ rằng nó đi xuống để suy nghĩ về:

  • câu hỏi thực tế của bạn là gì? Có phải dân số có nghĩa là một điều tốt để được hỏi về tình huống này?

  • cách tốt nhất để trả lời câu hỏi cho tình huống (sự sai lệch trong trường hợp này) là gì? Là sử dụng mẫu có nghĩa là cách tiếp cận tốt nhất để trả lời các câu hỏi quan tâm của chúng tôi?

Có thể bạn có câu hỏi không trực tiếp về phương tiện dân số, tuy nhiên phương tiện mẫu là một cách tốt để xem xét những câu hỏi đó ... hoặc ngược lại - câu hỏi có thể là về phương tiện dân số nhưng phương tiện mẫu có thể không phải là cách tốt nhất để trả lời câu hỏi đó


14

Trong cuộc sống thực, chúng ta nên chọn một thước đo của xu hướng trung tâm dựa trên những gì chúng ta đang cố gắng tìm hiểu; và có, đôi khi chế độ là điều đúng đắn để sử dụng. Đôi khi, nó có nghĩa là Winsorized hoặc trim. Đôi khi có nghĩa là hình học hoặc hài hòa. Đôi khi không có biện pháp tốt về xu hướng trung tâm.

Sách giới thiệu được viết xấu, họ dạy rằng có những quy tắc sách dạy nấu ăn để áp dụng.

Lấy thu nhập. Điều này thường rất sai lệch và đôi khi có các ngoại lệ; chắc chắn, chúng ta thường thấy "thu nhập trung bình" được báo cáo. Nhưng đôi khi các ngoại lệ và độ lệch là quan trọng. Nó phụ thuộc vào bối cảnh và đòi hỏi phải suy nghĩ.

Tôi đã viết nhiều hơn về điều này


2
Peter, cảm ơn bạn rất nhiều vì liên kết đến bài viết của bạn. Tôi muốn rằng các văn bản giới thiệu mất 1 đến 2 trang không gian cần thiết để cung cấp sự cân nhắc chu đáo như bạn đã cung cấp ở đó.
Alexis

4
Tôi đã không viết một nhưng tôi muốn chèn một chút bảo vệ các văn bản giới thiệu. Bất kỳ văn bản giới thiệu nào cố gắng đưa ra một cái nhìn đầy sắc thái mà các chuyên gia có kinh nghiệm sẽ nhận ra như vậy sẽ bị đốt cháy bởi hầu hết tất cả những người nhận dự định; thực sự nó thậm chí sẽ không được công bố.
Nick Cox

5
Một nhận xét thực chất: khi các giá trị là phụ gia sao cho tổng số tạo ra (ví dụ) ý nghĩa vật lý, giá trị trung bình là một bản tóm tắt tự nhiên bất kể phân phối của các giá trị riêng lẻ.
Nick Cox

3
@NickCox Tôi nghĩ rằng các văn bản giới thiệu có thể làm tốt hơn nhiều so với họ. Đối với trung bình so với trung bình, nó thậm chí không phải là một đối số toán học - đó là một đối số thực chất. Các văn bản giới thiệu cần nói với người đọc chúng rằng họ không thực sự đủ điều kiện để phân tích dữ liệu.
Peter Flom - Tái lập Monica

2
@jsk. Ồ được thôi. Tôi nghĩ rằng họ cần được nói rõ ràng trong thống kê vì nhiều người dường như nghĩ rằng họ đã sẵn sàng sau một khóa học về phân tích dữ liệu; thật vậy, trong nhiều lĩnh vực (tâm lý học, xã hội học, y học, v.v.) mọi người dự kiến ​​sẽ phân tích dữ liệu chỉ sau 1, 2 hoặc đôi khi 3 khóa học. Trong các chương trình tiến sĩ, ví dụ, họ dự kiến ​​sẽ viết luận văn. Tại sao nó rõ ràng hơn trong các lĩnh vực khác? Tôi không chắc.
Peter Flom - Tái lập Monica

6

Ngay cả khi dữ liệu bị sai lệch (ví dụ, chi phí chăm sóc sức khỏe được tính toán cùng với một thử nghiệm lâm sàng, trong đó có rất ít bệnh nhân có tổng chi phí bằng 0 vì họ chết ngay sau khi đăng ký và rất ít bệnh nhân tích lũy hàng tấn chi phí do tác dụng phụ của chương trình chăm sóc sức khỏe đã được điều tra .


Báo lại nhận xét của Carlo: nếu bạn quan tâm đến tổng dân số (ví dụ: trong lấy mẫu kiểm toán), thì bạn quan tâm đến giá trị trung bình, thời gian. Nếu không có sự khác biệt về cách phân phối bị lệch hoặc ngoại lệ, bạn chỉ cần đối phó với nó. Bạn không thể Winsorize, trim, nếu không loại bỏ các ngoại lệ hoặc chuyển đổi nhật ký. Sự phân tầng có thể giúp rất nhiều; trong trường hợp ngoại lệ cực đoan, chúng nên được tạo thành các tầng cho chính chúng.
Peter Westfall

3

Tôi nghĩ rằng điều còn thiếu từ câu hỏi cũng như cả câu trả lời cho đến nay là cuộc thảo luận về giá trị trung bình so với trung bình trong sách thống kê giới thiệu thường diễn ra sớm trong một chương về cách tóm tắt số lượng phân phối. Trái ngược với thống kê suy luận, đây thường là về việc tạo ra các thống kê mô tả sẽ là một cách hữu ích để truyền đạt thông tin về việc phân phối dữ liệu theo số lượng trái ngược với đồ họa. Các bối cảnh trong đó phát sinh là phần thống kê mô tả của một báo cáo hoặc bài báo trong đó thường không có chỗ cho các tóm tắt đồ họa của tất cả các biến trong tập dữ liệu của bạn. Nếu phân phối bị lệch, có vẻ hợp lý trong bối cảnh này để chọn trung vị trên giá trị trung bình. Nếu phân phối đối xứng mà không có ngoại lệ,


1
Quan điểm của bạn về thống kê mô tả so với suy luận là đáng giá. Nhưng bạn đang nói một cách hiệu quả (đối với thống kê mô tả) "chỉ sử dụng giá trị trung bình khi nó giống như trung bình". Nếu phân phối bị lệch, thì trung vị thực hiện một công việc kém là đại diện cho khái niệm bình quân đầu người , phải không? Vì vậy, nó không hợp lệ để đảm nhận vị trí "chỉ sử dụng trung bình khi nó bằng giá trị trung bình?" Điều đó chỉ là tùy tiện, và dường như hướng sự chú ý ra khỏi ý nghĩa thực sự của các biện pháp này (đối với những người học chúng).
Alexis

1
Mục tiêu không phải là đại diện cho khái niệm bình quân đầu người? Nói ai? Tại sao giả định đó không phải là mục tiêu?
Alexis

1
Tôi không thấy bất kỳ sự thô lỗ hay "hành động gây sốc" nào đến từ OP ... chỉ cần nói ...
Nick Stauner

1
Tôi không thấy rằng vấn đề là bạn đang thực hiện thống kê suy luận hay mô tả trong trường hợp này. Nếu thước đo mô tả thích hợp của xu hướng trung tâm là trung vị, thì nên rút ra các kết luận về trung vị; nếu trung bình thì trung bình Nếu không có biện pháp mô tả nào có ý nghĩa, thì cũng không có biện pháp suy luận nào có ý nghĩa.
Peter Flom - Tái lập Monica

1
@PeterFlom Còn trong trường hợp mục tiêu cuối cùng không suy luận thì sao? Tôi đồng ý rằng sự phù hợp của một thống kê mô tả phụ thuộc hoàn toàn vào lý do tạo ra thống kê. Quan niệm cho rằng có thể "không có biện pháp mô tả nào có ý nghĩa" dường như ngụ ý rằng một thống kê mô tả không thể có ý nghĩa vốn có. Tôi sẽ lập luận rằng trong hầu hết các trường hợp, trung vị có ý nghĩa như một thước đo trung tâm của phân phối theo định nghĩa. Có hay không có ý nghĩa cho các mục đích khác là một câu hỏi khác.
JSK
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.