Tại sao chúng ta không sử dụng trung bình số học thay vì trung bình hài?


12

Tôi tự hỏi giá trị nội tại của việc sử dụng trung bình hài (ví dụ để tính các số đo F) là gì, trái ngược với trung bình số học có trọng số trong việc kết hợp độ chính xác và thu hồi? Tôi đang nghĩ rằng trung bình số học có trọng số có thể đóng vai trò của ý nghĩa hài hòa, hoặc tôi đang thiếu một cái gì đó?


9
Giá trị trung bình hài trung bình số học có trọng số: mỗi có trọng số tỷ lệ với . 1 / x 2 ixi1/xi2
whuber

Bạn có thể nói thêm về cách chính xác và thu hồi được kết hợp trong thời trang này?
AdamO

6
@whuber Không chắc chắn nếu bình luận của bạn là nghiêm túc hay tặc lưỡi. Trọng lượng thường được coi là một hàm của chỉ số mẫu , không phải của giá trị mẫu . Mặt khác, bất kỳ giá trị trung bình nào cũng là trung bình số học có trọng số
Luis Mendo

2
@Luis Sự thật nằm ở giữa. Chỉ số mẫu thường là vô nghĩa. Trọng số là các hàm của các đối tượng, nhưng các hàm đó thường không phụ thuộc vào các giá trị được tính trung bình. Ví dụ là các trọng số liên quan đến thời gian (EWMA), với vị trí (như trong các biện pháp tương quan không gian), xếp hạng (như trong thử nghiệm Shapiro-Wilk) và xác suất lấy mẫu. Nhưng không phải tất cả các phương tiện đều là AM có trọng số: chẳng hạn, GM thì không. Vì Filippa hỏi về "giá trị cố định", nên có vẻ như chỉ ra mối quan hệ toán học giữa trung bình hài hòa và phương tiện có trọng số.
whuber

Câu trả lời:


18

Nói chung, phương tiện điều hòa được ưa thích khi một người đang cố gắng để tỷ lệ trung bình, thay vì toàn bộ số. Trong trường hợp của biện pháp F1, trung bình hài sẽ phạt các phần rất nhỏ hoặc thu hồi trong khi trung bình số học không có trọng số sẽ không. Hãy tưởng tượng trung bình 100% và 0%: Trung bình số học là 50% và trung bình hài là 0%. Giá trị trung bình hài hòa đòi hỏi cả độ chính xác và độ gợi nhớ phải cao.

Ngoài ra, khi độ chính xác và thu hồi gần nhau, giá trị trung bình hài sẽ gần với giá trị trung bình số học. Ví dụ: trung bình hài của 95% và 90% là 92,4% so với trung bình số học là 92,5%.

Cho dù đây là một tài sản mong muốn có thể phụ thuộc vào trường hợp sử dụng của bạn, nhưng thông thường nó được coi là tốt.

Cuối cùng, lưu ý rằng, như @whuber đã nêu trong các bình luận, trung bình hài thực sự là một trung bình số học có trọng số.


2
"trung bình điều hòa được ưa thích khi ai đang cố gắng để giá trung bình" Có lẽ nếu bạn đi du lịch km ra tại km / h và km trở lại ở km / h để có được tốc độ trung bình chung của km / h, mặc dù không nếu bạn di chuyển phút với tốc độ km / giờ và phút ở tốc độ km / giờ để có tốc độ tổng thể trung bình là km / giờ. Nhưng tôi không hiểu tại sao điều đó áp dụng cho phân số120 10 60 80 10 120 10 60 901012010608010120106090
Henry

Thật vậy, đoạn đầu tiên là một tuyên bố chung về ý nghĩa hài hòa. Nhưng bạn đã đúng, độ chính xác và thu hồi là phân số chứ không phải tỷ lệ. Tôi tin rằng có một khái niệm rằng trung bình số học được ưu tiên cho các giá trị có tổng kết có thể hiểu được (sẽ không áp dụng trong trường hợp này), nhưng chắc chắn người ta có thể lấy trung bình số học về độ chính xác và thu hồi và đưa ra kết quả hữu ích.
ilanman

Thông minh! Tôi đang tìm kiếm "biện minh" cho việc sử dụng quy tắc tính trung bình hài hòa. Nhưng tôi không chắc làm thế nào để suy nghĩ về những lời biện minh ..
olga

10

Giá trị trung bình hài có thể là một thay thế tiện dụng cho trung bình số học khi cái sau không có kỳ vọng hoặc không có phương sai. Đây thực sự có thể là trường hợp không tồn tại hoặc là vô hạn, trong khi tồn tại. Chẳng hạn, phân phối Pareto với mật độ không có giới hạn kỳ vọng khi , ngụ ý rằng trung bình số học có một kỳ vọng vô hạn, trong khi ngụ ý rằng điều hòa có ý nghĩa hữu hạn.E [ 1 / X ] f ( x ) = α x α 0E[X]E[1/X]α1E[1/X]= x 0 αx α 0

f(x)=αx0αxα+1Ixx0
α1
E[1/X]=x0αx0αxα+2dx=αx0α(α+1)x0α+1=α(α+1)x0

Ngược lại, có các bản phân phối mà trung bình hài không có kỳ vọng, ví dụ như phân phối Beta khi . Và nhiều hơn nữa mà nó không có phương sai.Be(α,β)α1

Ngoài ra còn có một liên kết với các xấp xỉ Monte Carlo với các tích phân và đặc biệt là các hằng số chuẩn hóa, dựa trên danh tính sau của Bayes trong đó là bất kỳ mật độ nào, là ưu tiên, khả năng và bên lề, như đã thảo luận về câu hỏi khác trên X đã được xác thực, trong đó tôi nhận xét về sự nguy hiểm của việc sử dụng cái mà Radford Neal (U Toronto) gọi là công cụ ước tính tồi tệ nhất của Monte Carlo . (Tôi cũng đã viết một số mục trên blog của mình về chủ đề đó.) φ()π()L(|x)m()

E[φ(θ)π(θ)L(θ|x)|x]=1m(x)
φ()π()L(|x)m()

2
Tại sao các tính chất này thích hợp hơn khi tính trung bình tỷ lệ?
Walrus the Cat

Tôi không biết kết quả tối ưu, nhưng có một người ước tính với kỳ vọng hữu hạn có vẻ thích hợp hơn với người không có!
Tây An
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.