Nếu có nghĩa là rất nhạy cảm, tại sao đầu tiên sử dụng nó?


84

Đó là một thực tế được biết rằng trung vị chống lại các ngoại lệ. Nếu đó là trường hợp, khi nào và tại sao chúng ta sẽ sử dụng giá trị trung bình ở nơi đầu tiên?

Một điều tôi có thể nghĩ có lẽ là để hiểu sự hiện diện của các ngoại lệ, tức là nếu trung vị cách xa trung bình, thì phân phối bị lệch và có lẽ dữ liệu cần được kiểm tra để quyết định những gì sẽ được thực hiện với các ngoại lệ. Có công dụng nào khác không?


14
Về câu hỏi đầu tiên, một lưu ý phụ: Trung bình trong thống kê chỉ là khoảnh khắc đầu tiên của dân số , trong khi trung bình thì không. Tìm cách sử dụng CLT, luật số lượng lớn, v.v ... bạn lại được liên kết với sự tồn tại của những khoảnh khắc hữu hạn. Mặc dù lấy ví dụ phân phối Cauchy: tồn tại trung bình, trong khi đó có nghĩa là không;)
Dmitrij Celov

2
@Dmitrij Đó là một câu trả lời sâu sắc và sâu sắc. Tại sao bạn không giải thích về nó trong một câu trả lời?
whuber

Nếu bạn không sử dụng có nghĩa là bạn làm tổn thương cảm xúc của nó? (Xin lỗi, không thể cưỡng lại.)
Daniel R Hicks

3
@Daniel R Hicks: Và điều đó khá có ý nghĩa, phải không? (Xin lỗi, không thể cưỡng lại là tốt).
Muhammad Alkarouri

3
Câu hỏi này thú vị hơn nhiều so với thông thường, "Tại sao chúng ta không luôn luôn sử dụng các thuật toán mạnh mẽ?" câu hỏi, nhưng có thể có cùng suy nghĩ tiềm ẩn rằng "mạnh mẽ == ma thuật" và nếu chúng ta chỉ sử dụng các phương pháp mạnh mẽ, chúng ta sẽ không phải kiểm tra dữ liệu của mình, hiểu nó hoặc lo lắng về các loại vấn đề chính xác khác nhau, vì chúng "Mạnh mẽ". Tuy nhiên, +1.
Wayne

Câu trả lời:


113

Theo một nghĩa nào đó, giá trị trung bình được sử dụng nó nhạy cảm với dữ liệu. Nếu phân phối xảy ra đối xứng và đuôi giống như phân phối bình thường, giá trị trung bình là một bản tóm tắt rất hiệu quả của xu hướng trung tâm. Trung vị, trong khi mạnh mẽ và được xác định rõ ràng cho bất kỳ phân phối liên tục nào, chỉ có hiệu quả như trung bình nếu dữ liệu xảy ra từ phân phối bình thường. Chính sự không hiệu quả tương đối này của trung vị khiến chúng ta không sử dụng nó nhiều hơn chúng ta làm. Sự kém hiệu quả tương đối chuyển thành một sự kém hiệu quả tuyệt đối nhỏ khi kích thước mẫu trở nên lớn, vì vậy đối với lớn, chúng ta có thể không cảm thấy tội lỗi hơn khi sử dụng trung bình. n2πn

Thật thú vị khi lưu ý rằng đối với thước đo biến đổi (độ lan truyền, độ phân tán), có một công cụ ước tính rất mạnh có hiệu suất 0,98 như độ lệch chuẩn, cụ thể là độ lệch trung bình của Gini. Đây là sự khác biệt tuyệt đối trung bình giữa bất kỳ hai quan sát. [Bạn phải nhân độ lệch chuẩn mẫu với một hằng số để ước tính cùng một lượng ước tính bằng chênh lệch trung bình của Gini.] Một thước đo hiệu quả của xu hướng trung tâm là công cụ ước lượng Hodges-Lehmann, nghĩa là trung bình của tất cả các phương tiện cặp. Chúng tôi sẽ sử dụng nó nhiều hơn nếu giải thích nó đơn giản hơn.


13
+1 khi đề cập đến công cụ ước tính Hodges-Lehmann về xu hướng trung tâm. Trong nhiều khía cạnh, nó là giữa trung bình và trung bình. Nếu chỉ dễ dàng tính toán trong mẫu lớn thì nó sẽ phổ biến hơn trung bình hoặc trung bình như là thước đo vị trí, tôi nghĩ vậy.
ttnphns

BTW, @Frank, bạn có biết phân phối lấy mẫu lý thuyết nào mà trung tâm Hodges-Lehmann theo sau không? Tôi không - và tôi quan tâm.
ttnphns

16
Cảm ơn đã bình luận. Một lớp lót trong R có thể tính toán hiệu quả lên tới N = 5000 : w <- outer(x, x, '+'); median(w[row(w) >= col(w)])/2. Một chương trình C, Fortran hoặc Ratfor tầm thường có thể được gọi bởi R để làm cho nó nhanh hơn. Gói ICSNP trong R có triển khai khá hiệu quả với hl.locchức năng của nó . Với N = 5000, nó nhanh hơn 2,66 lần so với mã trên (tổng thời gian 1,5 giây). Nó sẽ là tốt đẹp để có được một khoảng tin cậy một cách hiệu quả.
Frank Mitchell

@FrankHarrel bạn có thể nói gì về công cụ ước tính và cho độ lệch chuẩn? Tôi nên sử dụng hằng số nào để ước tính bằng cách sử dụng mức chênh lệch trung bình của Gini cho các bản phân phối không bình thường? Tôi không thể tìm thấy các bài viết mô tả quy trình tính toán của hằng số này trong các nguồn truy cập mở ... Ngoài ra tôi không tìm thấy bất kỳ thông tin nào về sự mạnh mẽ của sự khác biệt trung bình của Gini, bạn có thể đưa ra ý tưởng tìm kiếm nó ở đâu không? Q n σSnQnσ
Đức Demidov

1
Chúng tôi đang nói về các biện pháp phân tán để so sánh các mô hình không phải là vấn đề (và đừng nhầm lẫn với "Chỉ số của Gini"). Sự khác biệt trung bình của Gini là một thước đo tuyệt đối. Nó dễ giải thích hơn các biện pháp khác. Việc bạn cần tính một hằng số khác nhau cho mỗi phân phối cho tôi biết rằng chúng ta không muốn sử dụng hằng số.
Frank Harrell

36

Đã có rất nhiều câu trả lời tuyệt vời, nhưng, lùi lại một bước và trở nên cơ bản hơn một chút, tôi sẽ nói đó là vì câu trả lời bạn nhận được phụ thuộc vào câu hỏi bạn hỏi. Giá trị trung bình và trung bình trả lời các câu hỏi khác nhau - đôi khi một là thích hợp, đôi khi khác.

Thật đơn giản để nói rằng trung vị nên được sử dụng khi có các ngoại lệ, hoặc cho các phân phối sai lệch, hoặc bất cứ điều gì. Nhưng không phải lúc nào cũng như vậy. Lấy thu nhập - gần như luôn được báo cáo với trung vị, và thường là đúng. Nhưng nếu bạn đang nhìn vào sức mạnh chi tiêu của cả một cộng đồng, nó có thể không đúng. Và trong một số trường hợp, ngay cả chế độ có thể là tốt nhất (đặc biệt nếu dữ liệu được nhóm lại).


8
+1 cho điểm rõ ràng mà dường như không ai khác giải quyết: chúng là các khái niệm khác nhau và trả lời các câu hỏi khác nhau. Ngoài ra, trong nhiều trường hợp, phần lớn bị mất bằng cách cô đọng toàn bộ phân phối thành một số tóm tắt, vì vậy đôi khi cả hai đều làm một công việc tệ hại.
Michael McGowan

25

Khi một giá trị là rác đối với chúng tôi, chúng tôi gọi nó là "outliar" và muốn phân tích mạnh mẽ với nó (và thích trung bình hơn); khi cùng một giá trị đó là hấp dẫn, chúng tôi gọi nó là "cực đoan" và muốn phân tích nhạy cảm với nó (và thích trung bình hơn). Phép biện chứng ...

Giá trị trung bình phản ứng như nhau đối với sự thay đổi của giá trị bất kể nơi nào trong phân phối diễn ra sự thay đổi. Ví dụ: trong 1 2 3 4 5bạn có thể tăng bất kỳ giá trị nào lên 2 - mức tăng của giá trị trung bình sẽ giống nhau. Phản ứng của Median ít "nhất quán" hơn: thêm 2 vào điểm dữ liệu 4 hoặc 5 và trung bình sẽ không tăng; nhưng thêm 2 vào điểm 2 - sao cho sự thay đổi vượt qua trung vị và trung vị thay đổi đáng kể (rất nhiều so với trung bình sẽ thay đổi).

Có nghĩa là luôn luôn chính xác nằm. Trung bình là không; ví dụ, trong tập hợp 1 2 3 4 bất kỳ giá trị nào giữa 2 và 3 có thể được gọi là trung vị. Do đó, các phân tích dựa trên trung vị không phải lúc nào cũng là giải pháp duy nhất.

Trung bình là một quỹ tích của độ lệch bình phương tối thiểu. Nhiều tác vụ tối ưu hóa dựa trên đại số tuyến tính (bao gồm hồi quy OLS nổi tiếng) giảm thiểu lỗi bình phương này và do đó ngụ ý khái niệm trung bình. Trung vị một quỹ tích của độ lệch tổng tuyệt đối tối thiểu. Các kỹ thuật tối ưu hóa để giảm thiểu lỗi như vậy là phi tuyến tính và phức tạp hơn / được biết đến ít hơn.


2
+1 Tôi có một chút lo ngại rằng đoạn đầu tiên có thể bị hiểu nhầm là ngụ ý phát hiện ngoại lệ hoàn toàn là một quá trình chủ quan. Tôi không nghĩ rằng bạn có nghĩa là ngụ ý rằng, mặc dù.
whuber

8
+1 | Tôi nghĩ rằng câu đầu tiên ngụ ý rằng việc áp dụng phát hiện ngoại lệ là hoàn toàn chủ quan và do đó tôi bỏ phiếu để giữ nguyên trạng.
Giăng

2
Tôi có nghĩa là phát hiện ra bên ngoài là thủ tục nghiêm ngặt với nguồn gốc triết học hoặc đạo đức chủ quan
ttnphns

3
@ttnphns, việc đánh vần "outliar" thay vì "ngoại lệ" là cố ý hay không?
mpiktas

1
Lỗi đánh máy không chủ ý.
ttnphns

16

Có rất nhiều câu trả lời cho câu hỏi này. Đây là một cái mà bạn có thể sẽ không thấy ở nơi nào khác vì vậy tôi đưa nó vào đây bởi vì tôi tin rằng nó phù hợp với chủ đề này. Mọi người thường tin rằng vì trung vị được coi là một biện pháp mạnh mẽ đối với các ngoại lệ nên nó cũng mạnh mẽ đối với hầu hết mọi thứ. Trên thực tế, nó cũng được coi là mạnh mẽ để thiên vị trong phân phối sai lệch. Hai tính chất mạnh mẽ của trung vị thường được dạy cùng nhau. Người ta có thể lưu ý rằng các phân phối sai lệch cơ bản cũng có xu hướng tạo ra các mẫu nhỏ trông giống như chúng có các ngoại lệ và sự khôn ngoan thông thường là người ta sử dụng trung bình trong các tình huống như vậy.

#function to generate random values from a skewed distribution
rexg <- function (n, m, sig, tau) {
    rexp(n, rate = 1/tau) + rnorm(n, mean = m, sd = sig)
    }

(chỉ là một minh chứng rằng điều này bị lệch và hình dạng cơ bản)

hist(rexg(1e4, 0, 1, 1))

âm mưu

Bây giờ, hãy xem điều gì xảy ra nếu chúng ta lấy mẫu từ phân phối kích cỡ mẫu khác nhau này và tính toán trung bình và có nghĩa là để xem sự khác biệt giữa chúng là gì.

#generate values with various n's
N <- 1e4
ns <- 2:30
y <- sapply(ns, function(x) mean(apply(matrix(rexg(x*N, 0, 1, 1), ncol = N), 2, median)))
plot(ns,y, type = 'l', ylim = c(0.85, 1.03), col = 'red') 
y <- sapply(ns, function(x) mean(colMeans(matrix(rexg(x*N, 0, 1, 1), ncol = N))))
lines(ns,y)

lô2

Như có thể thấy từ âm mưu trên, trung vị (màu đỏ) nhạy cảm hơn nhiều so với giá trị trung bình. Điều này trái với một số sự khôn ngoan thông thường liên quan đến việc sử dụng trung bình với ns thấp, đặc biệt là nếu phân phối có thể bị sai lệch. Và, nó củng cố quan điểm rằng giá trị trung bình là một giá trị đã biết trong khi trung vị nhạy cảm với các thuộc tính khác, một giá trị nếu là n.

Phân tích này tương tự như Miller, J. (1988). Một cảnh báo về thời gian phản ứng trung bình. Tạp chí Tâm lý học Thực nghiệm: Nhận thức và Hiệu suất của Con người , 14 (3): 539 trừ543.

CÁCH MẠNG

Khi nghĩ về vấn đề sai lệch, tôi đã nghĩ rằng tác động lên trung vị có thể chỉ là do trong các mẫu nhỏ, bạn có xác suất lớn hơn là trung vị nằm ở đuôi phân phối, trong khi giá trị trung bình sẽ luôn luôn được cân nhắc bởi các giá trị gần hơn với chế độ. Do đó, có lẽ nếu người ta chỉ lấy mẫu với xác suất ngoại lệ thì có thể kết quả tương tự sẽ xảy ra.

Vì vậy, tôi đã nghĩ về các tình huống có thể xảy ra ngoại lệ và các nhà thí nghiệm có thể cố gắng loại bỏ chúng.

Nếu các ngoại lệ xảy ra một cách nhất quán, chẳng hạn như một trong mỗi lần lấy mẫu dữ liệu, thì các trung vị sẽ mạnh mẽ chống lại tác động của ngoại lệ này và câu chuyện thông thường về việc sử dụng các giá trị trung bình.

Nhưng đó không phải là cách mọi thứ diễn ra.

Người ta có thể tìm thấy một ngoại lệ trong rất ít tế bào của một thí nghiệm và quyết định sử dụng trung bình thay vì trung bình trong trường hợp này. Một lần nữa, trung vị mạnh hơn nhưng tác động thực tế của nó là tương đối nhỏ vì có rất ít ngoại lệ. Đây chắc chắn sẽ là một trường hợp phổ biến hơn sau đó là trường hợp trên nhưng hiệu quả của việc sử dụng trung bình có lẽ sẽ rất nhỏ đến mức nó sẽ không quan trọng lắm.

Có lẽ phổ biến hơn các ngoại lệ có thể là một thành phần ngẫu nhiên của dữ liệu. Ví dụ, độ lệch trung bình và độ lệch chuẩn của dân số có thể là khoảng 0 nhưng có một tỷ lệ phần trăm thời gian chúng ta lấy mẫu từ dân số ngoại lệ trong đó trung bình là 3. Hãy xem xét mô phỏng sau, trong đó chỉ một dân số được lấy mẫu thay đổi mẫu kích thước.

#generate n samples N times with an outp probability of an outlier.
rout <- function (n, N, outp) {
    outPos <- sample(0:1,n*N, replace = TRUE, prob = c(1-outp,outp))
    numOutliers <- sum(outPos)
    y <- matrix( rnorm(N*n), ncol = N )
    y[which(outPos==1)] <- rnorm(numOutliers, 4)
    return(y)
    }

outp <- 0.1
N <- 1e4
ns <- 3:30
yMed <- sapply(ns, function(x) mean(apply(rout(x,N,outp), 2, median)))
var(yMed)
yM <- sapply(ns, function(x) mean(colMeans(rout(x,N,outp))))
var(yM)
plot(ns,yMed, type = 'l', ylim = range(c(yMed,yM)), ylab = 'Y', xlab = 'n', col = 'red') 
lines(ns,yM)

các kết quả

Trung vị là màu đỏ và có nghĩa là màu đen. Đây là một phát hiện tương tự như phân phối sai lệch.

Trong một ví dụ tương đối thực tế về việc sử dụng trung vị để tránh ảnh hưởng của các ngoại lệ, người ta có thể đưa ra các tình huống trong đó ước tính bị ảnh hưởng nhiều hơn khi sử dụng trung bình so với khi sử dụng giá trị trung bình.


Ví dụ đẹp, nhưng nó thực sự phụ thuộc vào việc phân phối. Nếu bạn sử dụng phân phối bình thường hoặc phân phối đồng đều thì biểu đồ rất khác nhau, với hai dòng được xếp chồng lên nhau. Đó là sự phân phối theo cấp số nhân tạo ra sự khác biệt.
nico

1
-1 Câu trả lời này nhầm lẫn "độ nhạy" với "bias".
whuber

4
Tốt hơn nhiều; Tôi đã gỡ bỏ downvote. Nhưng tôi bị thu hút bởi lời giải thích mới: bạn có thể chỉ ra một số nguồn - văn bản, giấy hoặc trang web - thực sự đưa ra tuyên bố "[trung vị] cũng được coi là mạnh mẽ để thiên vị trong phân phối sai lệch" và giải thích điều đó có nghĩa là gì Tôi chưa từng gặp một yêu cầu như vậy trước đây và không chắc nó thực sự nói gì.
whuber

3
Đó là kiến ​​thức dân gian hơn để đối phó với thời gian phản ứng (được biết là bị sai lệch) trong nghiên cứu tâm lý học. Tôi đưa vào một tài liệu tham khảo một bài báo bác bỏ trí tuệ dân gian trong tâm lý học (rằng tôi cảm thấy tồi tệ vì không tham khảo sớm hơn).
Giăng

3
BTW, mặc dù trên giấy Miller (1988), người ta vẫn sử dụng thời gian phản ứng trung bình trong các nghiên cứu với các thao tác xác suất trong đó các điều kiện có số lượng mẫu khác nhau và mẫu thấp hơn thường khá nhỏ.
Giăng

11
  • Từ trung bình, thật dễ dàng để tính tổng trên tất cả các mục, ví dụ: nếu bạn biết thu nhập trung bình của dân số và quy mô dân số, bạn có thể tính ngay tổng thu nhập của toàn bộ dân số.

  • Giá trị trung bình là đơn giản để tính toán trong O(n)độ phức tạp thời gian. Tính toán trung vị trong thời gian tuyến tính là có thể nhưng đòi hỏi nhiều suy nghĩ hơn. Các giải pháp rõ ràng đòi hỏi sắp xếp có O(n log n)độ phức tạp thời gian ( ) tồi tệ hơn .

Và tôi suy đoán rằng có một lý do khác cho việc có nghĩa là phổ biến hơn so với trung bình:

  • Giá trị trung bình được dạy cho nhiều người hơn ở trường và có lẽ nó được dạy trước khi dạy trung bình

Đối với điểm phức tạp thời gian của bạn, nó phụ thuộc vào cách các giá trị được lưu trữ. Nếu các giá trị đã được sắp xếp, thì chắc chắn có thể tính trung bình theo độ phức tạp thời gian trường hợp xấu nhất O (1).
luiscubal

Tôi đồng ý - khả năng ứng dụng của nó trong các phép tính như tổng là một trong những lợi thế chính của giá trị trung bình. Mặc dù tôi thường thích trung bình khi mục tiêu là để mô tả một cái gì đó, chúng tôi thường sử dụng giá trị trung bình khi nó là đầu vào cho một phép tính khác.
Jonathan

5

"Người ta biết rằng trung vị chống lại các ngoại lệ. Nếu đó là trường hợp, khi nào và tại sao chúng ta sẽ sử dụng giá trị trung bình ở vị trí đầu tiên?"

Trong trường hợp người ta biết không có ngoại lệ, ví dụ khi người ta biết quá trình tạo dữ liệu (ví dụ như trong thống kê toán học).

Chúng ta nên chỉ ra một điều tầm thường, rằng, hai đại lượng này (trung bình và trung bình) thực sự không đo lường cùng một thứ và hầu hết người dùng yêu cầu cái trước khi cái mà họ thực sự quan tâm đến cái sau (điểm này được minh họa rõ bởi các xét nghiệm Wilcoxon dựa trên trung vị dễ hiểu hơn các xét nghiệm t).

Sau đó, có những trường hợp vì lý do tình huống này hay lý do khác, một số quy định áp đặt việc sử dụng ý nghĩa của anh ta.


2

Nếu mối quan tâm là sự hiện diện của các ngoại lệ, có một số cách đơn giản để kiểm tra dữ liệu của bạn.

Các ngoại lệ, gần như theo định nghĩa, đi vào dữ liệu của chúng tôi khi có gì đó thay đổi trong quá trình tạo dữ liệu hoặc trong quá trình thu thập dữ liệu. tức là dữ liệu không còn đồng nhất. Nếu dữ liệu của bạn không đồng nhất thì cả trung bình và trung bình đều không có ý nghĩa gì, vì bạn đang cố ước tính xu hướng trung tâm của hai bộ dữ liệu riêng biệt được trộn lẫn với nhau.

Phương pháp tốt nhất để đảm bảo tính đồng nhất là kiểm tra các quy trình tạo và thu thập dữ liệu để đảm bảo rằng tất cả dữ liệu của bạn đến từ một bộ quy trình. Không có gì đánh bại một chút năng lực não bộ, ở đây.

Khi kiểm tra thứ cấp, bạn có thể chuyển sang một trong một số kiểm tra thống kê: kiểm tra bình phương, kiểm tra Q của Dixon, kiểm tra của Grubb hoặc biểu đồ kiểm soát / biểu đồ hành vi xử lý (thường là X-bar R hoặc XmR). Kinh nghiệm của tôi là, khi dữ liệu của bạn có thể được sắp xếp khi nó được thu thập, các biểu đồ hành vi quá trình sẽ tốt hơn trong việc phát hiện các ngoại lệ so với các thử nghiệm ngoại lệ. Việc sử dụng này cho các biểu đồ có thể gây tranh cãi, nhưng tôi tin rằng nó hoàn toàn phù hợp với mục đích ban đầu của Shewhart và nó là một cách sử dụng được Donald Wheeler ủng hộ rõ ràng . Cho dù bạn sử dụng các bài kiểm tra ngoại lệ hoặc biểu đồ hành vi quy trình, hãy nhớ rằng "ngoại lệ" được phát hiện chỉ là tiềm năng báo hiệukhông đồng nhất cần được kiểm tra thêm. Sẽ hiếm khi có ý nghĩa để loại bỏ các điểm dữ liệu nếu bạn không có một số lời giải thích cho lý do tại sao chúng là ngoại lệ.

Nếu bạn đang sử dụng R, gói outliers cung cấp các bài kiểm tra ngoại lệ và đối với các biểu đồ hành vi xử lý có qcc , IQCC và qAnalyst. Tôi có một sở thích cá nhân cho việc sử dụng và đầu ra của gói qcc.


2

Khi nào bạn có thể muốn có nghĩa?

Ví dụ từ tài chính:

  • Lợi nhuận trái phiếu:
    • Lợi nhuận trái phiếu trung bình thường sẽ là một vài điểm phần trăm.
    • Lợi tức trái phiếu trung bình có thể thấp hoặc cao tùy theo tỷ lệ mặc định và phục hồi theo mặc định. Các trung vị sẽ bỏ qua tất cả điều này!
    • Chúc may mắn giải thích cho các nhà đầu tư của bạn, "Tôi biết rằng quỹ của chúng tôi đã giảm 40% trong năm nay vì gần một nửa số trái phiếu đã bị phá vỡ mà không phục hồi, nhưng trái phiếu trung bình của chúng tôi đã trả lại 1%!"
  • Hoàn vốn đầu tư mạo hiểm:
    • Điều tương tự ngược lại. Đầu tư trung bình của VC hoặc thiên thần là một sự phá sản, và tất cả sự trở lại đến từ một vài người chiến thắng! (Lưu ý / cảnh báo bên lề: ước tính vốn đầu tư mạo hiểm hoặc lợi nhuận cổ phần tư nhân rất có vấn đề ... hãy cẩn thận!)

Khi hình thành một danh mục đầu tư đa dạng, quyết định đầu tư vào cái gì và bao nhiêu, giá trị trung bình và hiệp phương sai có thể là yếu tố nổi bật trong vấn đề tối ưu hóa của bạn.


Đồng ý, nhưng có vẻ như trung bình hoặc trung bình không phải là trọng tâm trong bất kỳ tình huống nào: đúng hơn là tổng số có thể là đại lượng chính. Đương nhiên, điều đó có nghĩa là điều đó có nghĩa là tóm tắt tốt hơn so với trung bình. Nhưng được cho rằng lợi nhuận trái phiếu trung bình có thể là một câu trả lời ngớ ngẩn, nhưng có ai đề xuất nó?
Nick Cox

@NickCox Hai bình luận. (1) Rằng lợi nhuận trái phiếu trung bình là ngớ ngẩn là điểm! Có những lý thuyết tuyệt vời trong những câu trả lời này, nhưng tôi nghĩ một ví dụ cực kỳ đơn giản có thể thêm một số màu sắc. Để trích dẫn câu trả lời của Frank, "giá trị trung bình được sử dụng vì nó nhạy cảm với dữ liệu" và lợi nhuận của danh mục đầu tư mang đến một tình huống đơn giản, dễ hiểu khi bạn muốn điều đó. (2) Sự khác biệt giữa việc quan tâm đến "tổng" so với quan tâm đến "ý nghĩa" có thể trở nên khá mơ hồ. "Tôi có nên đầu tư vào một quỹ phòng hộ?" Để trả lời điều đó, có lẽ tôi muốn biết, "lợi nhuận trung bình của các quỹ phòng hộ là gì?"
Matthew Gunn

1
(1) Tôi đồng ý, như đã nói; Câu hỏi của tôi chỉ là liệu trung bình được đề cập nghiêm túc trong giảng dạy hoặc nghiên cứu tài liệu cho mục đích này. (2) Tôi không nghĩ quan điểm của mình là mơ hồ; đó là một câu hỏi đơn giản về những gì đến trước, nghĩa là thực sự quan tâm. Tôi thấy các tiêu đề "băng đảng bị bỏ tù tổng cộng 200 năm" và tôi biết tại sao chúng được in, nhưng đó là một cách tóm tắt kỳ lạ. Ngược lại, 200 người thiệt mạng trong một loạt các thảm họa là chủ yếu, thay vì 5 thảm họa với trung bình 40 người thiệt mạng. Vấn đề (nhỏ) là chọn phát biểu tóm tắt nào là phù hợp nhất.
Nick Cox

@NickCox Điểm lấy. Tôi đồng ý bạn quan tâm đến tổng số các khoản đầu tư của riêng bạn. Khi hình thành một danh mục đầu tư và quyết định trọng lượng danh mục đầu tư đối với các chứng khoán cụ thể, bạn sẽ quan tâm đến các đặc tính của lợi nhuận của chứng khoán đó. Tôi sẽ không mua TẤT CẢ trái phiếu thành phố, tôi không quan tâm trực tiếp đến tổng số, nhưng tôi quan tâm đến lợi nhuận trung bình của trái phiếu thành phố là bao nhiêu? Các thuộc tính rủi ro / lợi nhuận nếu tôi thêm một vài vào danh mục đầu tư của tôi là gì?
Matthew Gunn

Đã đồng ý. Đó là lãnh thổ ở đây.
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.