Giá trị mong đợi so với hầu hết giá trị có thể xảy ra (chế độ)


15

Giá trị mong đợi của phân phối f(x) là giá trị trung bình, đó là giá trị trung bình có trọng số

E[x]=+xf(x)dx

Giá trị rất có thể là chế độ, đó là giá trị có thể xảy ra nhất.

Tuy nhiên, chúng ta có hy vọng bằng cách nào đó sẽ thấy E[x] rất nhiều lần không? Trích dẫn từ đây :

Nếu kết quả xi không có xác suất như nhau, thì trung bình đơn giản phải được thay thế bằng trung bình có trọng số, điều này có tính đến thực tế là một số kết quả có nhiều khả năng hơn các kết quả khác. Tuy nhiên, trực giác vẫn giữ nguyên: giá trị kỳ vọng của x là những gì người ta mong đợi sẽ xảy ra trung bình .

Tôi không thể hiểu "xảy ra trung bình" nghĩa là gì, điều này có nghĩa là, đối với istance, thực hiện một biện pháp nhiều thời gian tôi mong đợi để thấy E[x] nhiều hơn các giá trị khác của x ? Nhưng đây không phải là định nghĩa của chế độ sao?

Vậy làm thế nào để giải thích tuyên bố? Và ý nghĩa xác suất của E[x] gì?


Tôi cũng muốn đưa ra một ví dụ mà tôi bị lẫn lộn. Nghiên cứu phân phối Tôi đã học được rằng chế độχ 2 m o d e = ν - 2 , trong khi E [ χ 2 ] = ν , nơi ν là bậc tự do của dữ liệu.χ2χmode2=ν2E[χ2]=νν

Tôi nghe nói tại trường đại học đó, khi thực hiện một thử nghiệm sau khi sử dụng Least squares Phương pháp để phù hợp với một tập hợp các dữ liệu, tôi nên mong đợi để có được χ 2v bởi vì "đó là những gì xảy ra nói chung".χ2χ2ν


Tôi đã hiểu sai tất cả những điều này hay là giá trị mong đợi bằng cách nào đó rất có thể xảy ra? (Ngay cả khi giá trị có thể xảy ra nhất dĩ nhiên là chế độ)


4
Tôi thực sự thích sức mạnh của phép ẩn dụ vé trong câu hỏi này, bởi vì nó tạo ra một câu trả lời đơn giản, rõ ràng: kỳ vọng của một biến ngẫu nhiên là tổng giá trị của nó (như được vẽ trên vé) chia cho số lượng vé. Đó là nó. Bất kỳ tuyên bố nào không tuân theo định nghĩa này (hoặc tương đương toán học phức tạp hơn của nó) chỉ là một heuristic và rất có thể không chính xác trong một số trường hợp.
whuber

Câu trả lời:


18

Đối với phân phối chuẩn, giá trị mong đợi, còn gọi là giá trị trung bình, bằng với chế độ.

Nói chung, không chỉ giá trị mong đợi không chỉ không có khả năng nhất (hoặc ở mật độ cao nhất), mà còn có thể không có cơ hội xảy ra. Chẳng hạn, hãy xem xét biến ngẫu nhiên X bằng 0 hoặc 2, mỗi biến có xác suất 0,5. Khi đó EX = 1, nhưng giá trị mong đợi, 1, có 0 xác suất xảy ra, trong khi 0 và 2 là cả hai chế độ phân phối.

Câu trích dẫn "giá trị kỳ vọng của x là những gì người ta dự kiến ​​sẽ xảy ra trung bình" là ngôn ngữ của giáo dân phi kỹ thuật, điều hiển nhiên là do sự nhầm lẫn của bạn, chỉ phục vụ cho vấn đề nhầm lẫn. Giá trị mong đợi có một ý nghĩa rất cụ thể trong xác suất là trung bình toán học. Trong khi trong ngôn ngữ của giáo dân, một giá trị dự kiến ​​hoặc "trung bình" có thể là một cái gì đó dự kiến ​​sẽ xảy ra. Chúng có thể được đối chiếu nếu "trung bình" được hiểu là trung bình toán học của những gì xảy ra.

Mong đợi của bạn,

Trung bình Joe


1
Bắt đầu câu hỏi: Điều gì về trung vị, được đảm bảo là có thể ?
ngôi sao sáng

Như @TrevorAlexander đã nói, chế độ cũng không đảm bảo. Xem xét chế độ phân phối liên tục.
Tim

3
@Trevor Alexander Luôn luôn có một trung vị có thể (xác suất dương hoặc mật độ). Tuy nhiên, không phải tất cả các trung vị là nhất thiết có thể. Một trung bình của biến X là ngẫu nhiên bất kỳ điểm nào m mà P ( X m ) 1 / 2 . Nếu X bằng 1,2,3 hoặc 4, mỗi số có xác suất 1/4, thì bất kỳ số nào trong khoảng [2,3] là trung vị của X.P(Xm)1/2P(Xm)1/2
Mark L. Stone

5

P(X=E(X))=0
X

Sự biện minh duy nhất cho giá trị mong đợi và lý do tại sao chúng ta "mong đợi được nhìn thấy nó thường xuyên", là Luật số lượng lớn :

nXi

X1++XnnE(X)

p>1211p0

E(X)=1p+0(1p)=p

Bây giờ rõ ràng "p" sẽ không bao giờ xảy ra (đó là đầu hoặc đuôi, 0 hoặc 1).

E(X)=p


Tôi sẽ không nói luật số lượng lớn là sự biện minh duy nhất cho giá trị mong đợi. Ví dụ, en.wikipedia.org/wiki/ đá là một biện minh cho việc xem xét các giá trị dự kiến ​​của các hàm tiện ích (Tôi chưa nghiên cứu bằng chứng nhưng tôi ngạc nhiên nếu nó dựa trên luật số lượng lớn).
Juho Kokkala

3

Tôi không thích thuật ngữ "giá trị mong đợi" và đã không sử dụng nó khi giảng dạy xác suất. "Ý nghĩa số học" là tốt hơn, theo ý kiến ​​của tôi, bởi vì trung bình số học của một cái chết 6 mặt là 3,5 nhưng một con số như vậy không xảy ra. Ban đầu tôi đã nghe cụm từ "giá trị kỳ vọng" cho khái niệm này khi ở trường đại học. Rất nhiều thuật ngữ kỹ thuật không đồng ý với ý nghĩa phi kỹ thuật rõ ràng. ("Hoặc" xuất hiện trong tâm trí.)

Lưu ý rằng một phân phối có thể có nhiều hơn một chế độ nhưng trung bình số học là duy nhất. Chế độ, giá trị trung bình và trung vị là khác nhau và có cách sử dụng khác nhau.


1
Đẹp một trong những "hoặc". Điều đó khiến tôi nghĩ về khóa học của mình về Lập trình tuyến tính, trong đó chúng tôi đã nghiên cứu một số Định lý về Phương án. Chúng có dạng "Hoặc A là đúng hoặc B là đúng, nhưng không phải cả hai". Dễ dàng hơn nhiều để diễn đạt nó thành A xor B. Tôi không nghe thấy việc sử dụng xor nhiều trong cuộc trò chuyện trên đường phố thông thường.
Mark L. Stone

2

Sự khác biệt là dễ thấy nhất với các bản phân phối rời rạc:

Xem xét hai bộ giá trị trong đó mỗi số có khả năng được rút ra như nhau: {1,2,2,2,10} và {1,2,2,2,3}.

Cả hai đều có cùng chế độ (2), nhưng các giá trị dự kiến ​​khác nhau. Giá trị mong đợi sẽ tăng thêm trọng lượng cho các giá trị lớn trong khi chế độ chỉ đơn giản là tìm kiếm giá trị nào xảy ra thường xuyên. Vì vậy, nếu bạn đã rút ra từ phân phối này rất nhiều lần, trung bình mẫu của bạn sẽ gần với giá trị mong đợi, trong khi số nguyên phổ biến nhất sẽ xảy ra sẽ gần với chế độ.

mode= =mộtrgtối đaf(x) trong khi bạn đã trình bày ở trên, giá trị mong đợi sẽ tích hợp x*f(x) do đó, nó xem xét trọng lượng của mỗi x.

Việc sử dụng ngôn ngữ để phân biệt giữa các biện pháp khác nhau của xu hướng trung tâm là một vấn đề phổ biến khi học thống kê. Ví dụ: trung vị là một thước đo khác không bị sai lệch bởi các giá trị lớn như trung bình.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.