Khi tôi không thể thay thế một biến ngẫu nhiên bằng trung bình của nó?


10

Một sự đơn giản hóa thường xuyên trong mô hình hóa và mô phỏng là thay thế một biến ngẫu nhiên bằng giá trị trung bình của nó.

Khi nào sự đơn giản hóa này sẽ dẫn đến kết luận sai?


2
"Var" có đại diện cho biến hoặc phương sai hoặc Giá trị có nguy cơ không?
Henry

3
Thật vui khi bắt đầu một dịch vụ trả tiền cho thuê bao Netflix của các thành viên. Chúng tôi chỉ tính phí , nơixđược chọn ngẫu nhiên trong lĩnh vực[-100,100], vì vậy, ya biết, miễn phí Netflix! Sau đó, chúng tôi sẽ cung cấp cho một số khách hàng tùy chọn thay vì trảx2USD|x| USDmonthx[100,100] . x2 USDmonth
Nat

3
Trong một trường hợp rất đơn giản, nếu chúng ta đưa nó đến mức cực đoan, chúng ta có thể mất khá nhiều thông tin chúng ta quan tâm. Hãy xem xét hồi quy của Y trên X trong đó chúng ta thay thế cả Y và X bằng giá trị trung bình của chúng. Bất kỳ thông tin về độ dốc bây giờ bị mất.
Dason

1
Bạn đang hỏi về việc thay thế các giá trị bị thiếu, hoặc bạn đang hỏi về việc thay thế một biến ngẫu nhiên trong một bối cảnh cụ thể (ví dụ: đưa ra dự đoán dựa trên mô hình hiệu ứng ngẫu nhiên)?
IWS

Câu trả lời:


20

Nếu bạn thay thế một giá trị bị thiếu bằng một số ước tính điểm, bạn sẽ bỏ qua tất cả các biến đổi của nó. Vì vậy, bạn sẽ không tuyên truyền tất cả các biến đổi ban đầu cho mô hình của bạn. Ước tính tham số của bạn sẽ xuất hiện có quá thấp . Nếu bạn suy luận, giá trị p của bạn sẽ bị sai lệch thấp. Bạn s sẽ là quá hẹp. Nếu bạn dự đoán, của bạn sẽ quá hẹp.

Nhìn chung: bạn sẽ quá chắc chắn về kết luận của mình.


2
Câu trả lời tốt! Hãy nghĩ về cách này: Một biến ngẫu nhiên có phân phối. Nó có thể được lướt qua bên trái, bên phải. Tôi có thể là hai phương thức, v.v.
elevendollar

1
Nếu bạn thay thế một giá trị bị thiếu bằng một số ước tính điểm, bạn cũng cho rằng dữ liệu bị thiếu một cách ngẫu nhiên. Giá trị trung bình của biến ngẫu nhiên có thể không bằng giá trị trung bình của dữ liệu khi thiếu.
Neil G

@NeilG xin lỗi với nitpick, nhưng thay thế một giá trị bị thiếu bằng nghĩa của nó không có nghĩa là trực tiếp giả sử dữ liệu bị mất một cách ngẫu nhiên. Đặc biệt là vì thuật ngữ - hơi khó hiểu - xung quanh dữ liệu bị thiếu coi "mất ngẫu nhiên" là dữ liệu bị thiếu ở điều kiện ngẫu nhiên trên dữ liệu khác, nhưng đã biết ( en.wikipedia.org/wiki/Missing_data ). IMO, cách dữ liệu được thay thế không ngụ ý bất cứ điều gì về lý do đằng sau nó. Lý do đó nên được làm rõ ràng và dẫn đến cách xử lý dữ liệu còn thiếu thích hợp. Điều đó nói rằng, tôi hoàn toàn đồng ý với câu trả lời của Stephan.
IWS

@IWS Thật tốt khi các chỉ số thiếu có điều kiện trên dữ liệu được quan sát. Thiếu ngẫu nhiên có nghĩa là các chỉ số thiếu phụ thuộc vào dữ liệu không quan sát được. Nếu bạn thay thế biến bằng giá trị trung bình của nó có điều kiện trên nó đang được quan sát, thì đó có thể không giống với giá trị trung bình vô điều kiện của nó - trừ khi dữ liệu bị mất ngẫu nhiên.
Neil G

@NeilG Ý bạn là 'mất tích hoàn toàn ngẫu nhiên', khi bạn viết 'mất tích ngẫu nhiên' trong câu cuối cùng của bình luận cuối cùng của bạn? Nếu vậy, chúng tôi đồng ý, nhưng tôi chỉ hiểu về thuật ngữ. (xem trang wiki tôi đã đưa vào nhận xét của mình ở trên, tôi đã luôn được dạy, đọc và sử dụng thuật ngữ đó)
IWS

13

Ngoài những điểm của Stephan:

  • Trong hầu hết mọi ứng dụng mà bạn quan tâm đến các hàm phi tuyến của biến ngẫu nhiên, việc thay thế giá trị trung bình thường sẽ đưa ra kết quả sai lệch và có thể mâu thuẫn. Vận tốc trung bình và khối lượng trung bình của hạt nói chung sẽ không phù hợp với động năng trung bình, bởi vì năng lượng quy mô với V ^ 2.
  • Giá trị trung bình thậm chí có thể không phải là kết quả khả dĩ cho biến ngẫu nhiên. Nếu kết quả có thể xảy ra của tôi là 0 "bệnh nhân chết" và 1 "sống bệnh nhân", có lẽ không hữu ích khi có một mô hình mô tả bệnh nhân là 0,1 "hầu hết đã chết nhưng hơi sống".


1
@Alexis nhưng tất nhiên rồi!
Geoffrey Brent

0

Một ví dụ thực tế (liên quan đến hai câu trả lời bạn nhận được), trên thị trường tài chính. Giá của một quyền chọn dựa trên xác suất giá của một tài sản vượt trên (hoặc dưới) một mức nhất định.

Ví dụ: giá của tùy chọn mua một tài sản ở mức giá 100 khi giá trị kỳ vọng của tài sản là 80. Nếu bạn thay thế biến ngẫu nhiên (giá tài sản) bằng giá trị của nó, bạn sẽ nhận được giá bằng 0 (như bạn sẽ không bao giờ bằng 100 tài sản có giá 80). Khi bạn tính đến tính ngẫu nhiên của tài sản (và đó là cách làm đúng đắn), bạn sẽ có được một mức giá tích cực, vì có một số khả năng giá tài sản vượt quá 100.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.