Tại sao phân phối quan trọng?


10

Điều này cũng có thể đi xuống như những câu hỏi khôn ngoan nhất từng được hỏi trên diễn đàn này, nhưng đã nhận được câu trả lời đúng đắn và có ý nghĩa cho một câu hỏi trước đó, tôi nghĩ rằng tôi sẽ kéo dài vận may của mình một lần nữa.

Tôi đã rất bối rối trong một thời gian về tầm quan trọng của phân phối thống kê, đặc biệt là khi chúng liên quan đến lợi nhuận tài sản và thậm chí cụ thể hơn trong phân bổ tài sản.

Câu hỏi của tôi cụ thể là: Giả sử tôi có 20 năm dữ liệu trả lại hàng tháng của S & P 500, tại sao tôi cần phải sử dụng một loại phân phối nhất định (ví dụ: chuyến bay Bình thường / Johnson / Levy, v.v.) cho quyết định phân bổ tài sản của tôi khi tôi có thể đơn giản chỉ cần đưa ra quyết định phân bổ tài sản của tôi dựa trên dữ liệu lịch sử tôi có với tôi?


3
hãy nhớ rằng nếu bạn thấy câu trả lời cho câu hỏi trước của mình hữu ích, bạn có thể đánh dấu chúng là 'được chấp nhận' bằng cách nhấp vào hộp kiểm bên cạnh câu trả lời. Điều này cho người khác biết câu hỏi của bạn đã được giải quyết.
Jeff

2
Thực sự có một bài đăng gần đây từ JDCook về chủ đề đó. Để phác thảo mức độ liên quan của nó với câu hỏi của bạn, tôi sẽ trích dẫn từ đoạn đầu tiên "Khi các nhà thống kê phân tích dữ liệu, họ không chỉ nhìn vào dữ liệu bạn mang đến cho họ. Họ cũng xem xét dữ liệu giả định mà bạn có thể mang theo. Nói cách khác , họ xem xét những gì có thể xảy ra cũng như những gì thực sự đã xảy ra. "
user603

Tôi tin rằng Taleb đã có điều gì đó để nói về các vấn đề khi đưa ra quyết định chỉ từ dữ liệu lịch sử :-). (Dữ liệu lịch sử thường không tiết lộ trực tiếp các sự kiện "thiên nga đen" hiếm gặp nhưng có thể gây tử vong cho đến khi quá muộn.)
whuber

2
... vì hầu hết gà tây sẽ nhận ra trong một vài tuần nữa.
Ryogi

Để mở rộng quan điểm của @ user603 - bạn muốn suy luận bên ngoài mẫu của mình. Cụ thể, điểm phân bổ tài sản của bạn liên quan đến hành vi trong tương lai , không phải hành vi trong quá khứ. Điều này bao gồm, ví dụ, cách mọi thứ hoạt động ở đuôi, nơi bạn có ít quan sát. Bạn có thể mang lại kiến ​​thức / hiểu biết / thành kiến ​​bổ sung về quy trình thông qua các giả định phân phối. Nếu những giả định này ở đâu đó gần bên phải, bạn có thể thêm rất nhiều thông tin.
Glen_b -Reinstate Monica

Câu trả lời:


5

Sử dụng phân phối giả định (ví dụ: phân tích tham số) sẽ giảm chi phí tính toán cho phương pháp của bạn. Tôi giả sử rằng bạn muốn thực hiện một nhiệm vụ hồi quy hoặc phân loại. Điều này có nghĩa là tại một số điểm bạn sẽ ước tính phân phối một số dữ liệu. Các phương pháp không tham số rất hữu ích khi dữ liệu không phù hợp với phân phối được nghiên cứu kỹ, nhưng chúng thường mất nhiều thời gian hơn để tính toán hoặc nhiều bộ nhớ hơn để lưu trữ.

Ngoài ra nếu dữ liệu được tạo bởi một quy trình phù hợp với phân phối, chẳng hạn như chúng là trung bình của một số quy trình ngẫu nhiên thống nhất, thì việc sử dụng phân phối đó có ý nghĩa hơn. Trong trường hợp tính trung bình một tập hợp các biến đồng nhất, phân phối chính xác có thể là Phân phối Gaussian.


0

Bổ sung câu trả lời của James : các mô hình tham số cũng (thường) yêu cầu ít mẫu hơn để có sự phù hợp: điều này có thể làm tăng khả năng khái quát hóa của chúng: nghĩa là chúng có thể dự đoán dữ liệu mới tốt hơn, thậm chí là sai. Tất nhiên, điều này phụ thuộc vào tình huống, mô hình và kích cỡ mẫu.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.