Đủ số liệu thống kê cho giáo dân


23

Ai đó có thể vui lòng giải thích đầy đủ số liệu thống kê trong điều khoản rất cơ bản? Tôi đến từ một nền tảng kỹ thuật, và tôi đã trải qua rất nhiều thứ nhưng không thể tìm thấy một lời giải thích trực quan.

Câu trả lời:


33

Một thống kê đầy đủ tóm tắt tất cả thông tin có trong một mẫu để bạn có thể ước tính tham số tương tự cho dù chúng tôi đã cung cấp cho bạn mẫu hay chỉ chính thống kê. Đó là giảm dữ liệu mà không mất thông tin.

Đây là một ví dụ. Giả sử có phân phối đối xứng về 0. Thay vì đưa cho bạn một mẫu, thay vào đó tôi đưa cho bạn một mẫu các giá trị tuyệt đối (đó là số liệu thống kê). Bạn không được nhìn thấy biển báo. Nhưng bạn biết rằng phân phối là đối xứng, vì vậy với một giá trị , và cho có khả năng như nhau (xác suất có điều kiện là ). Vì vậy, bạn có thể lật một đồng tiền công bằng. Nếu nó đi lên đầu, làm cho âm. Nếu đuôi, làm cho nó tích cực. Điều này sẽ cho bạn một mẫu từ , trong đó có sự phân bố giống như dữ liệu gốc . Về cơ bản, bạn có thể xây dựng lại dữ liệu từ thống kê. Đó là những gì làm cho nó đủ.x - x x 0,5 x X XXxxx0.5xXX


Để làm rõ / xác nhận: số liệu thống kê là đủ cho một tham số. Không có tham số nào được đề cập trong ví dụ này, nhưng tôi cho rằng thống kê sẽ đủ cho bất kỳ tham số nào của bất kỳ phân phối tham số X được chọn nào? Vì vậy, đây là một ví dụ bất thường - nhưng vẫn là một ví dụ hữu ích cho trực giác.
Denziloe

2
@Denziloe Đủ cho bất kỳ tham số nào của phân phối đó, theo các giả định mạnh mẽ về tính đối xứng khoảng 0. Đây là một ví dụ đồ chơi được thiết kế để xây dựng trực giác.
Dimitriy V. Masterov

13

Về Bayesian, bạn có thể quan sát được một số tài sản X và một tham số Θ . Sự phân bố chung cho X,Θ được chỉ định, nhưng yếu tố như sự phân bố có điều kiện của XΘ và phân phối trước của Θ . Một thống kê T là đủ để mô hình này khi và chỉ khi sự phân bố sau của ΘX là giống như của ΘT(X) , cho mỗi phân phối trước của Θ . Nói cách, sự không chắc chắn cập nhật của bạn về Θ sau khi biết giá trị củaX là giống như không chắc chắn cập nhật của bạn vềΘ sau khi biết giá trị củaT(X) ,bất cứ thông tin trước khi bạn có khoảng Θ . Hãy nhớ rằng sự đầy đủ là một khái niệm phụ thuộc mô hình.


1

Giả sử bạn có một đồng tiền và bạn không biết liệu nó có công bằng hay không. Nói cách khác, nó có xác suất p của những cái đầu sắp lên ( H ) và 1-p của những cái đuôi sắp lên ( T ) và bạn không biết giá trị của p .

Bạn cố gắng để có được một ý tưởng về giá trị của p bằng cách tung đồng xu nhiều lần, nói n lần.

Giả sử n= =5 và kết quả bạn nhận được là chuỗi (H,H,T,H,T) .

Bây giờ bạn muốn người bạn thống kê của bạn ước tính giá trị của p cho bạn, và có thể cho bạn biết liệu đồng tiền có khả năng công bằng hay không. Bạn cần thông tin gì để nói với họ để họ có thể thực hiện các tính toán và đưa ra kết luận?

Bạn có thể nói với họ tất cả dữ liệu, tức là (H,H,T,H,T) . Điều này có cần thiết không? Bạn có thể tóm tắt dữ liệu này mà không mất bất kỳ thông tin liên quan?

Rõ ràng là thứ tự của việc tung đồng xu là không liên quan, bởi vì bạn đã làm điều tương tự cho mỗi lần tung đồng xu và việc tung đồng xu không ảnh hưởng lẫn nhau. Ví dụ, nếu kết quả là (H,H,T,T,H) , kết luận của chúng tôi sẽ không khác nhau. Nó theo sau rằng tất cả những gì bạn thực sự cần nói với người bạn thống kê của bạn là số lượng có bao nhiêu cái đầu.

Chúng tôi thể hiện điều này bằng cách nói số lượng người đứng đầu là một thống kê đủ cho p .

Ví dụ này cho hương vị của khái niệm. Đọc tiếp nếu bạn muốn xem cách nó kết nối với định nghĩa chính thức.

Chính thức, một thống kê là đủ cho một tham số nếu, với giá trị của thống kê, phân phối xác suất của các kết quả không liên quan đến tham số.

psố lượng người đứng đầu(1-p)n - số lượng người đứng đầup

(H,H,T,H,T)(H,H,T,T,H)...1/10ppp

psố lượng người đứng đầusố lượng người đứng đầup

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.