Đủ số liệu thống kê, chi tiết cụ thể / vấn đề trực giác


16

Tôi đang tự dạy mình một số thống kê cho vui và tôi có một số nhầm lẫn về số liệu thống kê đầy đủ . Tôi sẽ viết ra những nhầm lẫn của mình ở định dạng danh sách:

  1. Nếu một bản phân phối có thông số sau đó nó sẽ có thống kê đủ?nn

  2. Có bất kỳ loại tương ứng trực tiếp giữa các số liệu thống kê đầy đủ và các tham số? Hoặc thực hiện các số liệu thống kê đầy đủ chỉ đóng vai trò là một nhóm "thông tin" để chúng tôi có thể tạo lại cài đặt để chúng tôi có thể tính toán các ước tính tương tự cho các tham số của phân phối cơ bản.

  3. Có phải tất cả các bản phân phối có đủ số liệu thống kê? I E. định lý nhân tố có thể thất bại bao giờ?

  4. Sử dụng mẫu dữ liệu của chúng tôi, chúng tôi giả sử một phân phối rằng dữ liệu rất có thể là từ đó và sau đó có thể tính toán các ước tính (ví dụ MLE) cho các tham số cho phân phối. Thống kê đầy đủ là một cách để có thể tính toán các ước tính tương tự cho các tham số mà không cần phải dựa vào chính dữ liệu, phải không?

  5. Tất cả các bộ số liệu thống kê đủ sẽ có một thống kê đủ tối thiểu?

Đây là tài liệu mà tôi đang sử dụng để cố gắng hiểu vấn đề chủ đề: https://onlinecferences.science.psu.edu/stat414/node/283

Từ những gì tôi hiểu, chúng ta có một định lý nhân tố phân tách phân phối chung thành hai chức năng, nhưng tôi không hiểu làm thế nào chúng ta có thể trích xuất số liệu thống kê đầy đủ sau khi nhân tố phân phối vào các chức năng của chúng ta.

  1. Câu hỏi Poisson được đưa ra trong ví dụ này có hệ số rõ ràng, nhưng sau đó nó đã được tuyên bố rằng số liệu thống kê đầy đủ là giá trị trung bình mẫu và tổng mẫu. Làm thế nào chúng ta biết rằng đó là những số liệu thống kê đầy đủ chỉ bằng cách nhìn vào dạng của phương trình đầu tiên?

  2. Làm thế nào có thể tiến hành các ước tính MLE tương tự bằng cách sử dụng đủ số liệu thống kê nếu phương trình thứ hai của kết quả nhân tố đôi khi sẽ phụ thuộc vào chính các giá trị dữ liệu ? Ví dụ, trong trường hợp Poisson, hàm thứ hai phụ thuộc vào nghịch đảo của sản phẩm của các giai thừa của dữ liệu và chúng ta sẽ không còn dữ liệu nữa!Xi

  3. Tại sao kích thước mẫu không phải là một thống kê đầy đủ, liên quan đến ví dụ Poisson trên trang web ? Chúng tôi sẽ yêu cầu để xây dựng lại các phần nhất định của hàm đầu tiên, vậy tại sao nó không phải là một thống kê đầy đủ?nn


Chỉ cần một câu hỏi làm rõ nhanh chóng - bạn đang đến từ "góc" nào? Khả năng tối đa? Bayes? Entropy tối đa? Lý thuyết lấy mẫu? Thứ gì khác?
xác suất

Tôi đã đến từ quan điểm của MLE, xin lỗi nếu bài đăng của tôi không phải là bài viết hay nhất, đó là bài viết đầu tiên của tôi trên diễn đàn này!
Kimchi

Câu trả lời:


12

Bạn có thể được hưởng lợi từ việc đọc về sự đầy đủ trong bất kỳ sách giáo khoa về thống kê lý thuyết, trong đó hầu hết các câu hỏi này sẽ được đề cập chi tiết. Tóm tắt ...

  1. Không cần thiết. Đó là những trường hợp đặc biệt: phân phối trong đó sự hỗ trợ (phạm vi giá trị mà dữ liệu có thể lấy) không phụ thuộc vào (các) tham số chưa biết, chỉ những người trong họ theo cấp số nhân mới có thống kê đầy đủ về cùng chiều với số lượng thông số. Vì vậy, để ước tính hình dạng và tỷ lệ của phân phối Weibull hoặc vị trí & quy mô của phân phối logistic từ các quan sát độc lập, thống kê đơn hàng (toàn bộ các quan sát bất chấp trình tự của chúng) là tối thiểu, bạn không thể giảm thêm nữa mà không mất đi thông tin về các thông số. Trường hợp hỗ trợ phụ thuộc vào (các) tham số chưa biết, nó sẽ thay đổi: đối với phân phối đồng đều trên , mức tối đa mẫu là đủ cho ;(0,θ)θ(θ1,θ+1) mẫu tối thiểu và tối đa là đủ với nhau.

  2. Tôi không biết ý của bạn là "thư tín trực tiếp"; sự thay thế bạn đưa ra có vẻ là một cách công bằng để mô tả đủ số liệu thống kê.

  3. Có: tầm thường dữ liệu nói chung là đủ. (Nếu bạn nghe ai đó nói rằng không có thống kê đầy đủ, họ có nghĩa là không có chiều thấp.)

  4. Vâng, đó là ý tưởng. (Điều gì còn lại cho việc phân phối dữ liệu có điều kiện trên thống kê đầy đủ có thể được sử dụng để kiểm tra giả định phân phối độc lập với (các) tham số chưa biết.)

  5. Rõ ràng là không, mặc dù tôi thu thập các ví dụ phản tác dụng không phải là bản phân phối mà bạn có thể muốn sử dụng trong thực tế. [Thật tuyệt nếu có ai có thể giải thích điều này mà không cần quá chú trọng vào lý thuyết đo lường.]

Đáp lại những câu hỏi tiếp theo ...

  1. Yếu tố đầu tiên, , chỉ phụ thuộc vào thông qua . Vì vậy, bất kỳ một-một chức năng của là đủ: , , , & vân vân.enλλxiλxixixixi/n(xi)2

  2. Yếu tố thứ hai, , không phụ thuộc vào và vì vậy sẽ không ảnh hưởng đến giá trị của mà tại đó là tối đa. Xuất phát MLE và xem cho chính mình.1x1!x2!xn!λλf(x;λ)

  3. Kích thước mẫu là một hằng số được biết đến chứ không phải là một giá trị thực hiện của một biến ngẫu nhiên , do đó không được coi là một phần của số liệu thống kê đầy đủ; điều tương tự cũng xảy ra với các tham số đã biết khác với các tham số bạn muốn suy ra.n

Trong trường hợp này bình phương là một đối một vì luôn dương.xi

‡ Khi giá trị nhận ra của biến ngẫu nhiên , thì nó sẽ là một phần của thống kê đầy đủ, . Giả sử bạn chọn cỡ mẫu là 10 hoặc 100 bằng cách tung đồng xu: cho bạn biết gì về giá trị của nhưng ảnh hưởng đến việc bạn có thể ước tính chính xác nó như thế nào; trong trường hợp này nó được gọi là một sự bổ sung phụ trợ để & suy luận có thể tiến hành bằng cách điều hòa trên nó nhận ra giá trị gia có hiệu lực phớt lờ rằng nó có thể có đi ra khác nhau.N ( Σ x i , n ) n q Σ x in N(xi,n)nθxi


1
Tôi rất thích nhìn thấy các mẫu tương phản đến 5. Tôi đã cố gắng chứng minh điều ngược lại trong một thời gian với Bổ đề của Zorn nhưng nó bị phá vỡ tại một thời điểm. Nhưng từ những gì tôi đã thu thập được ví dụ mẫu sẽ thực sự vô ích. Bạn có bất kỳ điểm tham chiếu mà tôi có thể tìm thấy nó? Tôi không nhớ nó nặng về lý thuyết đo lường.
sjm.majewski

@ sjm.majewski: Lehmann đưa ra bình luận viên (1957), "Bộ biện pháp không thừa nhận số liệu thống kê hoặc trường con cần thiết và đầy đủ", Ann. Môn Toán. Thống kê. , 28 , tr267-268; và Landers & Rogge (1973). "Về sự đầy đủ và bất biến", Ann. Thống kê. , 1 , p543-544.
Scortchi - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.