Tại sao chúng ta ổn định phương sai?


15

Tôi đã bắt gặp sự biến đổi ổn định phương sai trong khi đọc phương pháp Kaggle Essay Eval . Họ sử dụng một phép biến đổi ổn định phương sai để biến đổi các giá trị kappa trước khi lấy giá trị trung bình của chúng và sau đó biến đổi chúng trở lại. Ngay cả sau khi đọc wiki về các biến đổi ổn định phương sai tôi không thể hiểu, tại sao chúng ta thực sự ổn định phương sai? Chúng ta có được lợi ích gì từ việc này?


6
Thông thường mục đích là làm cho phương sai (tiệm cận) độc lập với tham số quan tâm. Điều này đặc biệt quan trọng trong suy luận mà chúng ta cần biết phân phối tham chiếu để tính toán số lượng quan tâm liên quan.
Đức hồng y

Câu trả lời:


13

Đây là một câu trả lời: thông thường, cách hiệu quả nhất để tiến hành suy luận thống kê là khi dữ liệu của bạn là iid Nếu không, bạn sẽ nhận được lượng thông tin khác nhau từ các quan sát khác nhau và điều đó kém hiệu quả hơn. Một cách khác để xem đó là nói rằng nếu bạn có thể thêm thông tin bổ sung vào suy luận của mình (nghĩa là dạng hàm của phương sai, thông qua phép biến đổi ổn định phương sai), nói chung, bạn sẽ cải thiện độ chính xác của ước tính của mình, ít nhất là không có triệu chứng. Trong các mẫu rất nhỏ, việc bận tâm với mô hình phương sai có thể làm tăng sai lệch mẫu nhỏ của bạn. Đây là một loại đối số kiểu GMM kinh tế lượng: nếu bạn thêm các khoảnh khắc bổ sung, phương sai tiệm cận của bạn không thể tăng lên; và độ lệch mẫu hữu hạn của bạn tăng theo mức độ tự do quá mức.

Một câu trả lời khác được đưa ra bởi hồng y: nếu bạn có một phương sai không xác định treo xung quanh trong biểu thức phương sai tiệm cận của bạn, sự hội tụ vào phân phối tiệm cận sẽ chậm hơn và bạn sẽ phải ước tính phương sai đó bằng cách nào đó. Xoay vòng trước dữ liệu của bạn hoặc số liệu thống kê của bạn thường giúp cải thiện độ chính xác của các xấp xỉ tiệm cận.


Tôi nghĩ rằng tôi hiểu câu đầu tiên trong câu trả lời của bạn và nó hấp dẫn tôi bằng trực giác. Có một tên cho quan sát này mà tôi có thể google? Tôi muốn tìm một số thí nghiệm suy nghĩ hoặc ví dụ cho thấy điều gì xảy ra khi bạn có lượng thông tin khác nhau trong các quan sát khác nhau và làm thế nào là không hiệu quả
Pushpendre

Văn bản của Korn & Graubard (1999) về thống kê khảo sát thảo luận về điều đó.
StasK

Nhưng ở đây phép biến đổi được sử dụng để tính giá trị trung bình theo . Tôi thực sự không nhìn thấy điểm. Đối với tôi, đây sẽ là cách để ước tính khoảng tin cậy, nhưng đối với ước tính điểm, nó chỉ đưa ra một sai lệch. f-1(1nΣTôif(κTôi))
Elvis

@PushpendreRastogi bạn có thể muốn đọc bài viết trên wikipedia về chính sự chuyển đổi này. Nó được giới thiệu bởi Fisher để ổn định phương sai của hệ số tương quan theo kinh nghiệm (giữa các biến thông thường). Trong trường hợp đó, biến được chuyển đổi sẽ xấp xỉ bình thường, với phương sai chỉ phụ thuộc vào kích thước mẫu chứ không phụ thuộc vào hệ số tương quan chưa biết (đây là lý do tại sao điều này giúp ổn định phương sai).
Elvis

@Elvis, tôi đã đưa ra ví dụ tương quan trong bài viết trên wikipedia về thống kê pivotal ( en.wikipedia.org/wiki/Pivotal_statistic ). [Làm thế nào trên trái đất bạn đã cung cấp các liên kết tốt đẹp trong bình luận? Tôi đã thử a href, nó trông thật xấu xí.]
StasK
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.