Tại sao đoạn trích này nói rằng ước tính không thiên vị về độ lệch chuẩn thường không liên quan?


14

Tôi đã đọc về tính toán của ước lượng không thiên vị về độ lệch chuẩn và nguồn tôi đọc được nêu

(...) Ngoại trừ trong một số tình huống quan trọng, nhiệm vụ ít liên quan đến các ứng dụng thống kê do nhu cầu của nó được tránh bằng các thủ tục tiêu chuẩn, chẳng hạn như sử dụng các bài kiểm tra quan trọng và khoảng tin cậy hoặc bằng cách sử dụng phân tích Bayes.

Tôi đã tự hỏi liệu có ai có thể làm sáng tỏ lý do đằng sau tuyên bố này không, ví dụ như khoảng tin cậy không sử dụng độ lệch chuẩn như là một phần của phép tính? Do đó, liệu khoảng tin cậy có bị ảnh hưởng bởi độ lệch chuẩn không?

BIÊN TẬP:

Cảm ơn câu trả lời cho đến nay, nhưng tôi không chắc là tôi làm theo một số lý do cho chúng vì vậy tôi sẽ thêm một ví dụ rất đơn giản. Vấn đề là nếu nguồn chính xác, thì có gì đó không đúng từ kết luận của tôi đến ví dụ và tôi muốn ai đó chỉ ra làm thế nào giá trị p không phụ thuộc vào độ lệch chuẩn.

Giả sử một nhà nghiên cứu muốn kiểm tra xem điểm trung bình của học sinh lớp năm trong bài kiểm tra ở thành phố của mình có khác với trung bình quốc gia là 76 với mức ý nghĩa 0,05 hay không. Nhà nghiên cứu đã lấy mẫu ngẫu nhiên điểm số của 20 sinh viên. Giá trị trung bình mẫu là 80,85 với độ lệch chuẩn là 8,87. Điều này có nghĩa là: t = (80,85-76) / (8,87 / sqrt (20)) = 2,44. Sau đó, một bảng t được sử dụng để tính toán rằng giá trị xác suất hai đuôi ở mức 2,44 với 19 df là 0,025. Đây là dưới mức ý nghĩa 0,05 của chúng tôi vì vậy chúng tôi bác bỏ giả thuyết khống.

Vì vậy, trong ví dụ này, giá trị p (và có thể kết luận của bạn) sẽ thay đổi tùy thuộc vào cách bạn ước tính độ lệch chuẩn của mẫu?


2
Điều này có vẻ lạ, vì lý do bạn đưa ra. Có lẽ bạn có thể cung cấp cho chúng tôi đoạn trước đó trong trường hợp chúng tôi thiếu thứ gì đó? Một điều làm cho sự thiên vị không phải là vấn đề lớn là nó trở nên không quan trọng vì kích thước mẫu trở nên lớn hơn và có lẽ không phải là vật chất so với tất cả các vấn đề khác, ví dụ như thông số kỹ thuật sai mà chúng ta thường gặp - nhưng đây không phải là lý do đưa ra trong nguồn của bạn.
Peter Ellis

1
@PeterEllis, đây thực sự là từ trang wikipedia về "ước lượng không thiên vị của độ lệch chuẩn" ( en.wikipedia.org/wiki/Unbiased_estimation_of_stiteria_deviation ).
BYS2

Câu trả lời:


17

Tôi đồng ý với Glen_b về điều này. Có lẽ tôi có thể thêm một vài từ để làm cho điểm rõ ràng hơn. Nếu dữ liệu đến từ một phân phối bình thường (tình huống iid) với phương sai không xác định, thì thống kê t là đại lượng quan trọng được sử dụng để tạo khoảng tin cậy và kiểm tra giả thuyết. Điều duy nhất quan trọng đối với suy luận đó là phân phối của nó theo giả thuyết null (để xác định giá trị tới hạn) và theo phương án thay thế (để xác định công suất và mẫu). Đó là các phân phối trung tâm và phi tập trung, tương ứng. Bây giờ xem xét một vấn đề mẫu, thử nghiệm t thậm chí có các thuộc tính tối ưu như một thử nghiệm cho giá trị trung bình của phân phối bình thường. Bây giờ phương sai mẫu là một công cụ ước lượng không thiên vị của phương sai dân số nhưng căn bậc hai của nó là một công cụ ước tính BIASED của độ lệch chuẩn dân số. Nó không' vấn đề là công cụ ước tính BIASED này nhập vào mẫu số của đại lượng quan trọng. Bây giờ nó đóng một vai trò trong đó nó là một công cụ ước tính nhất quán. Đó là những gì cho phép phân phối t tiếp cận tiêu chuẩn thông thường khi kích thước mẫu đi đến vô cùng. Nhưng bị thiên vị cho bất kỳ cố định không ảnh hưởng đến các tính chất tốt đẹp của bài kiểm tra.n

Theo tôi, tính không thiên vị được nhấn mạnh quá mức trong các lớp thống kê giới thiệu. Độ chính xác và tính nhất quán của các công cụ ước tính là các tính chất thực sự đáng được nhấn mạnh.

Đối với các vấn đề khác khi áp dụng các phương pháp tham số hoặc không tham số, ước tính độ lệch chuẩn thậm chí không được đưa vào công thức.


7
Nó không phụ thuộc vào ước tính nhưng chỉ có một ước tính mà t với 19 bậc tự do áp dụng và ước tính đó là căn bậc hai của ước lượng thông thường của phương sai mẫu. Nếu bạn sử dụng một ước tính khác nhau về độ lệch chuẩn, bạn có phân phối tham chiếu khác cho thống kê kiểm tra theo giả thuyết null. Nó không phải là t.
Michael R. Chernick

2
@ BYS2: Lưu ý rằng về mặt khoảng thời gian được xây dựng trong ví dụ bạn đưa ra, không có gì thay đổi bằng cách nhân độ lệch chuẩn mẫu với một hệ số tỷ lệ (ví dụ: để làm cho nó không thiên vị). Các phân phối thống kê kiểm định sẽ thay đổi (hơi) trong trường hợp này, nhưng CI xây dựng sẽ kết thúc được chính xác giống nhau! Bây giờ, nếu bạn thực hiện một số "hiệu chỉnh" phụ thuộc vào dữ liệu, điều đó sẽ mang lại điều gì đó khác biệt (nói chung). Xem bình luận của tôi dưới câu trả lời của Glen.
Đức Hồng Y

4
@ BYS2: Trong trường hợp mô hình bình thường sử dụng -statistic, có một sự tương ứng tốt giữa các TCTD và giá trị p . Vì vậy, giá trị p sẽ không thay đổi nếu bạn "hủy bỏ" độ lệch chuẩn mẫu bằng một hằng số đã biết. Ví dụ: Hãy ~ T b = ( ˉ X - μ ) / ( b σ ) = T / b cho cố định b > 0 . Sau đó, P (tppT~b=(X¯μ)/(bσ^)=T/bb>0 và do đó, giá trị tới hạn ˜ t b , α = b t α , nghĩa là, có một sự tương ứng một-một giữa chúng. Điều đó có ý nghĩa?
P(T~b>u)=P(T>bu)
t~b,α=btα
Đức Hồng Y

1
Không có gì mà Hồng y chỉ ra một cách chính xác là có thể nhân số liệu thống kê t với một hằng số để sử dụng một ước lượng khác nhau về độ lệch chuẩn. Thống kê kiểm tra không còn có phân phối t. Nó là một phân phối hơi khác nhau vì không đổi. Giá trị trung bình thay đổi theo hệ số b và độ lệch chuẩn cũng vậy. Khi bạn bắt đầu tính toán giá trị tới hạn cho thống kê kiểm tra, nó sẽ thay đổi một cách thích hợp như ông trình bày ở trên.
Michael R. Chernick

1
@ BYS2 Đúng vậy.
Michael R. Chernick

5

Xem xét một khoảng được tính toán trên cơ sở số lượng quan trọng, như thống kê t. Giá trị trung bình của công cụ ước tính cho độ lệch chuẩn không thực sự đi vào nó - khoảng thời gian được dựa trên phân phối thống kê. Vì vậy, tuyên bố là đúng như xa như vậy đi.


1
Có nhưng không phân phối số liệu thống kê dựa vào độ lệch chuẩn của nó mà không rõ trong hầu hết các trường hợp, do đó bạn cần sử dụng công cụ ước tính?
BYS2

4
(+1) Glen. Tới @ BYS2: Có một vài điểm chính ở đây. Đầu tiên, nếu chúng ta có số lượng quan trọng trong tay, nó cung cấp một phương tiện rất thuận tiện để xây dựng các bộ tự tin, nhưng chúng thường không tồn tại. Điểm chung của một lượng quan trọng là sự phân phối phụ thuộc hoàn toàn vào số lượng đã biết . Thứ hai, số lượng quan trọng được liên kết chặt chẽ với mô hình cơ bản. Nếu dữ liệu đi chệch khỏi mô hình giả định, thì việc phân phối thống kê kiểm tra cũng có thể và đặc tính của nó là một đại lượng quan trọng có thể không hoàn toàn phù hợp. :)
Đức Hồng Y

4

Giải thích luôn luôn là một phần suy đoán, nhưng tôi nghĩ ý nghĩa ngụ ý là thường bạn có thể nhận được kết quả bạn muốn mà không ước tính độ lệch chuẩn một cách rõ ràng. Nói cách khác, tôi nghĩ rằng tác giả đang đề cập đến các tình huống mà bạn sẽ không sử dụng ước tính độ lệch chuẩn, thay vì ước tính sai lệch.

Chẳng hạn, nếu bạn có thể xây dựng ước tính toàn bộ phân phối của một thống kê, bạn có thể tính các khoảng tin cậy mà không cần sử dụng độ lệch chuẩn. Trong thực tế, đối với nhiều phân phối (không bình thường), độ lệch chuẩn (và giá trị trung bình) không đủ để tính toán ước tính khoảng tin cậy. Trong các trường hợp khác, chẳng hạn như kiểm tra dấu hiệu , bạn cũng không cần ước tính cho độ lệch chuẩn.

(Tất nhiên, việc xây dựng một ước tính không thiên vị của một phân phối đầy đủ là không tầm thường , và trong thống kê Bayes thực sự khá phổ biến để đưa ra sự thiên vị rõ ràng thông qua trước đó.)


1
Có thể thú vị khi mở rộng đầy đủ hơn một chút về ý của bạn ở đoạn cuối. Ví dụ: nếu tôi có thể lấy mẫu từ phân phối thống kê trong tay, thì cdf theo kinh nghiệm cung cấp một phương tiện rất đơn giản, đơn giản để tạo ước tính không thiên vị của hàm phân phối. :)
Đức hồng y

1
maxiXimaxiXiXi

1
XiimaxiXi

2
Điều này là đúng và gần với điểm mà tôi đã cố gắng rút ra. Câu đầu tiên của đoạn cuối đề cập đến việc xây dựng một ước tính không thiên vị của một hàm thống kê phi tuyến từ, ví dụ, một mẫu ngẫu nhiên duy nhất. Điều này hoàn toàn khác với việc xây dựng một ước tính không thiên vị của một phân phối đầy đủ từ một mẫu ngẫu nhiên của chính hàm đó. :-)
Đức Hồng Y
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.