Tại sao phương sai của mẫu thay đổi nếu các quan sát được nhân đôi?


25

Phương sai được cho là một biện pháp lây lan. Vì vậy, tôi đã nghĩ rằng phương sai của 3,5bằng với phương sai 3,3,5,5vì các số này trải đều như nhau. Nhưng đây không phải là trường hợp, phương sai 3,52trong khi phương sai 3,3,5,51 1/3.

Điều này đánh đố tôi, đưa ra lời giải thích rằng phương sai được cho là một biện pháp lây lan.

Vì vậy, trong bối cảnh đó, biện pháp lây lan có ý nghĩa gì?

Câu trả lời:


32

Nếu bạn xác định phương sai là - tương tự như phương sai dân số nhưng với mẫu có nghĩa là , thì cả hai mẫu của bạn sẽ có cùng phương sai.sn2=MSE=1ni=1n(xix¯)2μ

Vì vậy, sự khác biệt hoàn toàn là do hiệu chỉnh của Bessel trong công thức thông thường cho phương sai mẫu ( , điều chỉnh cho thực tế là giá trị trung bình của mẫu gần với dữ liệu hơn so với trung bình dân số, để làm cho nó không thiên vị (lấy giá trị trung bình "trung bình").sn12=nn1MSE=nn11ni=1n(xix¯)2=1n1i=1n(xix¯)2

Hiệu ứng dần dần biến mất khi tăng kích thước mẫu, vì chuyển sang 1 dưới dạng .n1nn

Nhân tiện, không có lý do cụ thể nào mà bạn phải sử dụng công cụ ước lượng không thiên vị cho phương sai, bằng cách này - là một công cụ ước tính hoàn toàn hợp lệ và trong một số trường hợp có thể cho rằng có những lợi thế so với hình thức phổ biến hơn (tính không thiên vị không nhất thiết phải lớn thỏa thuận).sn2

Phương sai chính nó không trực tiếp là một biện pháp lây lan. Nếu tôi nhân đôi tất cả các giá trị trong tập dữ liệu của mình, tôi cho rằng chúng gấp đôi "lây lan". Nhưng phương sai tăng theo hệ số 4. Vì vậy, thông thường hơn, người ta nói rằng độ lệch chuẩn, thay vì phương sai là một biện pháp lây lan.

Tất nhiên, vấn đề tương tự xảy ra với độ lệch chuẩn ( phiên bản thông thường ) như với phương sai - khi bạn nhân đôi số điểm, độ lệch chuẩn thay đổi, với cùng lý do xảy ra với phương sai.sn1

Trong các mẫu nhỏ, hiệu chỉnh Bessel làm cho độ lệch chuẩn có phần ít trực quan hơn như là một biện pháp lan truyền vì hiệu ứng đó (việc sao chép mẫu làm thay đổi giá trị). Nhưng nhiều biện pháp lây lan vẫn giữ nguyên giá trị khi nhân đôi mẫu; Tôi sẽ đề cập đến một vài -

  • sn (tất nhiên)

  • độ lệch trung bình (tuyệt đối) so với giá trị trung bình

  • độ lệch trung bình (tuyệt đối) so với trung vị

  • phạm vi liên vùng (ít nhất là đối với một số định nghĩa về tứ phân vị mẫu)


3
"Không có lý do cụ thể nào bạn phải sử dụng công cụ ước tính không thiên vị" - thực sự bạn không nhất thiết phải ước tính bất cứ điều gì. Phương sai của {3, 5}chính nó là 1, theo công thức đầu tiên. Như bạn chỉ ra, người hỏi đã cố gắng ước tính phương sai của dân số mà từ đó được coi là một mẫu, nhưng ai biết liệu nó có hay không.
Steve Jessop

1

Như một số loại ghi nhớ, . Vì vậy, giá trị dự kiến ​​của phương sai của mẫu quá thấp, với sự khác biệt là phương sai của giá trị trung bình của mẫu.VX= =EVX+VEX

Công thức phương sai mẫu thông thường bù cho điều đó và phương sai của thang đo trung bình của mẫu đối nghịch với kích thước mẫu.

Như một ví dụ cực đoan, lấy một mẫu duy nhất sẽ luôn hiển thị phương sai mẫu là 0, rõ ràng không biểu thị phương sai bằng 0 cho phân phối cơ bản.

Bây giờ đối với các mẫu có trọng số 2 và 4, các hệ số hiệu chỉnh lần lượt là và . Vì vậy, phương sai dự kiến ​​được tính toán của bạn khác nhau theo hệ số . Phương sai của mẫu là trong cả hai trường hợp. Nhưng trường hợp đầu tiên trình bày trường hợp yếu hơn cho là giá trị trung bình của phân phối cơ sở và mọi giá trị khác sẽ có nghĩa là phương sai lớn hơn.4 / 3 2 / 3 1 42/14/32/314


2
Bằng cách kết hợp các công cụ ước tính với số liệu thống kê , câu trả lời này gây nhầm lẫn, thay vì làm rõ câu hỏi. Xin vui lòng đọc câu trả lời ban đầu của Glen_b trong chủ đề này. Cuộc tranh luận trong hai đoạn đầu là bí ẩn vì dường như nó không liên quan đến câu hỏi.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.