Giải thích trực quan cho phép chia cho khi tính độ lệch chuẩn?


136

Hôm nay tôi được hỏi trong lớp tại sao bạn chia tổng sai số bình phương cho thay vì vớinn1n , khi tính độ lệch chuẩn.

Tôi nói rằng tôi sẽ không trả lời nó trong lớp (vì tôi không muốn đi vào những người ước lượng không thiên vị), nhưng sau đó tôi tự hỏi - một lời giải thích trực quan cho việc này không?!


29
Tôi muốn trích dẫn zinger này từ cuốn sách Bí quyết số : "... nếu sự khác biệt giữa và có liên quan đến bạn, thì dù sao bạn cũng có thể không tốt - ví dụ: cố gắng chứng minh một giả thuyết nghi vấn với dữ liệu cận biên. " n - 1nn1
JM không phải là một nhà thống kê

11
một lời giải thích thực sự thanh lịch, trực quan được trình bày ở đây (bên dưới bằng chứng) en.wikipedia.org/wiki/ trộm Ý tưởng cơ bản là các quan sát của bạn, tự nhiên, sẽ gần với ý nghĩa mẫu hơn so với ý nghĩa dân số.
WetlabStudent

12
@Tal, đây là lý do tại sao các trường học hút. Bạn hỏi họ "tại sao lại thế này ?" Và họ trả lời "chỉ cần ghi nhớ nó".
Pacerier

1
Nếu bạn đang tìm kiếm một lời giải thích trực quan, bạn nên xem lý do cho chính mình bằng cách thực sự lấy mẫu! Xem này, nó trả lời chính xác câu hỏi của bạn. youtube.com/watch?v=xslIhnquFoE
Sahil Chaudhary

tl; dr: (từ câu trả lời hàng đầu :) "... độ lệch chuẩn được tính bằng độ lệch so với mẫu có nghĩa là đánh giá thấp độ lệch chuẩn mong muốn của dân số ..." Xem thêm: en.wikipedia.org/wiki/ Vì vậy, trừ khi bạn cảm thấy muốn tính toán một cái gì đó hơi phức tạp, chỉ cần sử dụng n-1 nếu đó là từ một mẫu.
Andrew

Câu trả lời:


99

Độ lệch chuẩn được tính bằng ước số của là độ lệch chuẩn được tính từ mẫu dưới dạng ước tính độ lệch chuẩn của dân số mà từ đó mẫu được rút ra. Do các giá trị quan sát giảm, trung bình, gần với trung bình mẫu hơn so với trung bình dân số, độ lệch chuẩn được tính bằng độ lệch so với mẫu có nghĩa là đánh giá thấp độ lệch chuẩn mong muốn của dân số. Sử dụng thay vìn - 1 nn1n1n như ước số sẽ sửa cho điều đó bằng cách làm cho kết quả lớn hơn một chút.

Lưu ý rằng hiệu chỉnh có hiệu ứng tỷ lệ lớn hơn khin nhỏ hơn khi lớn, đó là điều chúng ta muốn bởi vì khi n lớn hơn, trung bình mẫu có thể là một ước lượng tốt về trung bình dân số.

Khi mẫu là toàn bộ dân chúng tôi sử dụng độ lệch chuẩn với là số chia vì mẫu có nghĩa dân số có ý nghĩa.n

(Tôi lưu ý về mặt cha mẹ rằng không có gì bắt đầu bằng "khoảnh khắc thứ hai được ghi lại xung quanh một ý nghĩa xác định, xác định" sẽ đáp ứng yêu cầu của người hỏi về một lời giải thích trực quan.)


13
Chúng ta đừng nhầm lẫn "trực quan" với "phi kỹ thuật".
whuber

32
@Michael, Điều này không giải thích Tại sao chúng ta sử dụng n−1thay vì n−2(hoặc thậm chí n−3)?
Pacerier

1
@Pacerier Hãy xem câu trả lời của Whuber dưới đây để biết chi tiết về điểm đó. Về bản chất, hiệu chỉnh là n-1 chứ không phải n-2 v.v. vì hiệu chỉnh n-1 cho kết quả rất gần với những gì chúng ta cần. Sửa chữa chính xác hơn được hiển thị ở đây: en.wikipedia.org/wiki/Unbiased_estimation_of_stiteria_deviation
Michael Lew

1
Xin chào @Michael, vậy tại sao độ lệch tính toán từ trung bình mẫu có xu hướng nhỏ hơn trung bình dân số?
Allen

1
"Do các giá trị quan sát giảm, trung bình, gần với giá trị trung bình của mẫu hơn so với trung bình dân số, độ lệch chuẩn được tính bằng độ lệch so với mẫu có nghĩa là đánh giá thấp độ lệch chuẩn mong muốn của dân số." Tại sao mẫu có nghĩa là luôn đánh giá thấp? Nếu nó đánh giá quá cao thì sao?
Bora M. Alper

55

Một điểm chung là định nghĩa phương sai (của phân phối) là khoảnh khắc thứ hai được lặp lại xung quanh một giá trị trung bình xác định đã biết , trong khi công cụ ước tính sử dụng giá trị trung bình ước tính . Mất một mức độ tự do này (với giá trị trung bình, bạn có thể khôi phục tập dữ liệu với kiến ​​thức chỉ của các giá trị dữ liệu) yêu cầu sử dụng n - 1 thay vì n để "điều chỉnh" kết quả.n1n1n

Giải thích như vậy phù hợp với phương sai ước tính trong phân tích thành phần ANOVA và phương sai. Nó thực sự chỉ là một trường hợp đặc biệt.

Sự cần thiết phải thực hiện một số điều chỉnh làm tăng phương sai có thể, tôi nghĩ, được làm rõ bằng trực giác với một đối số hợp lệ không chỉ là vẫy tay trên thực tế . (Tôi nhớ rằng Học sinh có thể đã đưa ra một lập luận như vậy trong bài báo năm 1908 của mình về bài kiểm tra t.) Tại sao việc điều chỉnh phương sai phải chính xác là một yếu tố của khó biện minh hơn, đặc biệt là khi bạn xem xét SD không được điều chỉnhn/(n1) một công cụ ước tính không thiên vị. (Nó chỉ là căn bậc hai của một công cụ ước lượng không thiên vị của phương sai. Không thiên vị thường không tồn tại một phép biến đổi phi tuyến.) Vì vậy, trên thực tế, việc điều chỉnh chính xác cho SD để loại bỏ sai lệch của nó làkhông một yếu tố của cả!n/(n1)

Một số sách giáo khoa giới thiệu thậm chí không bận tâm đến việc giới thiệu sd đã điều chỉnh: họ dạy một công thức (chia cho ). Trước tiên tôi đã phản ứng tiêu cực với điều đó khi dạy từ một cuốn sách như vậy nhưng đã phát triển để đánh giá cao sự khôn ngoan: tập trung vào các khái niệm và ứng dụng, các tác giả loại bỏ tất cả các đặc tính toán học không cần thiết. Nó chỉ ra rằng không có gì là tổn thương và không ai bị lừa dối.n


1
Cảm ơn bạn Whuber. Tôi phải dạy các học sinh với hiệu chỉnh n-1, vì vậy chỉ chia cho n không phải là một lựa chọn. Như được viết trước tôi, để đề cập đến kết nối đến khoảnh khắc thứ hai không phải là một lựa chọn. Mặc dù đề cập đến việc giá trị trung bình đã được ước tính như thế nào, do đó khiến chúng tôi có ít "dữ liệu" hơn cho sd - đó là điều quan trọng. Liên quan đến sự thiên vị của sd - tôi nhớ đã gặp phải nó - cảm ơn vì đã lái chiếc xe đó về nhà. Tốt nhất, Tal
Tal Galili

3
@Tal Tôi đã viết bằng ngôn ngữ của bạn, không phải của các sinh viên của bạn, bởi vì tôi tin rằng bạn hoàn toàn có khả năng dịch nó sang bất cứ điều gì bạn biết sẽ tiếp cận họ. Nói cách khác, tôi giải thích "trực quan" trong câu hỏi của bạn có nghĩa là trực quan với bạn .
whuber

1
Xin chào. Cảm ơn bạn đã bỏ phiếu tín nhiệm :). Sự lỏng lẻo của mức độ tự do cho việc ước tính tuổi thọ là một điều mà tôi đã nghĩ đến việc sử dụng trong lớp. Vấn đề là bản thân khái niệm "bậc tự do" là một thứ cần có kiến ​​thức / trực giác. Nhưng kết hợp nó với một số câu trả lời khác được đưa ra trong chủ đề này sẽ hữu ích (với tôi và tôi hy vọng những người khác trong tương lai). Tốt nhất, Tal
Tal Galili

Đối với lớn , thường không có nhiều sự khác biệt giữa việc chia cho n hoặc n - 1 , vì vậy có thể chấp nhận giới thiệu công thức không quan tâm với điều kiện là nó được áp dụng cho các mẫu lớn, phải không? nnn1
PatrickT

1
@Patrick Bạn có thể đọc quá nhiều vào câu trả lời của tôi, bởi vì nó rõ ràng về lý do: họ là sư phạm và không có gì để làm với việc là lớn hay không. n
whuber

50

Theo định nghĩa, phương sai được tính bằng cách lấy tổng của sự khác biệt bình phương từ giá trị trung bình và chia cho kích thước. Chúng tôi có công thức chung

trong đóμlà giá trị trung bình vàNlà kích thước của dân số.σ2=iN(Xiμ)2NμN

Theo định nghĩa này, phương sai của mẫu (ví dụ mẫu ) cũng phải được tính theo cách này.t

trong đó ¯ X là giá trị trung bình vànlà kích thước của mẫu nhỏ này.σt2=in(XiX¯)2nX¯n

Tuy nhiên, theo phương sai mẫu , chúng tôi muốn nói đến một công cụ ước tính của phương sai dân số σ 2 . Làm thế nào chúng ta có thể ước tính σ 2 chỉ bằng cách sử dụng các giá trị từ mẫu?S2σ2σ2

Theo công thức trên, các biến ngẫu nhiên lệch khỏi mẫu bình ¯ X với phương sai σ 2 t . Các mẫu bình ¯ X cũng lệch khỏi μ với phương sai σ 2XX¯σt2X¯μ vì trung bình mẫu được giá trị khác nhau từ mẫu để lấy mẫu và nó là một biến ngẫu nhiên với trung bìnhμvà phương saiσ2σ2nμ . (Người ta có thể chứng minh dễ dàng.)σ2n

Do đó, khoảng, nên đi chệch khỏi μ với một biến có liên quan đến hai phương sai để thêm lên hai và nhận được σ 2 = σ 2 t + σ 2Xμ . Bằng cách giải quyết này, chúng tôi nhậnσ2=σ 2 t ×nσ2=σt2+σ2n . Thay thếσ 2 t cung cấp công cụ ước tính của chúng tôi cho phương sai dân số:σ2=σt2×nn1σt2

.S2=in(XiX¯)2n1

Người ta cũng có thể chứng minh rằng là đúng.E[S2]=σ2


Tôi hy vọng điều này không phải là quá tầm thường: là nó thực tế là giá trị trung bình mẫu hội tụ đến ND ( , σμ ) vì n được tùy ý lớn, lý do tại sao mẫu có nghĩa lệch khỏi giá trị trung bình thực với phương saiσ2σn ? σ2n
RexYuan

6
Đây là một lời giải thích tốt hơn so với những người khác bởi vì nó cho thấy các phương trình và đạo hàm thay vì chỉ đơn giản là đi yagga yagga với các thuật ngữ thống kê.
Nav

1
@sevenkul chúng ta có thể xem cái này một cách trực quan không? khi bạn nói, X nên đi chệch khỏi với điều đó đúng ròng, tôi bị mất trong quán tưởng rằngμ
Parthiban Rajendran

17

Đây là một trực giác hoàn toàn, nhưng câu trả lời đơn giản nhất là điều chỉnh được thực hiện để làm cho độ lệch chuẩn của mẫu một phần tử không được xác định thay vì 0.


11
Tại sao không, sau đó, sử dụng hoặc thậm chí1nn21 là sửa? :-)1exp(1)exp(1/n)
whuber

1
@whuber Parsimony (-;

4
thậm chí còn "tinh ranh" hơn. :-)1n1
whuber

2
@mbq, Về câu trả lời của bạn ~ "đó là một sự điều chỉnh được thực hiện để làm cho độ lệch chuẩn của mẫu một phần tử không được xác định thay vì 0", đó có thực sự là lý do tại sao, hay đây là một câu trả lời đùa? Bạn biết những người không phải là toán học như chúng tôi không thể nói.
Pacerier

4
Chính thức, nó là một hậu quả hơn lý trí, nhưng, như tôi đã viết, tôi thấy đó là một ý định tốt để ghi nhớ nó.

14

Bạn có thể đạt được một sự hiểu biết sâu sắc hơn về thuật ngữ thông qua hình học một mình, không chỉ là lý do tại sao nó không phải là n nhưng tại sao phải mất chính xác hình thức này, nhưng trước tiên bạn có thể cần phải xây dựng trực giác của bạn đối phó với n hình học ba chiều. Tuy nhiên, từ đó, đây là một bước nhỏ để hiểu sâu hơn về mức độ tự do trong các mô hình tuyến tính (tức là mô hình df & df dư). Tôi nghĩ rằng có chút nghi ngờ rằng Fisher nghĩ theo cách này. Đây là một cuốn sách xây dựng nó dần dần:n1nn

Saville DJ, Gỗ GR. Phương pháp thống kê: phương pháp hình học . Tái bản lần thứ 3 New York: Springer-Verlag; 1991. 560 trang. YAM387975177

(Vâng, 560 trang. Tôi đã nói dần dần.)


Cảm ơn onestop - Tôi không nghĩ sẽ có câu trả lời từ hướng đó. Bất kỳ cách nào để tổng hợp trực giác, hoặc điều đó không có khả năng là có thể? Chúc mừng, Tal
Tal Galili

Tôi không thể tự mình làm như vậy, nhưng một nhà phê bình sách đã tóm tắt cách tiếp cận trong một đoạn trong Amer. Thống kê vào năm 1993: jstor.org/ sóng/2684984 . Tôi không chắc chắn rằng nó thực sự thiết thực khi sử dụng phương pháp này với các sinh viên của bạn trừ khi bạn áp dụng nó cho toàn bộ khóa học.
vào

Bạn có thể tóm tắt một chút về trực giác chứ không chỉ là một tài liệu tham khảo?
oliversm

12

Công cụ ước tính của phương sai dân số bị sai lệch khi áp dụng trên một mẫu của dân số. Để điều chỉnh độ lệch đó, cần chia cho n-1 thay vì n. Về mặt toán học, người ta có thể chỉ ra rằng công cụ ước tính của phương sai mẫu là không thiên vị khi chúng ta chia cho n-1 thay vì n. Một bằng chứng chính thức được cung cấp ở đây:

https: // ec economtheoryblog.com/2012/06/11/latexlatexs2/

Ban đầu, đó là sự chính xác toán học dẫn đến công thức, tôi cho rằng. Tuy nhiên, nếu một người muốn thêm trực giác vào một công thức, các đề xuất đã được đề cập có vẻ hợp lý.

Đầu tiên, các quan sát của một mẫu trung bình gần với trung bình mẫu hơn so với trung bình dân số. Công cụ ước tính phương sai sử dụng giá trị trung bình mẫu và do đó đánh giá thấp phương sai thực sự của dân số. Chia cho n-1 thay vì n sửa cho sai lệch đó.

Hơn nữa, việc chia cho n-1 làm cho phương sai của mẫu một phần tử không được xác định thay vì bằng không.


12

Tại sao chia cho chứ không phải n ? Bởi vì nó là thông lệ và dẫn đến một ước tính không thiên vị về phương sai. Tuy nhiên, nó dẫn đến một ước tính sai lệch (thấp) về độ lệch chuẩn, như có thể thấy bằng cách áp dụng bất đẳng thức của Jensen cho hàm lõm, căn bậc hai.n1n

Vì vậy, những gì tuyệt vời về việc có một công cụ ước tính không thiên vị? Nó không nhất thiết phải giảm thiểu lỗi bình phương trung bình. MLE cho phân phối chuẩn là chia cho chứ không phải n - 1 . Dạy cho học sinh của bạn suy nghĩ, thay vì hồi sinh và vô thức áp dụng các quan niệm cổ xưa từ một thế kỷ trước.nn1


8
(+1) Tôi càng suy nghĩ về tình huống này (và tôi đã suy nghĩ thực tế, đến mức nghiên cứu các bài báo trước đây như đóng góp Sinh trắc học năm 1908 của Sinh viên để cố gắng theo dõi khi nào và tại sao xuất hiện ), tôi càng nghĩ rằng "bởi vì nó là thông lệ" là câu trả lời đúng duy nhất có thể. Tôi không vui khi thấy các downvote và chỉ có thể đoán rằng họ đang trả lời câu cuối cùng, có thể dễ dàng bị coi là tấn công OP, mặc dù tôi nghi ngờ đó là ý định của bạn. n1
whuber

1
Câu cuối cùng của tôi là lời khuyên thân thiện cho tất cả những người liên quan, trái ngược với một cuộc tấn công vào OP.
Mark L. Stone

Trong nhiều lần sử dụng, điều đó không thành vấn đề, khi được sử dụng trong các thử nghiệm hoặc trong khoảng tin cậy, người ta sẽ phải điều chỉnh các phần khác của quy trình và cuối cùng nhận được kết quả tương tự!
kjetil b halvorsen

8

Nó được nổi tiếng (hoặc dễ dàng chứng minh) mà bậc hai có cực trị tại z = - βαz2+2βz+γ . Điều này cho thấy, đối với bất kỳ chonsố thựcx1,x2,...,xn, số lượng G(một)= n Σ i=1(xi-một)2=( n Σ i = 1 x 2 i )-2a( n i = 1 xi)+nz=βαnx1,x2,,xn có giá trị tối thiểu khi a = 1

G(a)=i=1n(xia)2=(i=1nxi2)2a(i=1nxi)+na2,
.a=1ni=1nxi=x¯

Bây giờ, giả sử rằng là một mẫu kích thước n từ một phân phối với biết trung bình μ và phương sai chưa biết σ 2 . Chúng ta có thể ước tính μ1xinμσ2μ , đủ dễ để tính toán, nhưng cố gắng ước tínhσ211ni=1nxi=x¯σ2gặp các vấn đề mà chúng ta không biếtμ. Chúng ta có thể, tất nhiên, dễ dàng tính toán G( ˉ x )và chúng ta biết rằngG(μ)G( ˉ x ), nhưng làm thế nào lớn hơn nhiều làG(μ)? Câu trả lời là G(μ)1ni=1n(xiμ)2=n1G(μ)μG(x¯)G(μ)G(x¯)G(μ)G(μ)lớn hơn theo hệ số xấp xỉ nG(x¯) , có nghĩa là, G ( μ ) nnn1và do đóước tínhn-1G(μ)=1

(1)G(μ)nn1G(x¯)
cho phương sai của phân phối có thể được xấp xỉ bằng 1n1G(μ)=1ni=1n(xiμ)21n1G(x¯)=1n1i=1n(xix¯)2.

(1)

G(μ)=i=1n(xiμ)2=i=1n(xix¯+x¯μ)2=i=1n((xix¯)2+(x¯μ)2+2(xix¯)(x¯μ))=G(x¯)+n(x¯μ)2+(x¯μ)i=1n(xix¯)(2)=G(x¯)+n(x¯μ)2
i=1n(xix¯)=nx¯nx¯=0
n(x¯μ)2=n1n2(i=1n(xiμ))2=1ni=1n(xiμ)2+2ni=1nj=i+1n(xiμ)(xjμ)(3)=1nG(μ)+2ni=1nj=i+1n(xiμ)(xjμ)
xiμμ(xiμ)(xjμ)(3)1nG(μ)(3)(2)
G(μ)G(x¯)+1nG(μ)G(μ)nn1G(x¯)
(1)

8
Chỉ trên trao đổi ngăn xếp này, điều này sẽ được coi là một câu trả lời trực quan.
Joseph Garvin

6

(xixj)2/2

s2=2n(n1)i<j(xixj)22=1n1i=1n(xix¯)2.

XY

V(X)=E((XY)22)=E((XE(X))2).

Để đi từ định nghĩa biến ngẫu nhiên của phương sai đến sai lệch của phương sai mẫu là một vấn đề ước tính một kỳ vọng bằng một phương tiện có thể được chứng minh bằng nguyên tắc triết học về tính điển hình: Mẫu là một đại diện điển hình cho phân phối. (Lưu ý, điều này có liên quan đến, nhưng không giống như ước tính theo khoảnh khắc.)


2
V(X)=E((XY)22)=E((XE(X))2)

4
(xixi)2s2nn1
whuber

4

N=1xm¯=x1

V=N(xnm¯)2N

V¯=(xm¯)21=0.

yxyN1=0

0d+1dd+1


Không rõ tại sao "phương sai vô hạn sẽ là kết quả âm thanh hơn" so với phương sai bằng không. Thật vậy, bạn dường như sử dụng "phương sai mẫu" theo nghĩa của công cụ ước tính phương sai , điều này gây nhầm lẫn hơn.
whuber

1
0<

4

Theo gợi ý của whuber , câu trả lời này đã được sao chép từ một câu hỏi tương tự khác .

Hiệu chỉnh của Bessel được thông qua để điều chỉnh sai lệch trong việc sử dụng phương sai mẫu làm công cụ ước tính của phương sai thực. Sự sai lệch trong thống kê chưa được xử lý xảy ra do giá trị trung bình của mẫu gần với giữa các quan sát hơn giá trị trung bình thực và do đó độ lệch bình phương xung quanh mẫu có nghĩa là đánh giá thấp một cách có hệ thống các sai lệch bình phương xung quanh giá trị trung bình thực.

S2n

S2=1ni=1n(XiX¯)2=1ni=1n(Xi22X¯Xi+X¯2)=1n(i=1nXi22X¯i=1nXi+nX¯2)=1n(i=1nXi22nX¯2+nX¯2)=1n(i=1nXi2nX¯2)=1ni=1nXi2X¯2.

Mang lại kỳ vọng mang lại:

E(S2)=1ni=1nE(Xi2)E(X¯2)=1ni=1n(μ2+σ2)(μ2+σ2n)=(μ2+σ2)(μ2+σ2n)=σ2σ2n=n1nσ2

σ2n1


Cảm ơn đã chứng minh!
cập nhật

0

Nói chung, sử dụng "n" trong mẫu số sẽ cho các giá trị nhỏ hơn phương sai dân số, đó là những gì chúng tôi muốn ước tính. Điều này đặc biệt xảy ra nếu các mẫu nhỏ được lấy. Trong ngôn ngữ thống kê, chúng tôi nói rằng phương sai mẫu cung cấp một ước tính sai lệch về phạm vi của phạm vi dân số và cần phải được thực hiện "không thiên vị".

Nếu bạn đang tìm kiếm một lời giải thích trực quan, bạn nên cho học sinh của mình thấy lý do cho chính mình bằng cách thực sự lấy mẫu! Xem này, nó trả lời chính xác câu hỏi của bạn.

https://www.youtube.com/watch?v=xslIhnquFoE


0

X¯=1ni=1nXiS2=1n1i=1n(XiX¯)2n1

Để trả lời câu hỏi này, chúng ta phải quay trở lại định nghĩa của một công cụ ước tính không thiên vị. Một người ước lượng không thiên vị là một người có kỳ vọng có xu hướng kỳ vọng thực sự. Giá trị trung bình mẫu là một ước lượng không thiên vị. Để xem tại sao:

E[X¯]=1ni=1nE[Xi]=nnμ=μ

Chúng ta hãy nhìn vào kỳ vọng của phương sai mẫu,

S2=1n1i=1n(Xi2)nX¯2

E[S2]=1n1(nE[(Xi2)]nE[X¯2]).

X¯E[X¯2]n1

E[S2]=1n1(n(μ2+σ2)n(μ2+Var(X¯))).
Var(X¯)=Var(1ni=1nXi)=i=1n1n2Var(Xi)=σ2n

E[S2]=1n1(n(μ2+σ2)n(μ2+σ2/n)).=(n1)σ2n1=σ2

nn1n1S2


3
S

-1

μσ2nμ

σ2(n+1n1),

2n

Phân phối T của Sinh viên tổng quát có ba tham số và sử dụng cả ba số liệu thống kê của bạn. Nếu bạn quyết định loại bỏ một số thông tin, bạn có thể ước tính thêm dữ liệu của mình bằng cách sử dụng phân phối chuẩn hai tham số như được mô tả trong câu hỏi của bạn.

Từ quan điểm của Bayes, bạn có thể tưởng tượng rằng sự không chắc chắn trong siêu đường kính của mô hình (phân phối trên giá trị trung bình và phương sai) làm cho phương sai của dự báo sau lớn hơn phương sai dân số.


-4

Chúa ơi, nó trở nên phức tạp! Tôi nghĩ câu trả lời đơn giản là ... nếu bạn có tất cả các điểm dữ liệu bạn có thể sử dụng "n" nhưng nếu bạn có "mẫu" thì giả sử đó là một mẫu ngẫu nhiên, bạn đã có nhiều điểm mẫu hơn từ bên trong độ lệch chuẩn hơn từ bên ngoài (định nghĩa của độ lệch chuẩn). Bạn không có đủ dữ liệu bên ngoài để đảm bảo bạn có được tất cả các điểm dữ liệu bạn cần một cách ngẫu nhiên. N-1 giúp mở rộng về độ lệch chuẩn "thực".


3
n1n2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.