Tại sao độ lệch chuẩn được định nghĩa là sqrt của phương sai mà không phải là sqrt của tổng bình phương trên N?


16

Hôm nay tôi đã dạy một lớp thống kê giới thiệu và một sinh viên đã hỏi tôi một câu hỏi, mà tôi viết lại ở đây là: "Tại sao độ lệch chuẩn được định nghĩa là sqrt của phương sai và không phải là sqrt của tổng bình phương so với N?"

Chúng tôi xác định phương sai dân số:σ2=1N(xiμ)2

Và độ lệch chuẩn: .σ=σ2=1N(xiμ)2

Việc giải thích chúng tôi có thể cung cấp cho là nó mang lại độ lệch trung bình của các đơn vị trong dân số từ giá trị trung bình dân của .σX

Tuy nhiên, trong định nghĩa của sd, chúng ta chia sqrt của tổng bình phương thông qua . Câu hỏi mà học sinh đặt ra là tại sao chúng ta không chia sqrt của sume bình phương cho thay vào đó. Do đó, chúng tôi đến với công thức cạnh tranh:Học sinh lập luận rằng công thức này trông giống như độ lệch "trung bình" so với giá trị trung bình so với khi chia qua như trong \ sigma .NN

σnew=1N(xiμ)2.
Nσ

Tôi nghĩ rằng câu hỏi này không phải là ngu ngốc. Tôi muốn đưa ra một câu trả lời cho sinh viên đi xa hơn là nói rằng sd được định nghĩa là sqrt của phương sai là độ lệch bình phương trung bình. Đặt khác nhau, tại sao học sinh nên sử dụng đúng công thức và không theo ý tưởng của cô?

Câu hỏi này liên quan đến một chủ đề cũ hơn và câu trả lời được cung cấp ở đây . Câu trả lời đi theo ba hướng:

  1. σ là độ lệch trung bình gốc (RMS), không phải độ lệch "điển hình" so với giá trị trung bình (nghĩa là σnew ). Do đó, nó được định nghĩa khác nhau.
  2. Nó có tính chất toán học tốt đẹp.
  3. Hơn nữa, sqrt sẽ đưa "đơn vị" trở lại quy mô ban đầu của họ. Tuy nhiên, đây cũng là trường hợp của σnew , chia cho N thay vào đó.

Cả hai điểm 1 và 2 đều là các đối số có lợi cho sd là RMS, nhưng tôi không thấy một đối số chống lại việc sử dụng σnew . Điều gì sẽ là lý lẽ tốt để thuyết phục học sinh cấp độ giới thiệu về việc sử dụng khoảng cách RMS trung bình σ từ trung bình?


2
Tôi nghĩ rằng câu hỏi "Tại sao độ lệch chuẩn được định nghĩa là ..." rất khó trả lời. Định nghĩa chỉ là quy ước ghi nhãn tùy ý. Họ không phải tuân theo lý do tại sao .
ttnphns

"Why is the standard deviation defined as sqrt of variance and not as average of [the root of] sum of squares?"Có thể là những gì bên trong ngoặc đã bị mất trong câu hỏi?
ttnphns

1
Nhưng sd phục vụ một loạt các mục đích; phải có động lực tốt hơn nó được định nghĩa như thế. Điều đó sẽ hữu ích, đặc biệt là trong giảng dạy sinh viên đại học. Tôi có thể tưởng tượng một động lực theo nghĩa bất bình đẳng của Ch Quashev (tỷ lệ nhỏ của các trường hợp trong lĩnh vực +/- một yếu tố không đổi của sd).
tomka

2
Không thể trả lời vì Q của bạn bị giữ, nhưng hãy thử điều này: Hãy tưởng tượng bạn quan sát các giá trị 1 và 3 theo tỷ lệ gần bằng nhau (tung đồng xu, , ). "Khoảng cách điển hình" của các quan sát từ giá trị trung bình phải giống như 1. Với công thức , hãy xem xét điều gì xảy ra với thước đo khoảng cách điển hình này cho rất, rất lớn. Trong mỗi trường hợpsẽ gần 1, vì vậy tổng bình phương của chúng sẽ gần . Tử số sẽ gần với vì vậy công thức của bạn sẽ ngày càng nhỏ hơn khi tăng lên, mặc dù khoảng cách thông thường từ giá trị trung bình không thay đổi. T = 1 H=3T=1n| xi- ˉ x | nSSE/nn|xix¯|n nnn
Glen_b -Reinstate Monica

1
@whuber Tôi đã thực hiện một bản cập nhật khác và hy vọng điểm tôi thực hiện rõ ràng hơn bây giờ. Lưu ý Tôi đang yêu cầu tư vấn giảng dạy ở đây bên cạnh việc đặt câu hỏi về kinh phí thống kê. Tôi không đề xuất một công thức thay thế, nhưng đã đưa ra một ví dụ từ tình huống trong lớp về một câu hỏi hay của một học sinh mà tôi không có câu trả lời ngay lập tức. Nếu bạn đồng ý, tôi vui lòng yêu cầu giải phóng câu hỏi ngay bây giờ.
tomka

Câu trả lời:


12

Có ít nhất ba vấn đề cơ bản có thể dễ dàng giải thích cho người mới bắt đầu:

  1. SD "mới" thậm chí không được xác định cho các quần thể vô hạn. (Người ta có thể tuyên bố nó luôn bằng 0 trong các trường hợp như vậy, nhưng điều đó sẽ không làm cho nó hữu ích hơn nữa.)

  2. SD mới không hành xử theo cách trung bình nên làm trong lấy mẫu ngẫu nhiên.

  3. Mặc dù SD mới có thể được sử dụng với tất cả sự nghiêm ngặt toán học để đánh giá độ lệch so với giá trị trung bình (trong các mẫu và quần thể hữu hạn), việc giải thích nó là phức tạp không cần thiết.

1. Khả năng ứng dụng của SD mới bị hạn chế

Điểm (1) có thể được đưa về nhà, ngay cả với những người không thành thạo về hội nhập, bằng cách chỉ ra rằng vì phương sai rõ ràng là một trung bình số học (của độ lệch bình phương), nó có một phần mở rộng hữu ích cho các mô hình của quần thể "vô hạn" trực giác về sự tồn tại của một số học có nghĩa vẫn còn. Do đó, căn bậc hai của nó - SD thông thường - cũng được xác định hoàn toàn tốt trong các trường hợp như vậy, và cũng hữu ích trong vai trò của nó như là một sự thay đổi (phi tuyến tính) của một phương sai. Tuy nhiên, SD mới chia trung bình cho lớn tùy ý , khiến vấn đề khái quát hóa của nó vượt ra ngoài các quần thể hữu hạn và các mẫu hữu hạn: nên được sử dụng như thế nào trong các trường hợp như vậy? 1/N1/N

2. SD mới không phải là trung bình

Bất kỳ thống kê nào xứng đáng với tên "trung bình" sẽ có thuộc tính mà nó hội tụ theo giá trị dân số khi kích thước của một mẫu ngẫu nhiên từ dân số tăng lên. Bất kỳ bội số cố định nào của SD sẽ có thuộc tính này, vì hệ số nhân sẽ áp dụng cả cho tính toán SD mẫu và SD dân số. (Mặc dù không trực tiếp mâu thuẫn với lập luận do Alecos Papadopoulos đưa ra, nhưng quan sát này cho thấy lập luận đó chỉ tiếp tuyến với các vấn đề thực sự.) Tuy nhiên, SD "mới", bằng lần so với thông thường, rõ ràng hội tụ về trong mọi trường hợp khi cỡ mẫu phát triển lớn. Do đó, mặc dù đối với bất kỳ cỡ mẫu cố định 0NN1/N0NNSD mới (được giải thích phù hợp) là một thước đo biến đổi hoàn toàn phù hợp với giá trị trung bình, nó không thể được coi là một biện pháp phổ quát có thể áp dụng, với cùng một cách giải thích, đối với tất cả các kích thước mẫu, cũng không thể gọi là "trung bình" một cách chính xác ý nghĩa hữu ích.

3. SD mới rất phức tạp để giải thích và sử dụng

Xem xét lấy các mẫu có kích thước (giả sử) . SD mới trong những trường hợp này là lần so với SD thông thường. Do đó, nó thích các giải thích tương đương, chẳng hạn như một quy tắc tương tự của quy tắc 68-95-99 (khoảng 68% dữ liệu phải nằm trong hai SD mới của giá trị trung bình, 95% trong số chúng trong bốn SD mới của trung bình, v.v .; và các phiên bản của sự bất bình đẳng cổ điển như Ch Quachev sẽ giữ (không quá dữ liệu có thể nằm cách xa hơn SD mới so với giá trị trung bình của chúng); và Định lý giới hạn trung tâm có thể được trình bày tương tự về mặt SD mới (một chia cho1 / N= =41/k22k1/N= =1/21/k22kNnhân đôi SD mới để chuẩn hóa biến). Vì vậy, trong ý nghĩa cụ thể và rõ ràng bị hạn chế này, không có gì sai với đề xuất của học sinh. Tuy nhiên, khó khăn là tất cả các câu lệnh này đều chứa - khá rõ ràng - các yếu tố của . Mặc dù không có vấn đề toán học cố hữu với điều này, nhưng nó chắc chắn làm phức tạp các tuyên bố và giải thích các quy luật thống kê cơ bản nhất.N= =2


Điều đáng lưu ý là Gauss và những người khác ban đầu đã tham số hóa phân phối Gaussian bằng , sử dụng hiệu quả lần SD để định lượng sự lan truyền của biến ngẫu nhiên Bình thường. Việc sử dụng lịch sử này thể hiện sự tin cậy và hiệu quả của việc sử dụng các bội số cố định khác của SD thay cho nó.2σ2


Cảm ơn bạn - một câu hỏi trở lại (liên quan đến điểm 2 của bạn): không hội tụ về khi phát triển lớn, trong khi rõ ràng không? 0N11N0N1N
tomka

2
Chúng tôi đang so sánh SD của mẫu với với SD của mẫu ("SD mới"). Khi phát triển lớn, SD của mẫu tiếp cận hằng số khác thường (thường) bằng với SD dân số. Do đó, lần SD mẫu hội tụ về không. N1/1/NN1/N
whuber

Đây là tài liệu tiêu chuẩn - tham khảo bất kỳ sách giáo khoa nghiêm ngặt nào trong thống kê toán học (mà, công bằng mà nói, sẽ không thể truy cập được cho hầu hết người mới bắt đầu). Tuy nhiên, kết quả quan trọng cho câu trả lời của tôi xuất phát từ một tuyên bố yếu hơn và trực giác rõ ràng. Sửa một số và đặt là SD dân số. Hãy xem xét khả năng SD mẫu sẽ nằm giữa và . Nó đủ cho rằng cơ hội này bằng không khi kích thước mẫu tăng. Điều này một mình cho thấy rằng lần SD mẫu hội tụ đến gần như chắc chắn, chứng minh điểm (2) trong câu trả lời. Một>1σσ/MộtMộtσN1/N0
whuber

+1, cộng với đó không phải là bất biến tỷ lệ, v.v. (một điều kiện cần thiết cho một khoảnh khắc của mẫu này)
Nikos M.

SD/NSD

5

Giả sử rằng mẫu của bạn chỉ chứa hai nhận thức. Tôi đoán một biện pháp phân tán trực quan sẽ là độ lệch tuyệt đối trung bình (AAD)

MộtMộtD= =12(|x1-x¯|+|x2-x¯|)= =...= =|x1-x2|2

Vì vậy, chúng tôi muốn các biện pháp phân tán khác ở cùng mức đơn vị đo lường sẽ "gần" với mức trên.

Phương sai mẫu được định nghĩa là

σ2= =12[(x1-x¯)2+(x2-x¯)2]= =12[(x1-x22)2+(x2-x12)2]

= =12[(x1-x2)24+(x1-x2)24]= =12(x1-x2)22

= =12|x1-x2|22

q

q12|x1-x2|22= =12|x1-x2|2= =12MộtMộtD<MộtMộtD

tức là chúng ta sẽ "hạ thấp" biện pháp phân tán "trực quan", trong khi nếu chúng ta đã xem xét độ lệch chuẩn như được định nghĩa,

SDσ2= =|x1-x2|2= =MộtMộtD

SD


n

nMộtMộtD= =ΣTôi= =1n|xTôi-x¯|

nVar(X)= =ΣTôi= =1n(xTôi-x¯)2= =ΣTôi= =1n|xTôi-x¯|2

chúng ta có thể viết phía bên phải của biểu thức phương sai là

ΣTôi= =1n|xTôi-x¯|2= =(ΣTôi= =1n|xTôi-x¯|)2-ΣjTôi|xTôi-x¯||xj-x¯|

= =(nMộtMộtD)2-ΣjTôi|xTôi-x¯||xj-x¯|

qn

qn1n[n2MộtMộtD2-ΣjTôi|xTôi-x¯||xj-x¯|]1/2

= =[MộtMộtD2-1n2ΣjTôi|xTôi-x¯||xj-x¯|]1/2

ΣjTôi|xTôi-x¯||xj-x¯|n2-nn2MộtMộtD2qnn

SD1n[n2MộtMộtD2-ΣjTôi|xTôi-x¯||xj-x¯|]1/2

= =[nMộtMộtD2-1nΣjTôi|xTôi-x¯||xj-x¯|]1/2

nn-1n
nn


1
Mặc dù câu trả lời này rất thú vị, tôi tin rằng có nhiều giải thích quan trọng, thuyết phục và chặt chẽ hơn (trong đó tôi chỉ đưa ra một vài câu trả lời của riêng mình: có thể nói nhiều hơn, đặc biệt là về vai trò của SD trong định lý Giới hạn trung tâm và các quy tắc đại số để tính toán SD của tổng các biến ngẫu nhiên độc lập).
whuber

2
@whuber Chắc chắn. Tôi chỉ chọn cách tiếp cận "tiếng chuông đã rung" để phá hủy sự gián đoạn của học sinh!
Alecos Papadopoulos
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.