Tại sao căn bậc hai được lấy cho số lượng mẫu Niên trong công thức độ lệch chuẩn?


9

Tôi đang cố gắng để hiểu một khái niệm rất cơ bản về độ lệch chuẩn.

Từ công thứcσ=i=1n(xiμ)2N

Tôi không thể hiểu tại sao chúng ta nên giảm một nửa dân số "N", tại sao chúng ta muốn lấy khi chúng ta không làm ? Điều đó có làm lệch dân số mà chúng ta đang xem xét không? N 2NN2

Không nên là công thức làσ=i=1n(xiμ)2N

Câu trả lời:


10

Bạn đang cố gắng tìm một độ lệch "điển hình" so với giá trị trung bình.

Phương sai là "khoảng cách bình phương trung bình so với giá trị trung bình".

Độ lệch chuẩn là căn bậc hai của điều đó.

Điều đó làm cho nó sai lệch trung bình căn bậc so với giá trị trung bình.

  1. Tại sao chúng ta sẽ sử dụng độ lệch bình phương trung bình? Điều gì làm cho phương sai thú vị? Trong số những thứ khác, vì một thực tế cơ bản về phương sai - rằng phương sai của một tổng các biến không tương quan là tổng của các phương sai riêng lẻ. (Điều này được đề cập trong một số câu hỏi, ví dụ như ở đây trên CrossValidated. Tính năng tiện dụng này không được chia sẻ, ví dụ, bởi độ lệch tuyệt đối trung bình.
  2. Tại sao lấy căn bậc hai của điều đó? Bởi vì sau đó nó ở cùng đơn vị với các quan sát ban đầu. Nó đo một loại "khoảng cách điển hình" cụ thể từ giá trị trung bình (như đã đề cập, khoảng cách RMS) - nhưng do tính chất của phương sai ở trên - một tính năng có một số tính năng hay.

7

Các độ lệch chuẩn là căn bậc hai của phương sai .


Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

S.D.(X)=Var(X)=i=1N(xiμ)2N

có lẽ nên đề cập rằng công thức phương sai này chỉ đúng với đồng phục rời rạc. mặt khác, nó có thể nhầm lẫn giữa sự khác biệt giữa mẫu và phương sai dân số
Taylor

@Taylor, tôi không hiểu ý bạn. Công thức cho phương sai không liên quan đến phân phối.
gung - Phục hồi Monica

công thức cho phương sai (mẫu) không liên quan đến phân phối ( en.wikipedia.org/wiki/Expected_value#DefDef )
Taylor

@Taylor, tôi vẫn không biết ý của bạn là gì. Công thức cho phương sai không liên quan đến phân phối. Để trích dẫn từ trang Wikipedia, "Phương sai của một biến ngẫu nhiên, X, là giá trị dự kiến ​​của độ lệch bình phương so với giá trị trung bình của X ...Var(X)=E[(Xμ)2]

Đúng, đúng vậy, nếu bạn lấy , nhưng không nhất thiết phải bằng nhau, đối với bất kỳ biến ngẫu nhiên , . Đối với một, thứ nhất là một hằng số và thứ hai là ngẫu nhiên. Trên thực tế, không rõ liệu tổng số chạy qua sự hỗ trợ của hoặc số lượng mẫu. Nếu sau này, thật kỳ lạ khi bạn biết , điều hiếm thấy trong thực tế. Nếu trước đây, thì có, nó chỉ đúng với đồng phục rời rạc (vì đó là tổng) (vì trọng lượng đều là đồng phục). E [ ( X - μ ) 2 ] X 1μ=EXE[(Xμ)2]XXμ1Ni(xiμ)2Xμ
Taylor

1

Điều đầu tiên cần hiểu là độ lệch chuẩn (std) khác với độ lệch tuyệt đối trung bình . Hai định nghĩa thuộc tính toán học khác nhau về dữ liệu.

Không giống như độ lệch tuyệt đối trung bình, độ lệch chuẩn (std) nặng hơn các giá trị khác xa trung bình, được thực hiện bằng cách bình phương các giá trị chênh lệch.

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

=16/4=4.0

80/4=20=4.47

Trong dữ liệu, có hai điểm cách trung bình 6 khoảng cách và hai điểm cách trung bình 2 khoảng cách. Vì vậy, độ lệch 4,47 có ý nghĩa hơn 4.

NNN


0

a/b=()da2b=ccb=d

522.5

522=12.512.52=2.5

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.