Tại sao chúng ta lấy căn bậc hai của phương sai để tạo độ lệch chuẩn?

26

Xin lỗi nếu điều này đã được trả lời ở nơi khác, tôi đã không thể tìm thấy nó.

Tôi tự hỏi tại sao chúng ta lấy căn bậc hai , đặc biệt, phương sai để tạo độ lệch chuẩn? Điều gì về việc lấy căn bậc hai tạo ra một giá trị hữu ích?

variance standard-deviation

— Dave
nguồn

Liên quan chặt chẽ: stats.stackexchange.com/questions353123/ từ

— Sycorax nói Phục hồi lại

2

Hãy nghĩ về độ lệch chuẩn như là một chỉ tiêu vectơ euclide và sau đó phương sai là hình vuông. Định nghĩa về phương sai và độ lệch chuẩn hóa ra có các đặc tính phân tích hữu ích.

— theideasmith

44

Trong một số ý nghĩa, đây là một câu hỏi tầm thường, nhưng trong một ý nghĩa khác, nó thực sự khá sâu sắc!

Như những người khác đã đề cập, lấy căn bậc hai ngụ ý có các đơn vị tương tự như . $\operatorname{Stdev}(X)$ $X$
Lấy căn bậc hai mang lại cho bạn sự đồng nhất tuyệt đối hay khả năng mở rộng tuyệt đối . Đối với mọi biến vô hướng và biến ngẫu nhiên , chúng ta có: đồng nhất tuyệt đối là một thuộc tính bắt buộc của một định mức . Độ lệch chuẩn có thể được hiểu là một chỉ tiêu (trên không gian vectơ của các biến ngẫu nhiên trung bình bằng 0) theo cách tương tự như là chỉ tiêu Euclidian tiêu chuẩn theo ba chiều không gian. Độ lệch chuẩn là thước đo khoảng cách giữa một biến ngẫu nhiên và giá trị trung bình của nó. $\alpha$ $X$
$Stdev [α X] = | α | Stdev [X]$ $\operatorname{Stdev}[\alpha X] = |\alpha| \operatorname{Stdev}[X]$ $\sqrt{x^2 + y^2+z^2}$

Độ lệch chuẩn và định mức $L_2$

Trường hợp kích thước hữu hạn:

Trong không gian vectơ chiều, định mức Euclidian tiêu chuẩn hay còn gọi là định mức được định nghĩa là: $n$ $L_2$

‖ x ‖_{2} = \sqrt{\sum_{i} x_{i}^{2}}

$\|\mathbf{x}\|_2 = \sqrt{\sum_i x_i^2}$

Nhìn rộng hơn, -norm lấy gốc để có được tuyệt đối tính đồng nhất: . $p$ $\|\mathbf{x}\|_p = \left(\sum_i |x_i|^p \right)^{\frac{1}{p}}$ $p$ $\|\alpha \mathbf{x}\|_p = \left( \sum_i |\alpha x_i|^p \right)^\frac{1}{p} = | \alpha | \left( \sum_i |x_i|^p \right)^\frac{1}{p} = |\alpha | \|\mathbf{x}\|_p$

Nếu bạn có trọng số thì tổng trọng số cũng là một định mức hợp lệ. Hơn nữa, đó là độ lệch chuẩn nếu đại diện cho xác suất và $q_i$ $\sqrt{\sum_i x_i^2 q_i}$ $q_i$ $\operatorname{E}[\mathbf{x}] \equiv \sum_i x_i q_i = 0$

Trường hợp kích thước vô hạn:

Trong một không gian Hilbert vô hạn, chúng ta có thể định nghĩa tương tự định mức : $L_2$

‖ X ‖_{2} = \sqrt{\int_{ω} X (ω)^{2} d P (ω)}

$\|X\|_2 = \sqrt{\int_\omega X(\omega)^2 dP(\omega) }$

Nếu là biến ngẫu nhiên trung bình bằng 0 và là số đo xác suất, độ lệch chuẩn là gì? Nó giống nhau: . $X$ $P$ $\sqrt{\int_\omega X(\omega)^2 dP(\omega) }$

Tóm lược:

Lấy căn bậc hai có nghĩa là độ lệch chuẩn thỏa mãn tính đồng nhất tuyệt đối , một tính chất bắt buộc của một định mức .

Trên một không gian của các biến ngẫu nhiên, là một sản phẩm bên trong và sự định mức gây ra bởi sản phẩm bên trong đó . Do đó, độ lệch chuẩn là chỉ tiêu của biến ngẫu nhiên hạ thấp: Đây là thước đo khoảng cách từ trung bình để . $\langle X, Y \rangle = \operatorname{E}[XY]$ $\|X\|_2 = \sqrt{\operatorname{E}[X^2]}$

Stdev [X] = ‖ X - E [X] ‖_{2}

$\operatorname{Stdev}[X] = \|X - \operatorname{E}[X]\|_2$

E [X]

$\operatorname{E}[X]$

X

$X$

(Điểm kỹ thuật: while là một chỉ tiêu, độ lệch chuẩn không phải là một chỉ tiêu trên các biến ngẫu nhiên nói chung vì yêu cầu đối với không gian vectơ được định mức là khi và chỉ khi . Độ lệch chuẩn là 0 doesn ' t ngụ ý biến ngẫu nhiên là phần tử không.) $\sqrt{\operatorname{E}[X^2]}$ $\sqrt{\operatorname{E}[(X - \operatorname{E}[X])^2]}$ $\|x\| = \mathbf{0}$ $x = \mathbf{0}$

— Matthew Gunn
nguồn

1

Câu trả lời này thực sự là cốt lõi của vấn đề, làm cho nó nhiều thông tin hơn so với câu hỏi hiện đang được chấp nhận.

— 00prometheus

26

Phương sai của được định nghĩa là , do đó, đây là một kỳ vọng về sự khác biệt bình phương giữa X và giá trị mong đợi của nó. $X$ $V(X) = E(X-E(X))^2$

Nếu là thời gian tính bằng giây, bằng giây, nhưng ở trong và lại xuất hiện sau giây. $X$ $X-E(X)$ $V(X)$ $\mbox{seconds}^2$ $\sqrt{V(X)}$

— HStamper
nguồn

À tôi hiểu rồi, nó chỉ hoàn tác sự thay đổi về quy mô xuất phát từ việc bình phương sự khác biệt, trong tính toán phương sai?

— Dave

11

Phải - nhưng thay đổi kích thước , không theo quy mô.

— Jean-François Corbett

Nhưng nó không giống như có một thuật ngữ duy nhất ở đó: có rất nhiều và mỗi khi ở quyền lực 2, mang lại nhiều hơn hoặc ít hơn các điều khoản khác. Nhưng khi chúng ta lấy căn bậc hai, chúng ta loại bỏ sự khác biệt đó, phải không? Chúng tôi sẽ không nhận được tử số ban đầu, tổng của tất cả các khác biệt theo cách đó. Sẽ không tốt hơn nếu lấy một căn bậc hai của mỗi thuật ngữ riêng lẻ?

— phân tích cú pháp

Có vẻ như bạn đang nghĩ về ước tính , dựa trên một mẫu. Trong trường hợp đó, nếu bạn đã làm như vậy, sự khác biệt sẽ bằng không: .

\hat{V}

$\hat{V}$

\sum_{i = 1}^{n} (x_{i} - \bar{x}) = \sum_{i = 1}^{n} x_{i} - \sum_{i = 1}^{n} x_{i} = 0

$\sum_{i=1}^n (x_i - \bar{x}) = \sum_{i=1}^n x_i - \sum_{i=1}^n x_i = 0$

— HStamper

@EricMittman Ngoại trừ , không phải , trong trường hợp đó bạn sẽ nhận được lỗi tuyệt đối trung bình .

\sqrt{a^{2}} = | a |

$\sqrt{a^2} = \lvert a \rvert$

a

$a$

— Dougal

6

Câu trả lời đơn giản là các đơn vị có cùng tỷ lệ với giá trị trung bình. Ví dụ: Tôi ước tính trung bình của học sinh trung học là 160cm với độ lệch chuẩn (SD) là 20 cm. Đó là trực giác dễ dàng hơn để có được một cảm giác của sự thay đổi với SD hơn phương sai của 400cm ^ 2.

— Người lạc quan
nguồn

0

Nói một cách đơn giản hơn, độ lệch chuẩn được thiết kế để cung cấp cho chúng tôi một số dương cho biết điều gì đó về sự lan truyền dữ liệu của chúng tôi về ý nghĩa của nó.

Nếu chúng ta chỉ cộng khoảng cách của tất cả các điểm từ giá trị trung bình, thì các điểm theo hướng tích cực và tiêu cực sẽ kết hợp theo cách có xu hướng hấp dẫn trở lại trung bình và chúng ta sẽ mất thông tin về sự lây lan. Đây là lý do tại sao chúng tôi đo phương sai trước, để tất cả các khoảng cách được bảo toàn là đại lượng dương thông qua bình phương và chúng không triệt tiêu lẫn nhau. Cuối cùng, chúng tôi muốn một giá trị dương đại diện cho các đơn vị chúng tôi đã bắt đầu - điều này đã được nhận xét ở trên - vì vậy chúng tôi lấy căn bậc hai dương.

— DC_Beardly
nguồn

-3

Đó là một sự ngu ngốc lịch sử mà chúng ta tiếp tục do sự lười biếng trí tuệ. Họ đã chọn bình phương sự khác biệt từ giá trị trung bình để thoát khỏi dấu trừ. Sau đó, họ lấy căn bậc hai để đưa nó lên một tỷ lệ tương tự như giá trị trung bình.

Ai đó nên tạo số liệu thống kê mới, phương sai tính toán và SD bằng cách sử dụng mô đun hoặc giá trị tuyệt đối của độ lệch so với giá trị trung bình. Điều này sẽ thoát khỏi toàn bộ bình phương này và sau đó lấy doanh nghiệp căn bậc hai.

— Asir Ajmal
nguồn

1

Chúng ta đã có điều đó, ở dạng độ lệch tuyệt đối trung bình (hoặc trung bình), định mức L1 và tương tự. Tuy nhiên, những lợi thế lớn của cách tiếp cận truyền thống là, không giống như các giá trị tuyệt đối, đó là khả vi, cho phép bạn phân tích tối thiểu và tối đa hóa mọi thứ.

— Matt Krause

1

Bạn không cung cấp bằng chứng thực sự cho lập trường của mình, vui lòng cung cấp một lập luận toán học được đặt ra rõ ràng. Tổng các giá trị tuyệt đối quy mô rất khác với căn bậc hai của tổng bình phương. Cái sau nhấn mạnh sự đóng góp của các giá trị cực đoan, đó là một tài sản hữu ích. Ngoài ra, SSQ là trung tâm cho các phương pháp phân tích bình phương nhỏ nhất. Vui lòng dành thời gian để mở rộng về các vấn đề của SD và cách so sánh các lựa chọn thay thế để người đọc có thể hiểu quan điểm của bạn. .

— ReneBt

(-1) Thật quá dễ dàng để đọc các cụm từ như "sự ngu ngốc trong lịch sử" và "sự lười biếng trí tuệ" như là tự tham khảo.

— whuber

Tại sao chúng ta lấy căn bậc hai của phương sai để tạo độ lệch chuẩn?

Độ lệch chuẩn và định mứcL2L2L_2

Trường hợp kích thước hữu hạn:

Trường hợp kích thước vô hạn:

Tóm lược:

Độ lệch chuẩn và định mức $L_2$