Xin lỗi nếu điều này đã được trả lời ở nơi khác, tôi đã không thể tìm thấy nó.
Tôi tự hỏi tại sao chúng ta lấy căn bậc hai , đặc biệt, phương sai để tạo độ lệch chuẩn? Điều gì về việc lấy căn bậc hai tạo ra một giá trị hữu ích?
Xin lỗi nếu điều này đã được trả lời ở nơi khác, tôi đã không thể tìm thấy nó.
Tôi tự hỏi tại sao chúng ta lấy căn bậc hai , đặc biệt, phương sai để tạo độ lệch chuẩn? Điều gì về việc lấy căn bậc hai tạo ra một giá trị hữu ích?
Câu trả lời:
Trong một số ý nghĩa, đây là một câu hỏi tầm thường, nhưng trong một ý nghĩa khác, nó thực sự khá sâu sắc!
Như những người khác đã đề cập, lấy căn bậc hai ngụ ý có các đơn vị tương tự như .
Lấy căn bậc hai mang lại cho bạn sự đồng nhất tuyệt đối hay khả năng mở rộng tuyệt đối . Đối với mọi biến vô hướng và biến ngẫu nhiên , chúng ta có:
đồng nhất tuyệt đối là một thuộc tính bắt buộc của một định mức . Độ lệch chuẩn có thể được hiểu là một chỉ tiêu (trên không gian vectơ của các biến ngẫu nhiên trung bình bằng 0) theo cách tương tự như là chỉ tiêu Euclidian tiêu chuẩn theo ba chiều không gian. Độ lệch chuẩn là thước đo khoảng cách giữa một biến ngẫu nhiên và giá trị trung bình của nó.
Trong không gian vectơ chiều, định mức Euclidian tiêu chuẩn hay còn gọi là định mức được định nghĩa là:
Nhìn rộng hơn, -norm lấy gốc để có được tuyệt đối tính đồng nhất: .
Nếu bạn có trọng số thì tổng trọng số cũng là một định mức hợp lệ. Hơn nữa, đó là độ lệch chuẩn nếu đại diện cho xác suất và
Trong một không gian Hilbert vô hạn, chúng ta có thể định nghĩa tương tự định mức :
Nếu là biến ngẫu nhiên trung bình bằng 0 và là số đo xác suất, độ lệch chuẩn là gì? Nó giống nhau: .
Lấy căn bậc hai có nghĩa là độ lệch chuẩn thỏa mãn tính đồng nhất tuyệt đối , một tính chất bắt buộc của một định mức .
Trên một không gian của các biến ngẫu nhiên, là một sản phẩm bên trong và sự định mức gây ra bởi sản phẩm bên trong đó . Do đó, độ lệch chuẩn là chỉ tiêu của biến ngẫu nhiên hạ thấp:
Đây là thước đo khoảng cách từ trung bình để .‖ X ‖ 2 = √ Stdev[X]=‖X-E[X]‖2E[X]
(Điểm kỹ thuật: while là một chỉ tiêu, độ lệch chuẩn không phải là một chỉ tiêu trên các biến ngẫu nhiên nói chung vì yêu cầu đối với không gian vectơ được định mức là khi và chỉ khi . Độ lệch chuẩn là 0 doesn ' t ngụ ý biến ngẫu nhiên là phần tử không.) ‖x‖=0x=0
Phương sai của được định nghĩa là , do đó, đây là một kỳ vọng về sự khác biệt bình phương giữa X và giá trị mong đợi của nó.V ( X ) = E ( X - E ( X ) ) 2
Nếu là thời gian tính bằng giây, bằng giây, nhưng ở trong và lại xuất hiện sau giây.X - E ( X ) V ( X ) giây 2 √
Câu trả lời đơn giản là các đơn vị có cùng tỷ lệ với giá trị trung bình. Ví dụ: Tôi ước tính trung bình của học sinh trung học là 160cm với độ lệch chuẩn (SD) là 20 cm. Đó là trực giác dễ dàng hơn để có được một cảm giác của sự thay đổi với SD hơn phương sai của 400cm ^ 2.
Nói một cách đơn giản hơn, độ lệch chuẩn được thiết kế để cung cấp cho chúng tôi một số dương cho biết điều gì đó về sự lan truyền dữ liệu của chúng tôi về ý nghĩa của nó.
Nếu chúng ta chỉ cộng khoảng cách của tất cả các điểm từ giá trị trung bình, thì các điểm theo hướng tích cực và tiêu cực sẽ kết hợp theo cách có xu hướng hấp dẫn trở lại trung bình và chúng ta sẽ mất thông tin về sự lây lan. Đây là lý do tại sao chúng tôi đo phương sai trước, để tất cả các khoảng cách được bảo toàn là đại lượng dương thông qua bình phương và chúng không triệt tiêu lẫn nhau. Cuối cùng, chúng tôi muốn một giá trị dương đại diện cho các đơn vị chúng tôi đã bắt đầu - điều này đã được nhận xét ở trên - vì vậy chúng tôi lấy căn bậc hai dương.
Đó là một sự ngu ngốc lịch sử mà chúng ta tiếp tục do sự lười biếng trí tuệ. Họ đã chọn bình phương sự khác biệt từ giá trị trung bình để thoát khỏi dấu trừ. Sau đó, họ lấy căn bậc hai để đưa nó lên một tỷ lệ tương tự như giá trị trung bình.
Ai đó nên tạo số liệu thống kê mới, phương sai tính toán và SD bằng cách sử dụng mô đun hoặc giá trị tuyệt đối của độ lệch so với giá trị trung bình. Điều này sẽ thoát khỏi toàn bộ bình phương này và sau đó lấy doanh nghiệp căn bậc hai.