Tại sao chia một tập dữ liệu bằng sigma làm phương sai mẫu bằng 1? Giả sử không có nghĩa là đơn giản.
Trực giác đằng sau này là gì?
Chia theo phạm vi (tối đa) có ý nghĩa trực quan. Nhưng độ lệch chuẩn thì không.
Tại sao chia một tập dữ liệu bằng sigma làm phương sai mẫu bằng 1? Giả sử không có nghĩa là đơn giản.
Trực giác đằng sau này là gì?
Chia theo phạm vi (tối đa) có ý nghĩa trực quan. Nhưng độ lệch chuẩn thì không.
Câu trả lời:
Điều này bắt nguồn từ tài sản của phương sai. Đối với một biến ngẫu nhiên và một hằng số , . Do đó, nếu bạn chia dữ liệu theo độ lệch chuẩn của nó (), .
Tiêu chuẩn hóa chỉ là thay đổi các đơn vị để chúng ở trong các đơn vị "độ lệch chuẩn". Sau khi tiêu chuẩn hóa, giá trị 1,5 có nghĩa là "1,5 độ lệch chuẩn trên 0". Nếu độ lệch chuẩn là 8, điều này sẽ tương đương với việc nói "12 điểm trên 0".
Một ví dụ: khi chuyển đổi inch sang feet (ở Mỹ), bạn nhân dữ liệu của mình theo inch với hệ số chuyển đổi, , xuất phát từ thực tế là 1 feet bằng 12 inch, vì vậy về cơ bản, bạn chỉ cần nhân các điểm dữ liệu của mình với một phiên bản 1 ưa thích (nghĩa là một phân số có tử số và mẫu số bằng nhau). Ví dụ, để đi từ 72 inch đến feet, bạn làm.
Khi chuyển đổi điểm từ các đơn vị liệu cho các đơn vị độ lệch chuẩn, bạn nhân với dữ liệu của bạn trong các đơn vị nguyên bởi các yếu tố chuyển đổi . Vì vậy, nếu bạn có điểm 100 và độ lệch chuẩn () Là 20, điểm chuẩn của bạn sẽ được . Tiêu chuẩn hóa chỉ là thay đổi các đơn vị.
Thay đổi đơn vị của bộ dữ liệu không ảnh hưởng đến mức độ lan truyền của nó; bạn chỉ cần thay đổi đơn vị đo lường mức độ lây lan mà bạn đang sử dụng để chúng phù hợp. Vì vậy, nếu dữ liệu gốc của bạn có độ lệch chuẩn là 20 điểm và bạn đã thay đổi đơn vị sao cho 20 điểm ban đầu bằng 1 đơn vị được tiêu chuẩn hóa mới, thì độ lệch chuẩn mới là 1 đơn vị (vì 20 đơn vị ban đầu bằng 1 đơn vị mới).