Độ lệch tuyệt đối trung bình so với độ lệch chuẩn


35

Trong sách giáo khoa "Toán học toàn diện mới cho cấp độ O" của Greer (1983), tôi thấy độ lệch trung bình được tính như thế này:

Tổng hợp sự khác biệt tuyệt đối giữa các giá trị đơn và giá trị trung bình. Sau đó lấy trung bình của nó. Tập hợp các chương thuật ngữ độ lệch trung bình được sử dụng.

Nhưng gần đây tôi đã thấy một số tài liệu tham khảo sử dụng thuật ngữ độ lệch chuẩn và đây là những gì họ làm:

Tính bình phương của sự khác biệt giữa các giá trị đơn và giá trị trung bình. Sau đó lấy trung bình của họ và cuối cùng là gốc của câu trả lời.

Tôi đã thử cả hai phương pháp trên một tập hợp dữ liệu chung và câu trả lời của chúng khác nhau. Tôi không phải là một nhà thống kê. Tôi đã bối rối trong khi cố gắng dạy lệch cho trẻ em của tôi.

Vì vậy, trong ngắn hạn, các điều khoản độ lệch chuẩnđộ lệch trung bình là như nhau hoặc là cuốn sách văn bản cũ của tôi sai?


2
Hai đại lượng khác nhau. Họ cân dữ liệu khác nhau. Độ lệch chuẩn sẽ lớn hơn và nó bị ảnh hưởng nhiều hơn bởi các giá trị lớn hơn. Độ lệch chuẩn (đặc biệt nhất là phiên bản mẫu số n) có thể được coi là độ lệch bình phương gốc. Độ lệch chuẩn được sử dụng phổ biến hơn.
Glen_b -Reinstate Monica

6
Liên quan rất chặt chẽ : stats.stackexchange.com/questions/118/ .
whuber


1
Ngẫu nhiên, một lý do mà mọi người có xu hướng thích độ lệch chuẩn là do phương sai của tổng các biến ngẫu nhiên không liên quan thêm vào (và những biến liên quan cũng có một công thức đơn giản). Điều đó không xảy ra với độ lệch trung bình.
Glen_b -Reinstate Monica

2
@Alexis phrasing là kém. Đối với các biến ngẫu nhiên độc lập, Var (X + Y) = Var (X) + Var (Y). Thực tế này được sử dụng khắp nơi trên diễn ra (nó dẫn đến quen thuộc ncác thuật ngữ khi chuẩn hóa các công thức liên quan đến các phương tiện, như trong thống kê t mẫu một ví dụ). Không có thực tế chung tương ứng cho độ lệch trung bình.
Glen_b -Reinstate Monica

Câu trả lời:


27

Cả hai trả lời khoảng cách giá trị của bạn được lan truyền xung quanh giá trị trung bình của các quan sát.

Một quan sát có giá trị trung bình là 1 "khác xa" so với giá trị trung bình là 1 trên giá trị trung bình. Do đó bạn nên bỏ qua dấu hiệu của sự sai lệch. Điều này có thể được thực hiện theo hai cách:

  • Tính giá trị tuyệt đối của độ lệch và tính tổng của chúng.

  • Bình phương các độ lệch và tổng hợp các hình vuông này. Do hình vuông, bạn cho trọng số nhiều hơn với độ lệch cao, và do đó tổng của các hình vuông này sẽ khác với tổng phương tiện.

Sau khi tính toán "tổng độ lệch tuyệt đối" hoặc "căn bậc hai của tổng độ lệch bình phương", bạn tính trung bình cho chúng để có "độ lệch trung bình" và "độ lệch chuẩn" tương ứng.

Độ lệch trung bình hiếm khi được sử dụng.


Vì vậy, khi người ta chỉ đơn giản nói 'độ lệch', họ có nghĩa là 'độ lệch chuẩn'?
itols

Tôi đồng ý rằng 1 ở trên hoặc dưới đây sẽ chỉ ra một 'thay đổi' hoặc 'phân tán' có ý nghĩa theo quan điểm của một người bình thường. Nhưng bình phương nó sẽ cho giá trị lớn hơn và đó có thể không phải là 'thay đổi thực tế' của tôi. Có thể tôi sai nhưng đó là cách tôi nhìn thấy nó: /
đó là

Hầu hết các lần thuật ngữ độ lệch chuẩn (căn bậc hai của phương sai) được sử dụng. Tính toán các hình vuông thường được thực hiện, vì nó tạo điều kiện cho rất nhiều tính toán khác.
Kasper

1
@itsols Về mặt kỹ thuật, bạn phải luôn chỉ định loại thống kê độ lệch mà bạn đang tính cho tập dữ liệu - chính độ lệch từ phải tham chiếu đến độ lệch của một biểu dữ liệu duy nhất so với giá trị trung bình (theo cách Kasper sử dụng nó trong câu trả lời ).
AmeliaBR

@itsols, +1 cho Amelia. Thật vậy, không ai nói về một thống kê dữ liệu chỉ là "độ lệch". Một thống kê là "độ lệch trung bình tuyệt đối" hoặc "gốc của độ lệch bình phương trung bình" hoặc đại loại như vậy.
ttnphns

15

Ngày nay, các giá trị thống kê chủ yếu được tính bằng các chương trình máy tính (Excel, ...), chứ không phải bằng máy tính cầm tay nữa. Do đó, tôi cho rằng việc tính toán "độ lệch trung bình" không cồng kềnh hơn so với tính toán "độ lệch chuẩn". Mặc dù độ lệch chuẩn có thể có "... các đặc tính toán học làm cho nó hữu ích hơn trong thống kê", trên thực tế, đó là một biến dạng của khái niệm phương sai từ một giá trị trung bình, vì nó làm tăng thêm trọng số cho các điểm dữ liệu khác xa trung bình. Có thể mất một chút thời gian, nhưng tôi, với một người, hy vọng các nhà thống kê sẽ quay lại sử dụng "độ lệch trung bình" thường xuyên hơn khi thảo luận về phân phối giữa các điểm dữ liệu - nó thể hiện chính xác hơn cách chúng ta thực sự nghĩ về phân phối.


Bạn đưa ra một tuyên bố phi thường về cách mọi người (đủ điều kiện thống kê) "thực sự nghĩ". Nguồn thông tin của bạn về điều đó là gì?
whuber

7
Nguồn chỉ đơn giản là những người mà tôi đã đặt câu hỏi về chủ đề này, cũng như bản thân tôi. Khi được hỏi: Làm thế nào để bạn hình dung sự thay đổi trong tập dữ liệu này? phản hồi luôn được biểu thị theo khoảng cách tuyến tính so với giá trị trung bình - đáp ứng không bao giờ bao gồm bình phương hoặc căn bậc hai. Cấp, tôi là một kỹ sư, không phải là "nhà thống kê", nhưng tôi sẽ yêu cầu bất cứ ai khác thử thách bản thân về chủ đề này. Vâng, chúng tôi yêu toán học về độ lệch chuẩn - thật thú vị, nhưng đây có thực sự là cách bạn hình dung độ lệch khỏi giá trị trung bình?
andyl

2
Nó phụ thuộc vào mục đích. Để khám phá dữ liệu, tôi có xu hướng sử dụng các ước tính phân tán mạnh mẽ, dựa trên xếp hạng, chẳng hạn như độ lệch trung bình so với trung vị, theo tinh thần gần với đề xuất của bạn. Nhưng đối với nhiều công việc khác, đặc biệt là khi đánh giá (thậm chí cả về mặt tinh thần) tiềm năng có ý nghĩa thống kê, ước tính kích thước mẫu phù hợp, tìm ra giá trị của thông tin và quyết định giữa các quy trình thống kê cạnh tranh, suy nghĩ về phương sai (và do đó độ lệch chuẩn) là Cần thiết. Độ lệch trung bình không thay thế, như toán học cho thấy rõ.
whuber

1
Kiểm tra giấy này .
Pete

@Pete Làm thế nào bạn đạt đến đó?
Vicrobot

9

Cả hai đều đo cùng một khái niệm, nhưng không bằng nhau.

1n|xix¯|1n(xix¯)2

a+ba+b
|xix¯|=(xix¯)2(xix¯)2

n

1n(xix¯)2

Lý do tại sao độ lệch chuẩn được ưa thích là vì về mặt toán học dễ dàng hơn để làm việc sau này, khi các phép tính trở nên phức tạp hơn.


3
Nói chung, giá trị tuyệt đối của một tổng không giống như tổng của các giá trị tuyệt đối! Không phải hàm vuông, căn bậc hai, hay hàm tuyệt đối đều là tuyến tính, đó là lý do tại sao tổng sau khi áp dụng hàm khác với áp dụng hàm sau khi lấy tổng.
AmeliaBR

@AmeliaBR bạn tất nhiên là hoàn toàn chính xác!
ltronneberg

Phần còn lại của cuộc tranh luận là tốt, đó là lý do tại sao tôi quyết định chỉnh sửa các tuyên bố có vấn đề.
AmeliaBR

8

@itsols, tôi sẽ thêm vào khái niệm quan trọng của Kasper rằng The mean deviation is rarely used. Tại sao độ lệch chuẩn được coi là thước đo độ biến thiên tốt hơn độ lệch tuyệt đối trung bình? Bởi vì trung bình số học là quỹ tích của độ lệch bình phương tối thiểu (và không phải tổng của độ lệch tuyệt đối) từ nó.

Giả sử bạn muốn đánh giá mức độ của lòng vị tha. Sau đó, bạn có thể sẽ không hỏi một người về việc anh ta sẵn sàng cho tiền bao nhiêu trong "tình hình chung" của cuộc sống. Thay vào đó, bạn sẽ chọn hỏi anh ta đã sẵn sàng làm điều đó bao nhiêu trong tình huống bị buộc, nơi anh ta có thể tái định cư tối thiểu cho cuộc sống của chính mình. Tức là số lượng của lòng vị tha cá nhân trong tình huống khi số tiền đó là tối thiểu của cá nhân là gì?

Tương tự như vậy, mức độ biến đổi của các dữ liệu này là gì? Theo trực giác, chỉ số đo lường tốt nhất cho nó là chỉ số được tối thiểu hóa (hoặc tối đa hóa) xuống đến giới hạn trong bối cảnh này. Bối cảnh là "xung quanh ý nghĩa số học". Rồi st. sai lệch là sự lựa chọn tốt nhất theo nghĩa này. Nếu bối cảnh là "xung quanh trung vị" thì có nghĩa là | độ lệch | sẽ là sự lựa chọn tốt nhất, bởi vì trung vị là quỹ tích của độ lệch tuyệt đối tối thiểu từ nó.


4
Sự biện minh của bạn cho SD dựa trên Locus là thông tư. Bạn đang biện minh cho SD bằng cách đặt tầm quan trọng đặc biệt vào ý nghĩa số học - tất cả điều này cho thấy rằng họ có mối quan hệ chứ không phải SD là đặc biệt. Ai có thể tương tự như vị trí quan trọng trên trung bình, đó là các locus của tổng tối thiểu của absalute mất mát. Lý do thực sự khiến SD được sử dụng thường xuyên hơn là vì toán học dễ làm việc hơn với ... hơn nữa, nó dễ tính toán hơn (cả vì trung bình yêu cầu "sắp xếp" và vì hình vuông nhanh hơn để tính toán so với các câu lệnh nhánh). Sai lệch triết học có giá trị lớn hơn.
samthebest

7

Một điều đáng bổ sung là lý do rất có thể khiến sách giáo khoa 30 tuổi của bạn sử dụng độ lệch trung bình tuyệt đối so với độ lệch chuẩn là dễ dàng hơn để tính toán bằng tay (không có căn bậc hai / bình phương). Bây giờ các máy tính có thể dễ dàng truy cập đối với học sinh trung học, không có lý do gì để không yêu cầu họ tính toán độ lệch chuẩn.

Vẫn còn một số tình huống sử dụng độ lệch tuyệt đối thay vì độ lệch chuẩn trong điều chỉnh mô hình phức tạp. Độ lệch tuyệt đối ít nhạy cảm hơn với các ngoại lệ cực đoan (giá trị cách xa đường trung bình / đường xu hướng) so với độ lệch chuẩn vì chúng không bình phương khoảng cách đó trước khi thêm nó vào các giá trị từ các điểm dữ liệu khác. Do các phương pháp phù hợp mô hình nhằm giảm tổng độ lệch khỏi đường xu hướng (tính theo độ lệch của phương pháp là tính toán), nên các phương pháp sử dụng độ lệch chuẩn có thể tạo ra một đường xu hướng tách khỏi phần lớn các điểm để gần hơn với điểm ngoài . Sử dụng độ lệch tuyệt đối làm giảm sự biến dạng này, nhưng với chi phí làm cho việc tính toán đường xu hướng trở nên phức tạp hơn.

Đó là bởi vì, như những người khác đã lưu ý, độ lệch chuẩn có các tính chất và mối quan hệ toán học thường làm cho nó hữu ích hơn trong thống kê. Nhưng "hữu ích" không bao giờ nên bị nhầm lẫn với hoàn hảo.


1
chỉ tò mò, "tính chất toán học" nào làm cho SD hữu ích hơn độ lệch tuyệt đối? bằng cách trả lời tuyệt vời
Weipeng L

@pongba Độ lệch chuẩn là nội tại đối với nhiều mô hình thống kê giả định biến đổi ngẫu nhiên từ nhiều hiệu ứng có thể triệt tiêu lẫn nhau (hay còn gọi là dữ liệu phân phối thông thường). Điều này bao gồm độ chính xác lấy mẫu (biên sai số) khi sử dụng khảo sát từ một dân số lớn. Nếu dữ liệu của bạn đáp ứng mô hình này, bạn có thể ước tính xác suất nhận được giá trị từ số lượng SD từ giá trị trung bình. Bạn có thể tính SD của nhiều hiệu ứng độc lập từ SD của các thành phần riêng lẻ. Xem thêm: en.m.wikipedia.org/wiki/St Chuẩn_deviation
AmeliaBR

7

Cả hai đều đo lường sự phân tán dữ liệu của bạn bằng cách tính khoảng cách của dữ liệu với giá trị trung bình của nó.

  1. các độ lệch tuyệt đối trung bình đang sử dụng định mức L1 (nó còn được gọi là Manhattan khoảng cách hoặc khoảng cách thẳng )
  2. các độ lệch chuẩn là sử dụng định mức L2 (còn gọi là khoảng cách Euclide )

Sự khác biệt giữa hai chỉ tiêu là độ lệch chuẩn đang tính bình phương của sự khác biệt trong khi độ lệch tuyệt đối trung bình chỉ nhìn vào sự khác biệt tuyệt đối. Do đó các ngoại lệ lớn sẽ tạo ra độ phân tán cao hơn khi sử dụng độ lệch chuẩn thay vì phương pháp khác. Khoảng cách Euclide thực sự cũng được sử dụng thường xuyên hơn. Lý do chính là độ lệch chuẩncó các thuộc tính đẹp khi dữ liệu được phân phối bình thường. Vì vậy, theo giả định này, nên sử dụng nó. Tuy nhiên, mọi người thường thực hiện giả định này cho dữ liệu thực sự không được phân phối bình thường sẽ tạo ra vấn đề. Nếu dữ liệu của bạn không được phân phối bình thường, bạn vẫn có thể sử dụng độ lệch chuẩn, nhưng bạn nên cẩn thận với việc giải thích kết quả.

Cuối cùng, bạn nên biết rằng cả hai biện pháp phân tán đều là những trường hợp cụ thể của khoảng cách Minkowski , với p = 1 và p = 2. Bạn có thể tăng p để có các biện pháp phân tán dữ liệu khác.


Ngoài ra còn có một bài đăng trên math.stackexchange về chủ đề này: math.stackexchange.com/questions/384003/l1-norm-and-l2-norm
RockScience

6

Chúng là những biện pháp tương tự cố gắng định lượng cùng một khái niệm. Thông thường bạn sử dụng st. độ lệch vì nó có các thuộc tính đẹp, nếu bạn đưa ra một số giả định về phân phối cơ bản.

Mặt khác, giá trị tuyệt đối trong độ lệch trung bình gây ra một số vấn đề từ góc độ toán học vì bạn không thể phân biệt nó và bạn không thể phân tích nó dễ dàng. Một số thảo luận ở đây .


1

Không, bạn sai rồi. Đùa thôi. Tuy nhiên, có nhiều lý do khả thi tại sao người ta muốn tính độ lệch trung bình thay vì tiêu chuẩn chính thức, và theo cách này tôi đồng ý với quan điểm của Brethren kỹ thuật của tôi. Chắc chắn nếu tôi đang tính toán số liệu thống kê để so sánh với cơ thể của công việc hiện tại đang thể hiện kết luận định tính cũng như định lượng, tôi sẽ gắn bó với tiêu chuẩn. Nhưng, ví dụ, giả sử tôi đang cố gắng chạy một số nhanhCác thuật toán phát hiện dị thường trên dữ liệu nhị phân, do máy tạo. Tôi không sau khi so sánh học thuật là mục tiêu cuối cùng của tôi. Nhưng tôi quan tâm đến suy luận cơ bản về "sự lây lan" của một luồng dữ liệu cụ thể về ý nghĩa của nó. Tôi cũng quan tâm đến việc tính toán lặp đi lặp lại và hiệu quả nhất có thể. Trong phần cứng điện tử kỹ thuật số, chúng ta luôn chơi các trò bẩn thỉu - chúng ta chắt lọc các phép nhân và chia thành các lần dịch chuyển trái và phải, và để "tính toán" các giá trị tuyệt đối, chúng ta chỉ cần bỏ bit dấu (và tính toán bổ sung của một hoặc hai nếu cần thiết , cả hai biến đổi dễ dàng). Vì vậy, lựa chọn của tôi là tính toán nó theo cách kéo mạnh nhất có thể, và áp dụng các ngưỡng tuyến tính cho các tính toán của tôi để phát hiện nhanh sự bất thường trên các cửa sổ thời gian mong muốn.


1
Độ lệch chuẩn có thể được tính toán hiệu quả và đơn giản với thuật toán trực tuyến, giống như bất kỳ thời điểm nào có thể (bao gồm độ lệch tuyệt đối trung bình). Do đó, yêu cầu tính toán nhanh hay đơn giản sẽ không loại trừ điều này (cũng không loại trừ bất kỳ công cụ ước tính lan truyền dựa trên khoảnh khắc nào).
whuber

0

Hai biện pháp thực sự khác nhau. Đầu tiên thường được gọi là Độ lệch tuyệt đối trung bình (MAD) và thứ hai là Độ lệch chuẩn (STD). Trong các ứng dụng nhúng có sức mạnh tính toán hạn chế và bộ nhớ chương trình hạn chế, việc tránh các phép tính căn bậc hai có thể rất đáng mong đợi.

Từ một thử nghiệm sơ bộ nhanh, dường như MAD = f * STD với f ở đâu đó trong khoảng 0,78 đến 0,80 cho một tập hợp các mẫu ngẫu nhiên phân phối gaussian.


0

Amar Sagoo có một bài viết rất hay giải thích về điều này: [ http://blog.amarsagoo.info/2007/09/making-sense-of-stiteria-deviation.html]

Để thêm nỗ lực của riêng tôi vào một sự hiểu biết trực quan:

Độ lệch trung bình là một cách hay để hỏi điểm "trung bình" giả định cách trung bình bao xa, nhưng nó không thực sự hiệu quả khi hỏi tất cả các điểm cách nhau bao xa, hoặc "trải ra" dữ liệu như thế nào.

Độ lệch chuẩn là hỏi tất cả các điểm cách nhau bao xa, do đó, kết hợp nhiều thông tin hữu ích hơn là độ lệch trung bình (đó là lý do tại sao độ lệch trung bình thường chỉ được sử dụng như một bước đệm để hiểu độ lệch chuẩn).

Một sự tương tự tốt là Định lý Pythagore. Định lý Pythagore cho chúng ta biết khoảng cách giữa các điểm theo hai chiều bằng cách lấy khoảng cách ngang và khoảng cách dọc, bình phương chúng, thêm hình vuông và lấy căn bậc hai của tổng.

Nếu bạn nhìn kỹ, công thức cho Độ lệch chuẩn (dân số) về cơ bản giống như Định lý Pythagore, nhưng với nhiều hơn hai chiều (và sử dụng khoảng cách từ mỗi điểm đến trung bình là khoảng cách trong mỗi chiều). Do đó, nó cung cấp hình ảnh chính xác nhất về "khoảng cách" giữa tất cả các điểm trong tập dữ liệu của bạn.

Để đẩy sự tương tự đó đi xa hơn một chút, độ lệch tuyệt đối trung bình sẽ giống như lấy trung bình của khoảng cách ngang và dọc, ngắn hơn tổng khoảng cách, trong khi độ lệch tuyệt đối sẽ là thêm khoảng cách ngang và dọc, dài hơn hơn khoảng cách thực tế.


Tôi giả sử khi bạn nói độ lệch có nghĩa là độ lệch hoàn toàn có nghĩa là độ lệch hoàn toàn, đó là những gì OP đang nói. Thuật ngữ rất quan trọng vì độ lệch trung bình luôn là 0. Về độ chênh lệch giữa độ lệch tuyệt đối trung bình & độ lệch chuẩn, cả hai đều liên quan đến độ lệch của TẤT CẢ các điểm so với giá trị trung bình. Người ta liên quan đến tổng độ lệch tuyệt đối so với giá trị trung bình trong khi đó là căn bậc hai nếu tổng độ lệch bình phương ..
Michael R. Chernick

0

Độ lệch chuẩn đại diện cho sự phân tán do các quá trình ngẫu nhiên. Cụ thể, nhiều phép đo vật lý dự kiến ​​là do tổng của nhiều quá trình độc lập có phân phối (đường cong hình chuông) bình thường.

Phân phối xác suất bình thường được đưa ra bởi: Y= =1σ2πe-(x-μ)22σ2

Ở đâu Y là xác suất nhận được một giá trị x cho một ý nghĩa μσSai lệch chuẩn!

Nói cách khác, độ lệch chuẩn là một thuật ngữ phát sinh từ các biến ngẫu nhiên độc lập được tổng hợp lại với nhau. Vì vậy, tôi không đồng ý với một số câu trả lời được đưa ra ở đây - độ lệch chuẩn không chỉ là sự thay thế cho độ lệch trung bình mà "xảy ra thuận tiện hơn cho các tính toán sau này". Độ lệch chuẩn là cách thích hợp để mô hình phân tán cho các hiện tượng phân tán thông thường.

Nếu bạn nhìn vào phương trình, bạn có thể thấy độ lệch chuẩn nặng hơn nhiều so với độ lệch lớn hơn giá trị trung bình. Theo trực giác, bạn có thể nghĩ độ lệch trung bình là đo độ lệch trung bình thực tế so với giá trị trung bình, trong khi độ lệch chuẩn chiếm một phân bố hình chuông hay còn gọi là "bình thường" xung quanh giá trị trung bình. Vì vậy, nếu dữ liệu của bạn được phân phối bình thường, độ lệch chuẩn sẽ cho bạn biết rằng nếu bạn lấy mẫu nhiều giá trị hơn, ~ 68% trong số chúng sẽ được tìm thấy trong một độ lệch chuẩn xung quanh giá trị trung bình.

Mặt khác, nếu bạn có một biến ngẫu nhiên duy nhất, phân phối có thể trông giống như một hình chữ nhật, với xác suất bằng nhau của các giá trị xuất hiện ở bất kỳ đâu trong phạm vi. Trong trường hợp này, độ lệch trung bình có thể phù hợp hơn.

TL; DR nếu bạn có dữ liệu do nhiều quá trình ngẫu nhiên cơ bản hoặc đơn giản là bạn biết được phân phối bình thường, hãy sử dụng hàm độ lệch chuẩn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.