Có thể có nghĩa là cộng với một độ lệch chuẩn vượt quá giá trị tối đa?


19

Tôi có nghĩa là 74,10 và độ lệch chuẩn 33,44 cho một mẫu có tối thiểu 0 và tối đa 94,33.

Giáo sư của tôi hỏi tôi làm thế nào có thể có nghĩa là cộng với một độ lệch chuẩn vượt quá mức tối đa.

Tôi đã cho cô ấy thấy nhiều ví dụ về điều này, nhưng cô ấy không hiểu. Tôi cần một số tài liệu tham khảo để chỉ cho cô ấy. Nó có thể là bất kỳ chương hoặc đoạn nào từ một cuốn sách thống kê nói riêng về điều này.


Tại sao bạn muốn thêm (hoặc trừ) một độ lệch chuẩn so với giá trị trung bình? SD là thước đo mức độ lan truyền của dữ liệu. Thay vào đó, bạn có muốn sai số chuẩn của trung bình không?
Phục hồi Monica - G. Simpson

Tôi không muốn thêm hay bớt, người muốn đây là giáo sư của tôi. Đó là cách cô ấy hiểu về sự sai lệch nổi bật
Boyun Omuru

5
Một ví dụ thú vị là mẫu (0,01,0,02,0,98,0,99). Cả giá trị trung bình cộng với độ lệch chuẩn và giá trị trung bình trừ đi độ lệch chuẩn nằm ngoài [0,1].
Glen_b -Reinstate Monica

Có lẽ cô ấy chỉ nghĩ về một bản phân phối bình thường?
dùng765195

Câu trả lời:


28

Chắc chắn giá trị trung bình cộng với một sd có thể vượt quá mức quan sát lớn nhất.

Xem xét mẫu 1, 5, 5, 5 -

nó có nghĩa là 4 và độ lệch chuẩn 2, vì vậy giá trị trung bình + sd là 6, nhiều hơn một mức tối đa của mẫu. Đây là phép tính trong R:

> x=c(1,5,5,5)
> mean(x)+sd(x)
[1] 6

Đó là một sự xuất hiện phổ biến. Nó có xu hướng xảy ra khi có một loạt các giá trị cao và đuôi ở bên trái (nghĩa là khi có độ lệch trái mạnh và cực đại gần cực đại).

-

Khả năng tương tự áp dụng cho phân phối xác suất, không chỉ các mẫu - trung bình dân số cộng với sd dân số có thể dễ dàng vượt quá giá trị tối đa có thể.

Đây là một ví dụ về mật độ, có giá trị tối đa có thể là 1:beta(10,12)

nhập mô tả hình ảnh ở đây

Trong trường hợp này, chúng ta có thể xem trang Wikipedia để phân phối beta, trong đó nói rằng giá trị trung bình là:

E[X]=αα+β

và phương sai là:

var[X]=αβ(α+β)2(α+β+1)

(Mặc dù chúng tôi không cần phải dựa vào Wikipedia, vì chúng khá dễ để lấy được.)

Vậy với giá trị β = 1α=10 chúng tôi có nghĩa là0,9523và sd0,0628, vì vậy trung bình + sd1,0152, nhiều hơn tối đa có thể trong tổng số 1.β=120.95230.06281.0152

Đó là, có thể dễ dàng có giá trị trung bình + sd mà không thể được coi là giá trị dữ liệu .

-

Đối với mọi tình huống ở chế độ tối đa, độ lệch của chế độ Pearson chỉ cần là cho trung bình + sd để vượt quá mức tối đa. Nó có thể nhận bất kỳ giá trị nào, tích cực hoặc tiêu cực, vì vậy chúng ta có thể thấy nó dễ dàng có thể.<1

-

Một vấn đề liên quan chặt chẽ thường được nhìn thấy với các khoảng tin cậy cho tỷ lệ nhị thức , trong đó một khoảng thường được sử dụng, khoảng xấp xỉ bình thường có thể tạo ra các giới hạn bên ngoài .[0,1]

Ví dụ, hãy xem xét khoảng xấp xỉ bình thường 95,4% cho tỷ lệ dân số thành công trong các thử nghiệm Bernoulli (kết quả là 1 hoặc 0 tương ứng với các sự kiện thành công và thất bại), trong đó 3 trong 4 quan sát là " " và một quan sát là " 0 ".10

Sau đó, giới hạn trên cho khoảng là p + 2 × p^+2×14p^(1p^)=p^+p^(1p^)=0.75+0.433=1.183

Đây chỉ là giá trị trung bình mẫu + ước tính thông thường của sd cho nhị thức ... và tạo ra một giá trị không thể.

Các sd mẫu thông thường cho 0,1,1,1 là 0,5 chứ không phải là 0,433 (chúng khác nhau bởi vì ML dự toán nhị thức của độ lệch chuẩn p ( 1 - p ) tương ứng với cách chia đúng bởi n hơn là n - 1 ) . Nhưng nó không có sự khác biệt - trong cả hai trường hợp, mean + sd vượt quá tỷ lệ lớn nhất có thể.p^(1p^)nn1

Thực tế này - rằng một khoảng xấp xỉ bình thường cho nhị thức có thể tạo ra "các giá trị không thể" thường được ghi chú trong sách và giấy tờ. Tuy nhiên, bạn không xử lý dữ liệu nhị thức. Tuy nhiên, vấn đề - có nghĩa là + một số độ lệch chuẩn không phải là giá trị có thể - là tương tự.

-

Trong trường hợp của bạn, giá trị "0" bất thường trong mẫu của bạn đang làm cho sd lớn hơn giá trị trung bình giảm, đó là lý do tại sao giá trị trung bình + sd cao.

nhập mô tả hình ảnh ở đây

-

(Câu hỏi thay vào đó là - bằng lý do gì sẽ là không thể? - bởi vì không biết tại sao mọi người sẽ nghĩ rằng có vấn đề gì cả, chúng ta sẽ giải quyết vấn đề gì?)

Tất nhiên, về mặt logic, người ta chứng minh điều đó là có thể bằng cách đưa ra một ví dụ về nơi nó xảy ra. Bạn đã làm điều đó rồi. Trong trường hợp không có một lý do đã nêu tại sao nó phải khác, bạn phải làm gì?

Nếu một ví dụ không đủ, bằng chứng nào sẽ được chấp nhận?

Thực sự không có điểm nào chỉ đơn giản là chỉ vào một tuyên bố trong một cuốn sách, vì bất kỳ cuốn sách nào cũng có thể khiến một tuyên bố bị lỗi - tôi luôn thấy chúng. Người ta phải dựa vào chứng minh trực tiếp rằng có thể, bằng chứng về đại số (người ta có thể xây dựng từ ví dụ beta ở trên chẳng hạn *) hoặc bằng ví dụ số (mà bạn đã đưa ra), mà bất cứ ai cũng có thể tự kiểm tra sự thật .

* whuber đưa ra các điều kiện chính xác cho trường hợp beta trong các bình luận.


5
0<β<1α>β(1+β)/(1β)(α,β)1

Hãy để tôi giải thích thêm. Tôi đang tìm kiếm tỷ lệ chính xác của thiết bị cụ thể được sử dụng để chỉnh sửa răng. Và thiết bị này đã thực hiện tỷ lệ phần trăm chính xác cho 7 răng như sau:% 76,19,% 77,41,% 94,33,% 91,06,% 0,% 87,77,% 91,96. Giáo sư của tôi thêm một độ lệch chuẩn cho ý nghĩa và nói rằng kết quả không thể vượt quá giá trị tối đa thậm chí% 100 vì% 100 là tỷ lệ chính xác tối đa mà thiết bị có thể thực hiện.
Boyun Omuru

2
Cô ấy đúng rằng tỷ lệ phần trăm> 100% không có ý nghĩa trong tình huống của bạn. Vấn đề thực sự là tiền đề không có căn cứ rằng việc thêm một sd vào giá trị trung bình sẽ có ý nghĩa trong bối cảnh này, khi nó không . Đó là nơi tôi tin rằng khó khăn của bạn bắt nguồn. Nếu chúng tôi hiểu tiền đề đến từ đâu, nó có thể dẫn đến một giải pháp tốt hơn. Có thể thực tế đơn giản đã được nêu trong một cuốn sách ở đâu đó (tuy nhiên đó là một quan sát tầm thường, vì vậy cũng có thể nó không phải vậy), nhưng tôi nghi ngờ nó sẽ được đưa vào một cách sẽ thỏa mãn cô ấy, bởi vì cô ấy sai tiền đề là nguồn gốc của vấn đề.
Glen_b -Reinstate Monica

1
Thật vậy - điểm nhỏ của tôi là sự tò mò này là kết quả của những gì độ lệch chuẩn đại diện cho các phân phối không đối xứng mạnh mẽ hơn là kết quả của việc lấy mẫu. Nhưng nói chung, tôi nghĩ rằng câu trả lời của bạn là tuyệt vời
Henry

2
@tomka Tôi đã cố gắng giúp nhiều sinh viên ở một vị trí tương tự. Cuối cùng tôi đã học được quy tắc ngón tay cái (có thể không gây ngạc nhiên) rằng thật sự không thể dạy người giám sát bất cứ điều gì thông qua phương tiện của học sinh của họ.
Glen_b -Reinstate Monica

4

Theo bất bình đẳng của Ch Chshshev, ít hơn k -2 điểm có thể nhiều hơn k độ lệch chuẩn. Vì vậy, với k = 1, điều đó có nghĩa là ít hơn 100% mẫu của bạn có thể có nhiều hơn một độ lệch chuẩn.

Thật thú vị hơn khi nhìn vào giới hạn thấp. Giáo sư của bạn nên ngạc nhiên hơn có những điểm có độ lệch chuẩn khoảng 2,5 dưới đây. Nhưng bây giờ chúng tôi biết rằng chỉ khoảng 1/6 mẫu của bạn có thể là 0.


3

σσ


5
Đây là một đóng góp tốt đẹp. Tuy nhiên, tôi không chắc chắn rằng SD thực sự "giả định" một phân phối bình thường.
gung - Tái lập Monica

3
"Phù hợp phân phối" và tìm cách chuyển đổi thành quy tắc là các thủ tục riêng biệt với các mục tiêu khác nhau.
whuber

2

X10<p<101-p

E(X)= =p,SE(X)= =p(1-p)

Và chúng tôi muốn

E(X)+SE(X)>1p+p(1-p)>1

p(1-p)>(1-p)

Bình phương cả hai mặt để có được

p(1-p)>(1-p)2p>1-pp>12

Nói cách, đối với bất kỳ biến ngẫu nhiên Bernoulli nào với p>1/2 biểu thức lý thuyết E(X)+SE(X)>tối đaX giữ

Vì vậy, ví dụ, đối với bất kỳ mẫu iid nào được rút ra từ Bernoulli, giả sử, p= =0,7, trong hầu hết các trường hợp, giá trị trung bình của mẫu cộng với độ lệch chuẩn của mẫu sẽ vượt quá giá trị1, sẽ là giá trị tối đa quan sát được (không bao gồm trường hợp mẫu tất cả các số không!).

Đối với các phân phối khác, chúng tôi luôn có hướng ngược lại trong bất đẳng thức, ví dụ: đối với Đồng phục Bạn(một,b), nó luôn luôn là trường hợp E(Bạn)+SE(Bạn)<tối đaBạn= =b.
Do đó, không có quy tắc chung tồn tại.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.