Làm thế nào để biết xác suất thất bại nếu không có thất bại?


50

Tôi đã tự hỏi liệu có cách nào để nói xác suất xảy ra sự cố (một sản phẩm) nếu chúng ta có 100.000 sản phẩm trong lĩnh vực này trong 1 năm và không có thất bại? Xác suất mà một trong 10.000 sản phẩm tiếp theo được bán là gì?


4
Một cái gì đó cho tôi biết đây không phải là vấn đề độ tin cậy thực sự. Không có sản phẩm nào có tỷ lệ thất bại thấp như vậy.
Aksakal

Bạn cần một mô hình để phân phối tỷ lệ thành công / thất bại có thể trước khi bạn có thể suy ra bất cứ điều gì từ số liệu thống kê đến xác suất cho tỷ lệ thành công / thất bại thực tế. Mô tả của bạn cung cấp rất ít cơ sở để từ đó suy ra / giả định phân phối như vậy.
RBarryYoung

1
@RBarryYoung vui lòng kiểm tra các câu trả lời được cung cấp - họ cung cấp một vài cách tiếp cận thú vị và hợp lệ cho vấn đề. Nếu bạn không đồng ý với những cách tiếp cận đó, hãy bình luận hoặc đưa ra câu trả lời của riêng bạn.
Tim

2
@Aksakal - tỷ lệ thất bại thấp như vậy dường như là không thể nếu đó là một sản phẩm đơn giản có giá trị cao và rủi ro cao như vậy trong trường hợp thất bại (như một dụng cụ phẫu thuật) mà nó trải qua các cấp độ kiểm tra và kiểm tra (và có thể độc lập chứng nhận) trước khi phát hành. Tất nhiên, điều ngược lại có thể đúng, sản phẩm có thể có giá trị thấp đến mức người dùng cuối không báo cáo sự cố với sản phẩm bị lỗi (chắc chắn các nhà sản xuất kẹo cao su có tỷ lệ lỗi 1/100000 được báo cáo?), Người tiêu dùng chỉ cần loại bỏ nó và thử một cái mới
Johnny

@ John, khi Motorola đưa ra họ đã từng tự hào rằng có 3 lỗi trên 100 triệu sản phẩm, hoặc đại loại như thế. 6σ
Aksakal

Câu trả lời:


43

Xác suất mà một sản phẩm sẽ thất bại chắc chắn là một chức năng của thời gian và sử dụng. Chúng tôi không có bất kỳ dữ liệu nào về việc sử dụng và chỉ với một năm không có thất bại (xin chúc mừng!). Do đó, khía cạnh này (được gọi là chức năng sống sót ), không thể được ước tính từ dữ liệu của bạn.

Tuy nhiên, bạn có thể nghĩ về những thất bại trong vòng một năm do rút ra từ phân phối nhị thức . Bạn vẫn không có thất bại, nhưng đây là một vấn đề phổ biến. Một giải pháp đơn giản là sử dụng quy tắc 3 , chính xác với lớn (mà bạn chắc chắn có). Cụ thể, bạn có thể nhận được trên ràng buộc của một đứng về phía một 95% khoảng tin cậy (ví dụ, các ràng buộc thấp là ) về xác suất thực sự của sự thất bại trong vòng một năm như . Trong trường hợp của bạn, bạn tự tin 95% rằng tỷ lệ nhỏ hơn . 0 3 / N 0,00003N03/N0.00003

Bạn cũng đã hỏi làm thế nào để tính xác suất để một hoặc nhiều trong số 10k tiếp theo thất bại. Một cách nhanh chóng và đơn giản (mặc dù cực đoan) để mở rộng phân tích ở trên là chỉ sử dụng giới hạn trên làm xác suất cơ bản và sử dụng CDF nhị thức tương ứng để có xác suất sẽ không có thất bại. Sử dụng mã, chúng tôi có thể làm : , mang lại cơ hội nhìn thấy một hoặc nhiều thất bại trong các sản phẩm 10k tiếp theo. Bằng cách sử dụng giới hạn trên, đây không phải là ước tính điểm tối ưu về xác suất có ít nhất một lần thất bại, nhưng bạn có thể nói rằng rất có thể xác suất của thất bại là nhiều hơn1 26 % ( F + 1 ) / ( N + 2 ) F p = 9,9998 × 10 - 06 1 +10 %0R1-pbinom(0, size=10000, prob=0.00003)0.2591851126%(nhận ra rằng đây là một khung hình 'hơi lượn sóng'). Một khả năng khác là sử dụng đề xuất của @ amoeba về ước tính từ quy tắc kế vị của Laplace . Quy tắc kế tiếp nói rằng xác suất thất bại ước tính là , trong đó là số lần thất bại. Trong trường hợp đó, và phép tính cho xác suất dự đoán là thất bại trong 10.000 tiếp theo là , đạt năng suất hoặc . (F+1)/(N+2)Fp^=9.9998×10061+1-pbinom(0, size=10000, prob=9.9998e-06)0.0951612210%


3
+1. Tôi chưa từng nghe về "quy tắc 3" trước đây. Tôi tự hỏi liệu có mối liên hệ nào giữa quy tắc 3 và "Quy tắc kế vị của Laplace" không? Theo sau này (nếu tôi áp dụng đúng), xác suất thất bại có thể được ước tính là . 1/(N+2)
amip nói phục hồi Monica

14
@amoeba Quy tắc 3 này là giới hạn tin cậy một phía 95%. Giả sử số lượng thất bại có phân phối Binomial . Sau đó, cơ hội nhìn thấy không có thất bại là . Để làm cho giá trị đó lớn hơn , hãy giải cho . Sử dụng cho nhỏ , giải pháp là . Vì , chúng tôi thu được . Đó là "quy tắc 3." Thật đáng để biết vì bây giờ bạn đã biết cách thay đổi "3" nếu bạn muốn điều chỉnh mức độ tin cậy và bạn cũng có thể đảo ngược nó để tìm mức tối thiểu cần thiết để phát hiện tỷ lệ( 1 - p ) n 5 % ( 1 - p ) n0,05 p log ( 1 - p ) - p p p - log ( 0.05 ) / n 0.05 = 1 / 20 e 3 p 3 / n n p(n,p)(1p)n5%(1p)n0.05plog(1p)ppplog(0.05)/n0.05=1/20e3p3/nnp hoặc lớn hơn.
whuber

1
@amoeba như tôi đã đề cập, tôi đã mặc đồng phục trước xác suất thất bại. Tôi tin rằng một sự khác biệt trước sẽ dẫn đến kết quả khác nhau đáng kể.
Yair Daon

1
Chỉnh sửa của bạn là tiến triển tốt (+1). Tuy nhiên, nó đặt ra vấn đề giải thích. Chúng tôi không "chắc chắn" cơ hội không quá vì chúng tôi không hoàn toàn chắc chắn về cơ hội thực sự tiềm ẩn. Chúng tôi không có "giới hạn trên" trên , mà chỉ có giới hạn tin cậy trên. Khi bạn đưa ra dự đoán cho một sự kiện trong tương lai, bạn cần (a) ước tính nó và (b) cung cấp giới hạn về nó. Nhìn vào nó như thế này: cung cấp cho chúng tôi giới hạn về khi , độc lập, có điều kiện trên . Những giới hạn là một khoảng thời gian dự đoán cho dựa trên .p Y X Binomial ( n , p ) Y Binomial ( m , p ) X = 0 Y X26%pYXBinomial(n,p)YBinomial(m,p)X=0YX
whuber

2
Yay cho "Quy tắc ba". Tôi nắm tay đã nhìn thấy nó nhiều năm trước trong một ghi chú ngắn cho "Tạp chí của Hiệp hội Y khoa Hoa Kỳ" jama.jamanetwork.com/article.aspx?articleid=385438
DWin

25

Bạn có thể có một cách tiếp cận bayesian. biểu thị xác suất thất bại bằng và nghĩ về nó như một biến ngẫu nhiên. Một tiên nghiệm, trước khi bạn xem kết quả của các thí nghiệm, bạn có thể tin rằng Θ ~ U ( 0 , 1 ) . Nếu bạn tin tưởng các kỹ sư để làm cho sản phẩm này đáng tin cậy, có thể bạn có thể mất Θ U ( 0 , 0,1 ) hoặc hơn thế. Đây là tùy thuộc vào bạn. Sau đó, bạn có thể sử dụng Bayes' định lý để tính toán phân bố sau của θ . Biểu thị Một sự kiện mà bạn đã quan sát ( n thí nghiệm không có thất bại).ΘΘU(0,1)ΘU(0,0.1)θAn

Tất cả mọi thứ rất đơn giản:Θlà thống nhất, vì vậyp(θ)là một số không đổi. Kể từ khi bạn chạynthí nghiệm,p(A|θ)chỉ là xác suất khôngthất bạitrongnthử nghiệm bernouli với xác suất thất bạiθ.

p(Θ=θ|A)=p(A|Θ=θ)p(Θ=θ)p(A)=p(A|θ)p(θ)p(A|θ)p(θ)dθ.
Θp(θ)np(A|θ)nθ

Một khi bạn có mà bạn đang vàng: bạn có thể tính toán xác suất của bất kỳ sự kiện B bởi integrateion: P ( B ) = p ( B | θ ) p ( θ | Một ) d θp(θ|A)BP(B)=p(B|θ)p(θ|A)dθ

Dưới đây, tôi làm việc thông qua một giải pháp chi tiết, theo cách tiếp cận trên. Tôi sẽ có một vài phím tắt tiêu chuẩn.

Đặt trước là . Khi đó: p ( θ | A ) p ( A | θ ) 1 = ( 1 - θ ) n . Quá trình chuẩn hóa liên tục p ( A ) = p ( A | θ ) p ( θ ) d θ được tìm thấy là B ( 1 , nU(0,1)

p(θ|A)p(A|θ)1=(1θ)n.
p(A)=p(A|θ)p(θ)dθ - xemchức năng betatrang wikipediavàphân phối beta. Vì vậy, p ( θ | Một ) = ( 1 - θ ) nB(1,n+1) , là bản phân phối beta với các tham số1,n+1.p(θ|A)=(1θ)nB(1,n+1)1,n+1

Biểu thị xác suất không thất bại trong sản phẩm trong năm tới bởi B . Xác suất của ít nhất một thất bại là 1 - P ( B ) . Khi đó 1 - P ( B ) = 1 - ( 1 - θ ) m ( 1 - θ ) nmB1P(B)

1P(B)=1(1θ)m(1θ)nB(1,n+1)dθ=B(1,n+m+1)B(1,n+1)

đó là khoảng , sử dụng n = 100 , 000 , m = 10 , 000 . Không ấn tượng lắm sao? Tôi đã phân phối thống nhất về xác suất thất bại. Có lẽ bạn có niềm tin tốt hơn trước các kỹ sư của bạn.0.1n=100,000,m=10,000


3
Có vẻ lạ khi thiếu một giải pháp thực tế cho một vấn đề đơn giản như vậy, đặc biệt là khi phương pháp này có vẻ rất hứa hẹn. Bạn đang đề xuất các tính toán là khó khăn?
whuber

2
@whuber Tôi không quên điều đó, tôi nghĩ bước cuối cùng này là hiển nhiên. Điều tôi muốn nói là "không ấn tượng" là 10% khả năng thất bại vẫn còn lớn, khi so sánh với không có thất bại nào trong 100.000 lần chạy đầu tiên. Ngoài ra, cảm ơn vì nhận xét liên quan đến các cặp liên hợp, tôi nghĩ rằng nó có thể gây nhầm lẫn cho OP và làm chúng mất tập trung khỏi những gì quan trọng, do đó đã bỏ qua nó.
Yair Daon

3
Rõ ràng là có - nhưng khi bạn kết thúc với giá trị 0,9, đó là con số mọi người sẽ thấy, hầu như không có vấn đề gì bạn nói về nó trong văn bản trước. Để bạn không bị hiểu lầm, luôn hữu ích để nói rõ về câu trả lời bạn đang cung cấp. (+1 cho câu trả lời được cải thiện, BTW)
whuber

3
n1kkn1ekkk

2
@whuber Giả định của bạn rằng việc trước không quan trọng là không đúng trong trường hợp không có lỗi. Nó phụ thuộc rất nhiều vào độ dốc gần bằng 0, ví dụ, đồng phục phẳng trước (beta 1,1) và Jeffreys trước (beta 0,5, 0,5) sẽ tạo ra một hậu thế khác biệt đáng kể.
Erik

12

Thay vì tính toán một xác suất, tại sao không dự đoán có bao nhiêu sản phẩm có thể thất bại?

Mô hình hóa các quan sát

n=100000m=10000p

p1pm+n=110000nXmY

Đóng khung câu hỏi

0Xn0YmY=u X+Y=uu{0,1,,m}n+mumun+m

p(u;n,m)=Pr(Y=u|X+Y=u)=(mu)(n+mu)=m(m1)(mu+1)(n+m)(n+m1)(n+mu+1).

Các công thức so sánh có thể được sử dụng để tính toán khiX=1,2,.

Một thượng hạn dự đoán1α (UPL) cho số thất bại trong những cuối cùng vé, , được đưa ra bởi nhỏ (tùy thuộc vào ) mà .mtα(X;n,m)uXp(u;n,m)α

Diễn dịch

UPL nên được hiểu theo nghĩa rủi ro khi sử dụng , như được đánh giá trước khi quan sát thấy hoặc Nói cách khác, giả sử đó là một năm trước và bạn được yêu cầu đề xuất một quy trình để dự đoán số lượng lỗi trong các sản phẩm tiếp theo sau khi đầu tiên được quan sát. Khách hàng của bạn hỏitαXYmn

Cơ hội mà thủ tục của bạn sẽ đánh giá thấp gì? Tôi không có ý trong tương lai sau khi bạn có nhiều dữ liệu hơn; Ý tôi là ngay bây giờ, bởi vì tôi phải đưa ra quyết định ngay bây giờ và cơ hội duy nhất tôi có sẵn cho tôi là những cơ hội có thể được tính toán vào lúc này. "Y

Phản hồi của bạn có thể là,

Ngay bây giờ cơ hội không lớn hơn , nhưng nếu bạn dự định sử dụng một dự đoán nhỏ hơn, cơ hội sẽ vượt quá .αα

Các kết quả

Với , và chúng tôi có thể tính toán rằngn=105m=104X=0

p(0,n,m)=1; p(1,n,m)=1110.091; p(2,n,m)=9091099990.0083;

Do đó, khi đã quan sátX=0 ,

  • Để có độ tin cậy lên tới (nghĩa là khi ), hãy dự đoán có nhiều nhất là lỗi trong sản phẩm tiếp theo .1α=90.9%9.1%αtα(0;n,m)=110,000

  • Để có độ tin cậy lên tới (nghĩa là khi ), hãy dự đoán có nhiều nhất là lần thất bại trong sản phẩm tiếp theo .99.2%0.8%α<9.1%tα(0;n,m)=210,000

  • Vân vân.


Bình luận

Khi nào và tại sao phương pháp này sẽ được áp dụng? Giả sử công ty của bạn tạo ra nhiều sản phẩm khác nhau. Sau khi quan sát hiệu suất của của từng người trong lĩnh vực này, họ thích tạo ra các đảm bảo, chẳng hạn như "thay thế hoàn toàn miễn phí cho bất kỳ thất bại nào trong vòng một năm." Bằng cách có các giới hạn dự đoán cho số lần thất bại, bạn có thể kiểm soát tổng chi phí phải trả lại các bảo đảm đó. Bởi vì bạn tạo ra nhiều sản phẩm và mong đợi thất bại là do hoàn cảnh ngẫu nhiên ngoài tầm kiểm soát của bạn, trải nghiệm của từng sản phẩm sẽ độc lập. Điều này có ý nghĩa để kiểm soát rủi ro của bạn về lâu dàin. Thỉnh thoảng bạn có thể phải trả nhiều khiếu nại hơn dự kiến, nhưng hầu hết thời gian bạn sẽ trả ít hơn. Nếu thanh toán nhiều hơn thông báo có thể bị hủy hoại, bạn sẽ đặt cực kỳ nhỏ (và bạn cũng có thể sẽ sử dụng mô hình thất bại tinh vi hơn!). Mặt khác, nếu chi phí không đáng kể, thì bạn có thể sống với độ tin cậy thấp (cao ). Những tính toán này cho thấy làm thế nào để cân bằng niềm tin và rủi ro.αα

Lưu ý rằng chúng ta không phải tính toán thủ tục đầy đủ . Chúng tôi đợi cho đến khi được quan sát và sau đó chỉ cần thực hiện các tính toán cho cụ thể đó (ở đây, ), như được hiển thị ở trên. Tuy nhiên, về nguyên tắc, chúng ta có thể thực hiện các tính toán cho tất cả các giá trị có thể có của ngay từ đầu.tXXX=0X

Một cách tiếp cận Bayes (được mô tả trong các câu trả lời khác) là hấp dẫn và sẽ hoạt động tốt với điều kiện kết quả không phụ thuộc nhiều vào trước đó. Thật không may, khi tỷ lệ thất bại thấp đến mức rất ít (hoặc không có thất bại) được quan sát, kết quả rất nhạy cảm với sự lựa chọn trước.


+1, nhưng dường như không đúng. p(0,n,m)=1
amip nói rằng Phục hồi Monica

1
@COOLSerdash, vì và các điều khoản cho không bằng không. up(u,n,m)=1u=1,2...
amip nói phục hồi Monica

1
Lý do bạn nhận được , như ghi chú @amoeba, là vì select không thực sự , mà là (và do đó nên thực sự được ký hiệu, ví dụ như hoặc đại loại như thế). Tôi gặp một số rắc rối sau khi thực hiện chính xác những gì bạn làm với điều đó sau này, nhưng tôi khá chắc chắn rằng, dù đó là gì, thật không may, đó không phải là một giải pháp chính xác cho vấn đề như đã hỏi. up(u;n,m)>1p(u;n,m)=(mu)(n+mu)Pr(Y=u|X=0)Pr(Y=u|X+Y=u) = Pr(X=0|X+Y=u)p(0;n,m,u)
Ilmari Karonen

1
@IlmariKaronen Cảm ơn bạn đã bình luận. Bạn nói đúng rằng tôi nên mô tả rõ ràng hơn một chút, bởi vì đó không phải là phân phối xác suất trên - đó là một xác suất có điều kiện - nhưng tôi tin rằng chính câu trả lời là đúng và tôi tôi rất tự tin rằng cách tiếp cận này để tính toán giới hạn dự đoán là cả chính xác và thông thường. Tôi sẽ chỉnh sửa bài này để làm rõ những điểm này. p(u;n,m)u
whuber

1
@Ilmari Tôi đã thực hiện chỉnh sửa - bạn có thể thấy nó trong lịch sử chỉnh sửa. Tôi giả sử không có linh mục và chỉ áp dụng định nghĩa về khoảng dự đoán cho vấn đề này. Nếu bạn muốn thử thách liệu điều đó có "có ý nghĩa thống kê hay không", thì bạn sẽ thấy mình thách thức một cách tinh túy về cấu trúc tiêu chuẩn này. Xem, ví dụ, Hahn & Meeker, Khoảng thời gian thống kê (J. Wiley 1991).
whuber

9

Sau đây là câu trả lời của Bayes cho "Trong số 10.000 sản phẩm mới, có bao nhiêu dự kiến ​​sẽ thất bại nếu tất cả 100.000 sản phẩm cũ không sản xuất không thành công?", Nhưng bạn nên xem xét độ nhạy cảm với các linh mục khác nhau.

Giả sử độc lập có điều kiện và được phân phối chính xác, được đưa ra , sao cho và sử dụng liên hợp trước , với .X1,,XnΘ=θX1Θ=θBernoulli(θ)ΘBeta(a,b)a,b>0

Đối với , chúng ta có m<n

E[i=m+1nXi|X1=0,Xm=0]=i=m+1nE[XiX1=0,Xm=0].

Đối với , chúng ta có trong đó chúng tôi đã sử dụng .m+1in

E[XiX1=0,Xm=0]=Pr(Xi=1X1=0,Xm=0)=01Pr(Xi=1Θ=θ)fΘX1,,Xm(θ0,,0)dθ=Γ(m+a+b)Γ(m+a+b+1)Γ(a+1)Γ(a)=am+a+b,
ΘX1=0,,Xm=0Beta(a,m+b)

Cắm số của bạn, với đồng phục trước ( ) bạn mong đợi tỷ lệ thất bại khoảng , trong khi trước đó giống như Jeffreys ( ) mang lại cho bạn tỷ lệ thất bại gần .a=1,b=110%a=1/2,b=1/25%

Dự đoán dự đoán này không giống như một bản tóm tắt tốt, bởi vì phân phối dự báo rất sai lệch. Chúng ta có thể đi xa hơn và tính toán phân phối dự đoán. Vì điều hòa như chúng ta đã làm trước khi chúng ta có cho .

i=m+1nXi|Θ=θBin(nm+2,θ),
Pr(i=m+1nXi=t|X1=0,Xm=0)=(nm+2t)Γ(m+a+b)Γ(a)Γ(m+b)Γ(t+a)Γ(nt+2)Γ(n+a+2),
t=0,1,,nm+2

Tôi sẽ hoàn thành nó sau khi tính toán khoảng dự đoán .95%


3
+1 để chứng minh rằng kết quả rất nhạy cảm với hình dạng của gần trước 0. (Đáng chú ý là, vì hàm khả năng tập trung mạnh gần 0 khi lớn, đó là phần duy nhất của trước đó thực sự quan trọng. ví dụ, đối với a trước đó, kỳ vọng xấp xỉ tỷ lệ với , nhưng gần như độc lập với . một đồng phục trước, điều đó thực sự không quan trọng lắm cho dù trước đó là hay , nhưng mọi thứ sẽ thay đổi đáng kể nếu chúng ta giả sử trước đó như .)mBeta(a,b)am+a+bamabU(0,1)U(0,0.01)U(0.01,1)
Ilmari Karonen

6

Sử dụng phương pháp tiếp cận vấn đề mặt trời mọc của Laplace , chúng tôi có xác suất rằng một sản phẩm sẽ thất bại trong vòng một năm . Tiếp theo, xác suất mà sản phẩm mới không thất bại trong vòng một năm là Do đó, xác suất ít nhất một sản phẩm của sẽ thất bại trong năm tới là Với , giá trị là . Trong trường hợp của người đánh bóng , thực tế khá cao.

p=1100000+1
n
(1p)n
n
1(11100001)n
n=10000P100000.095P2000000.87

Tất nhiên, bạn nên tiếp tục cập nhật dữ liệu của mình trong khi nhiều sản phẩm được bán hơn, cuối cùng một sản phẩm sẽ thất bại.


Câu trả lời này dường như không chính xác: phép tính cho một mặt trời mọc trong tương lai không mở rộng đơn giản thông qua phép nhân. Rốt cuộc, giả sử số đã được thay thế bằng . Bạn có khẳng định xác suất thất bại là ?? Bạn nên so sánh câu trả lời của mình với phân tích trong câu trả lời của Yair Daon và với các bình luận liên quan. 10,000200,000200000/1000012
whuber

@whuber, đã sửa nó
Aksakal

1
(1) Hoặc bạn tính toán sai hoặc "200000" của bạn là một lỗi đánh máy cho "20000". (Bạn sẽ nhận được khoảng .) (2) Phân tích của bạn hiện tái tạo một phần kết luận của Yair Daon, nhưng không có lợi ích trong việc tạo ra phân phối sau đầy đủ. 0.865
whuber

@whuber, vâng, nó là một con số không
Aksakal

5

Một số câu trả lời tốt đã được cung cấp cho câu hỏi này, nhưng gần đây tôi có cơ hội xem xét một vài tài nguyên về chủ đề này và vì vậy tôi quyết định chia sẻ kết quả.

Có nhiều ước tính có thể cho dữ liệu thất bại bằng không. Hãy biểu thị là số lần thất bại và là cỡ mẫu. Ước tính khả năng tối đa cho xác suất thất bại được cung cấp dữ liệu này làk=0n

(1)P(K=k)=kn=0

Ước tính như vậy là không thỏa đáng vì thực tế là chúng tôi quan sát thấy không có thất bại nào trong mẫu của chúng tôi hầu như không chứng minh rằng chúng là không thể nói chung. Kiến thức ngoài dữ liệu cho thấy có một số khả năng thất bại ngay cả khi không được quan sát (chưa). Có kiến ​​thức tiên nghiệm dẫn chúng ta sử dụng các phương pháp Bayes được xem xét bởi Bailey (1997), Razzaghi (2002), Basu et al (1996), và Ludbrook và Lew (2009).

Trong số các công cụ ước tính đơn giản, công cụ ước tính "giới hạn trên" giả định (Bailey, 1997)

rằng sẽ không hợp lý khi công cụ ước tính cho P trong trường hợp không có lỗi để đưa ra xác suất vượt quá dự đoán của công cụ ước tính khả năng tối đa trong trường hợp một lần thất bại, giới hạn trên hợp lý

định nghĩa là

(2)1n

có thể được đề cập. Theo đánh giá của Ludbrook và Lew (2009), các khả năng khác là "quy tắc của ba" (xem tại đây , Wikipedia hoặc Eypasch et al, 1995)

(3)3n

hoặc các biến thể khác:

(4)3n+1

"Quy tắc 3.7" của Newcombe và Altman (hoặc theo 3.6):

(5)3.7n

"quy tắc mới của bốn":

(6)4n+4

nhưng như kết luận của Ludbrook và Lew (2009), "quy tắc ba mươi" là "bên cạnh vô dụng" và "quy tắc 3.6" (và 3.7) "có những hạn chế nghiêm trọng - chúng không chính xác nếu kích thước mẫu ban đầu nhỏ hơn 50" và họ không đề xuất các phương pháp (3) - (6), đề nghị thay vì sử dụng các công cụ ước tính Bayes thích hợp (xem bên dưới).

Trong số các ước tính Bayes, một số khác nhau có thể được đề cập. Công cụ ước tính đầu tiên được đề xuất bởi Bailey (1997) là

(7)10.51n

để ước tính trung bình theo thống nhất trước

(8)10.51n+1

hoặc để ước tính trung bình theo trước đó

(9)1n+2

một cách tiếp cận khác giả định mô hình thất bại theo cấp số nhân với tỷ lệ thất bại không đổi (phân phối Poisson) mang lại

(10)1/3n

nếu chúng ta sử dụng beta trước các tham số và chúng ta có thể sử dụng công thức (xem Razzaghi, 2002):ab

(11)aa+b+n

rằng theo dẫn đến thống nhất trước (9). Giả sử Jeffreys trước với điều đó dẫn đếna=b=1a=b=0.5

(12)12(n+1)

Nói chung, các công thức Bayes (7) - (12) được khuyến nghị. Basu et al (1996) khuyến nghị (11) với thông tin trước, khi một số kiến ​​thức tiên nghiệm có sẵn. Vì không có phương pháp tốt nhất duy nhất tồn tại, tôi sẽ đề nghị xem xét tài liệu trước khi phân tích của bạn, đặc biệt là khi nhỏ.n


Bailey, RT (1997). Ước tính từ dữ liệu không thất bại. Phân tích rủi ro, 17 , 375-380.

Razzaghi, M. (2002). Về việc ước tính xác suất thành công nhị thức với số lần xuất hiện bằng 0. Tạp chí Phương pháp thống kê ứng dụng hiện đại, 1 (2), 41.

Ludbrook, J., & Lew, MJ (2009). Ước tính nguy cơ của các biến chứng hiếm gặp: liệu 'quy tắc ba' có đủ tốt không?. ANZ tạp chí phẫu thuật, 79 (7-8), 565-570.

Eypasch, E., Lefering, R., Kum, CK và Troidl, H. (1995). Xác suất của các sự kiện bất lợi chưa xảy ra: Một lời nhắc nhở thống kê. BMJ 311 (7005): 619 Mạnh620.

Basu, AP, Gaylor, DW, & Chen, JJ (1996). Ước tính khả năng xuất hiện khối u cho một bệnh ung thư hiếm gặp với số lần xuất hiện bằng 0 trong một mẫu. Quy định về độc tính và dược lý học, 23 (2), 139-144.


1
Đánh giá tuyệt vời về những gì hiện có!
AlefSin

Đối với các nhận xét bắt đầu với "Một số người ước tính Bayes vài ...", nói chung không rõ liệu một nhận xét đã cho có liên quan đến công thức trên nó hay dưới nó không. Bạn có thể làm cho điều đó rõ ràng hơn?
gung - Phục hồi Monica

2

Bạn thực sự cần phải quay lại với các nhà thiết kế sản phẩm của bạn. Đây là một vấn đề kỹ thuật cơ bản không phải là một vấn đề thống kê quan sát. Họ sẽ có một ý tưởng về xác suất thất bại của từng thành phần và từ đó xác suất thất bại ròng của tổng sản phẩm được lắp ráp. Họ có thể cung cấp cho bạn số lần thất bại dự kiến ​​trong toàn bộ thời gian thiết kế của sản phẩm.

Một kỹ sư xây dựng thiết kế một cây cầu có tuổi thọ thiết kế 120 năm. Mỗi thành phần của cây cầu có một cơ hội thất bại nhẹ. Mỗi lần tải có một cơ hội nhỏ bị vượt quá. Để làm cho cây cầu kinh tế được xây dựng, sự sụp đổ hoàn toàn sẽ chỉ xảy ra một lần trong 2400 năm, lâu hơn so với cây cầu sẽ được duy trì. Không có gì đáng ngạc nhiên khi cây cầu không thất bại trong năm 1, cũng không phải năm 2 đến năm 120. Điều đó đã không sụp đổ cho bạn biết rất ít. Các cơ hội thất bại khác nhau của nó chỉ có thể được ước tính bởi các nhà thiết kế ban đầu.


0

Điều này tương tự như một vấn đề tôi gặp phải khi chúng tôi giới thiệu một quy trình sản xuất mới để loại bỏ sự thất bại trong sản xuất.

Hệ thống mới tạo ra không có thất bại nên mọi người đã hỏi cùng một câu hỏi: làm thế nào để chúng ta dự đoán tỷ lệ thất bại? Trong trường hợp của bạn, bởi vì bạn đã quy định một khoảng thời gian mà sự thất bại có thể xảy ra mà không cần quan tâm đến khi sự cố xảy ra trong khoảng thời gian đó, các hiệu ứng thời gian đã được loại bỏ. Và nó chỉ đơn giản là một trường hợp cho dù một cái gì đó thất bại hay không. Với quy định đó - với câu trả lời của tôi.

Theo trực giác, có vẻ như chúng ta cần ít nhất một lần thất bại để có thể tính được tỷ lệ thất bại. Tuy nhiên, giả định này có một lỗi ngầm ẩn bên trong nó. Chúng tôi sẽ không bao giờ tính tỷ lệ thất bại. Đó là bởi vì chúng tôi đang xử lý một mẫu. Do đó, chúng tôi chỉ có thể ước tính một loạt các tỷ lệ thất bại có thể xảy ra. Cách để làm điều này là tìm một phân phối cho tỷ lệ thất bại. Sự phân bố mà không được công việc trong trường hợp này là một phân phối Beta nơi các thông số như sau: α = n + 1 và β = N - n + 1

Lưu ý: N là cỡ mẫu và n là số lần thất bại (trong trường hợp của bạn là 0)

Đối với kịch bản của bạn, phân phối tỷ lệ thất bại được hiển thị bên dưới. nhập mô tả hình ảnh ở đây .

Sau đó, bạn sẽ đưa phân phối đó vào công thức xác suất nhị thức tương ứng để có được phân phối cho xác suất một đơn vị không thành công (có thể được thực hiện phân tích hoặc sử dụng Monte Carlo). Tôi nghi ngờ rằng con số sẽ rất thấp.

Lưu ý rằng quy trình này được áp dụng bất kể số lần thất bại trong tập nắm tay của bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.