Như đã trở nên rõ ràng trong các bình luận cho câu hỏi, dữ liệu chỉ bao gồm bốn quan sát về thời gian để nảy chồi. (Sẽ là một sai lầm khi phân tích chúng như thể chúng là 16 giá trị độc lập.) Chúng bao gồm các khoảng thời gian thay vì thời gian chính xác:
[1,8], [8,16], [16,24], [24,32]
Có một số cách tiếp cận người ta có thể thực hiện. Một điều hấp dẫn, rất chung chung là thực hiện các khoảng thời gian này theo từ của họ: thời gian thực sự của sự bùng nổ nụ có thể là bất cứ điều gì trong mỗi khoảng thời gian. Do đó, chúng tôi được dẫn đến đại diện cho "độ không đảm bảo" ở hai dạng riêng biệt: độ không đảm bảo lấy mẫu (chúng tôi có một mẫu đại diện có lẽ là của loài trong năm nay) và độ không đảm bảo quan sát (được phản ánh bởi các khoảng).
Độ không đảm bảo lấy mẫu được xử lý bằng các kỹ thuật thống kê quen thuộc: chúng tôi được yêu cầu ước tính trung vị và chúng tôi có thể làm như vậy theo bất kỳ cách nào, tùy thuộc vào các giả định thống kê và chúng tôi có thể cung cấp khoảng tin cậy cho ước tính. Để đơn giản, giả sử thời gian để cụm nụ có phân bố đối xứng. Bởi vì nó (có lẽ là không âm), điều này ngụ ý rằng nó có phương sai và cũng cho thấy giá trị trung bình của chỉ bốn quan sát có thể được phân phối bình thường. Hơn nữa, tính đối xứng ngụ ý chúng ta có thể sử dụng giá trị trung bình như một đại diện thay thế cho trung vị (được tìm kiếm trong câu hỏi ban đầu). Điều này cho phép chúng tôi truy cập vào các phương pháp tiêu chuẩn, đơn giản, ước tính và khoảng tin cậy.
Độ không đảm bảo quan sát có thể được xử lý bằng các nguyên tắc số học khoảng (thường được gọi là "phân tích giới hạn xác suất" ): thực hiện tất cả các tính toán bằng cách sử dụng tất cả các cấu hình dữ liệu có thể phù hợp với các quan sát. Hãy xem cách nó hoạt động trong một trường hợp đơn giản: ước tính giá trị trung bình. Rõ ràng bằng trực giác rằng giá trị trung bình có thể không nhỏ hơn = 10,25 , đạt được bằng cách sử dụng các giá trị nhỏ nhất trong mỗi khoảng và cũng có thể là giá trị trung bình không thể lớn hơn ( 8 + 16 + 24 + 32( 1 + 8 + 16 + 24 ) / 410,25 = 18 . Chúng tôi kết luận:( 8 + 16 + 24 + 32 )18
Trung bình = [ 10,25 , 18 ] .
Điều này thể hiện toàn bộ khoảng ước tính: kết quả thích hợp của tính toán với đầu vào khoảng!
Một trên (một chiều) giới hạn tin cậy của giá trị trung bình của bốn giá trị x = ( x 1 , x 2 , x 3 , x 4 ) được tính từ trung bình của chúng m và mẫu độ lệch chuẩn s với Sinh viên phân phối t như1 - αx =( x1, x2, x3, x4)mS
hạt nhân ( x , α ) = x + tn - 1( α ) s / n--√.
Không giống như cách tính giá trị trung bình, thông thường, khoảng thời gian của các hạt nhân bị giới hạn bởi các giá trị giới hạn của các giá trị giới hạn. Thật vậy, lưu ý rằng UCL của các giới hạn khoảng cách thấp hơn, , tương đương 28,0758 , trong khi UCL ( ( 8 , 11,676 , 16 , 24 ) , 0,025 ) = 25,8674hạt nhân ( ( 1 , 8 , 16 , 24 ) , .025 )28.0758UCL ( ( 8 , 11,676 , 16 , 24 ) , 0,025 ) = 25,8674nhỏ hơn chưa Bằng cách tối đa hóa và tối thiểu hóa các hạt nhân trong số tất cả các kết hợp giá trị có thể phù hợp với các quan sát, chúng tôi thấy (ví dụ) rằng
ucl ( dữ liệu , .025 ) = [ 25.8 , 39.3 ]
(đó là một khoảng các số đại diện cho một hạt nhân có giá trị khoảng , không phải là khoảng tin cậy!) và, đối với giới hạn tin cậy thấp hơn,
LCL ( dữ liệu , 0,025 ) = [ 0 , 6,2 ] .
(Các giá trị này đã được làm tròn ra. là giá trị âm được cắt thành 0 với lý do thời gian chồi trung bình không thể âm.)00
Nói cách, chúng ta có thể nói rằng
"Những quan sát này phù hợp với các giá trị, nếu chúng được đo chính xác , có thể dẫn đến giới hạn tin cậy trên 2,5% của trung vị cao tới 39,3 ngày, nhưng không cao hơn. Chúng phù hợp với các giá trị (có thể khác với giá trị đầu tiên) điều đó sẽ dẫn đến giới hạn tin cậy thấp hơn 2,5% thấp đến 0. "
Những gì là để làm điều này là một vấn đề cho suy ngẫm cá nhân và phụ thuộc vào ứng dụng. Nếu ai đó muốn chắc chắn một cách hợp lý rằng vụ nổ chồi xảy ra trước 40 ngày, thì kết quả này mang lại sự hài lòng (có điều kiện dựa trên các giả định về phân bố chùm nụ và tính độc lập của các quan sát ). Nếu một người muốn ước tính vụ nổ chồi đến ngày gần nhất, thì rõ ràng cần thêm dữ liệu. Trong các trường hợp khác, kết luận thống kê này về các giới hạn tin cậy có giá trị trong khoảng thời gian có thể gây nản lòng. Ví dụ, làm thế nào chúng ta có thể tự tin rằng vụ nổ chồi xảy ra ở 50% mẫu vật trước 30 ngày? Thật khó để nói, bởi vì các câu trả lời sẽ là khoảng thời gian.
Có nhiều cách khác để xử lý vấn đề này. Tôi đặc biệt thích sử dụng các phương pháp khả năng tối đa. (Để áp dụng chúng ở đây, chúng ta sẽ cần biết thêm về cách thiết lập các điểm cắt khoảng cách. Vấn đề là chúng có được xác định độc lập với dữ liệu hay không.) Câu hỏi hiện tại dường như là một cơ hội tốt để giới thiệu các phương pháp dựa trên khoảng thời gian vì chúng dường như không được biết đến nhiều, mặc dù trong một số ngành nhất định (đánh giá rủi ro và phân tích thuật toán) chúng đã được một số người ủng hộ nồng nhiệt.