Một số suy nghĩ tôi đã có:
Điều này tương tự với việc muốn thực hiện kiểm tra t hai mẫu - ngoại trừ mẫu thứ hai tôi chỉ có một giá trị duy nhất và 30 giá trị không nhất thiết phải được phân phối.
Chính xác. Ý tưởng này hơi giống một bài kiểm tra t với một giá trị duy nhất. Vì phân phối không được biết và tính quy phạm chỉ với 30 điểm dữ liệu có thể hơi khó nuốt, nên điều này đòi hỏi một số loại thử nghiệm không tham số.
Nếu thay vì 30 phép đo tôi có 10000 phép đo, thứ hạng của phép đo đơn có thể cung cấp một số thông tin hữu ích.
Ngay cả với 30 phép đo, thứ hạng có thể là thông tin.
Như @whuber đã chỉ ra, bạn muốn một số loại khoảng dự đoán. Đối với trường hợp không tham số, về cơ bản, những gì bạn đang hỏi là như sau: xác suất mà một điểm dữ liệu nhất định có thể có là do thứ hạng mà chúng tôi quan sát được cho phép đo thứ 31 của bạn là gì?
Điều này có thể được giải quyết thông qua một bài kiểm tra hoán vị đơn giản. Đây là một ví dụ với 15 giá trị và một cuốn tiểu thuyết (quan sát thứ 16) thực sự lớn hơn bất kỳ giá trị nào trước đây:
932
915
865
998
521
462
688
1228
746
433
662
404
301
473
647
new value: 1374
Chúng tôi thực hiện N hoán vị, trong đó thứ tự của các phần tử trong danh sách được xáo trộn, sau đó đặt câu hỏi: thứ hạng cho giá trị của phần tử đầu tiên trong danh sách (xáo trộn) là gì?
Việc thực hiện N = 1.000 hoán vị cho chúng ta 608 trường hợp trong đó thứ hạng của phần tử đầu tiên trong danh sách bằng hoặc tốt hơn với thứ hạng của giá trị mới (thực sự bằng nhau, vì giá trị mới là giá trị tốt nhất). Chạy lại mô phỏng cho 1.000 hoán vị, chúng ta nhận được 658 trường hợp như vậy, sau đó là 663 ...
Nếu chúng tôi thực hiện N = 1.000.000 hoán vị, chúng tôi thu được 62825 trường hợp trong đó thứ hạng của phần tử đầu tiên trong danh sách bằng hoặc tốt hơn với thứ hạng của giá trị mới (mô phỏng tiếp theo đưa ra 63071 trường hợp, sau đó là 63040 ...). Nếu lấy tỷ lệ giữa các trường hợp điều kiện được thỏa mãn và tổng số hoán vị, chúng ta sẽ nhận được các số như 0,062825, 0,062871, 0,06284 ...
Bạn có thể thấy các giá trị này hội tụ theo hướng 1/16 = 0,0625 (6,25%), như @whuber lưu ý, là xác suất mà một giá trị nhất định (trong số 16) được rút ra ngẫu nhiên có thứ hạng tốt nhất có thể trong số chúng.
Đối với tập dữ liệu mới, trong đó giá trị mới là giá trị tốt thứ hai (tức là xếp hạng 2):
6423
8552
6341
6410
6589
6134
6500
6746
8176
6264
6365
5930
6331
6012
5594
new value: 8202
chúng ta nhận được (với N = 1.000.000 hoán vị): 125235, 124883 ... các trường hợp thuận lợi, một lần nữa, gần đúng xác suất mà một giá trị nhất định (trong số 16) được rút ngẫu nhiên có thứ hạng tốt nhất có thể có trong số chúng: 2/16 = 0,125 (12,5%).