Làm thế nào các tác giả của các bài kiểm tra giả thuyết thống kê đưa ra số liệu thống kê của họ?
Có nhiều cách để xác định số liệu thống kê kiểm tra, tùy thuộc vào hoàn cảnh. Điều quan trọng là cố gắng xác định các lựa chọn thay thế mà bạn thấy là quan trọng để chọn và cố gắng có được sức mạnh chống lại những điều đó, dưới một số giả định hợp lý.
Nếu bạn có một giả thuyết liên quan đến phương tiện dân số (thực tế, hãy làm cho nó đơn giản và xem xét thử nghiệm một mẫu), ví dụ, một thống kê dựa trên trung bình mẫu có vẻ như là một lựa chọn rõ ràng cho thống kê, vì nó sẽ có xu hướng để hành xử khác nhau dưới null và thay thế. Tuy nhiên (ví dụ), nếu bạn đang tìm kiếm các lựa chọn thay thế cho gia đình theo cấp số nhân Laplace / nhân đôi ( ), một cái gì đó dựa trên trung vị mẫu sẽ là lựa chọn tốt hơn cho một thử nghiệm về sự thay đổi trong ý nghĩa hơn là một cái gì đó dựa trên giá trị trung bình mẫu.DExp ( μ , τ)
Nếu bạn có một mô hình tham số cụ thể (dựa trên một số họ phân phối cụ thể), thì ít nhất bạn nên xem xét thử nghiệm tỷ lệ khả năng , vì chúng có một số tính chất hấp dẫn cho các mẫu lớn.
Trong nhiều tình huống khi bạn đang cố gắng thiết kế một bài kiểm tra từ đầu, một thống kê kiểm tra sẽ dựa trên số lượng quan trọng . Thống kê kiểm tra trong thử nghiệm t một mẫu (cũng như với nhiều thử nghiệm khác mà bạn có thể đã thấy trước đây) là một đại lượng quan trọng.
Đưa ra một vấn đề cụ thể, có phải luôn luôn rõ ràng lý tưởng (nếu điều này có thể xác định được trên cơ sở khách quan nào không) thống kê phải là gì?
Không có gì. Ví dụ, xem xét một thử nghiệm về tính quy tắc chung đối với một sự thay thế ominibus. Có nhiều cách để đo độ lệch so với tính chuẩn (hàng chục thử nghiệm như vậy đã được đề xuất) và ở các cỡ mẫu điển hình, không có cách nào mạnh nhất để chống lại mọi phương án.
Khi cố gắng thiết kế một thử nghiệm cho một tình huống như vậy, một lượng sáng tạo nhất định được yêu cầu đưa ra một lựa chọn sẽ có sức mạnh tốt để chống lại các loại thay thế mà bạn quan tâm nhất.
Có vẻ như hai yêu cầu được liệt kê trong bước 2 ở trên là quá rộng và nhiều số liệu thống kê khác nhau có thể được đưa ra để kiểm tra các giả thuyết tương tự.
Thật. Nếu bạn đưa ra một số giả định tham số (giả sử dữ liệu được rút ra từ một số họ phân phối và sau đó đưa ra giả thuyết của bạn liên quan đến một hoặc nhiều tham số của nó) thì có thể có một thử nghiệm khả thi nhất cho tất cả các tình huống như vậy (cụ thể là mạnh nhất kiểm tra), nhưng ngay cả khi đó nếu giả định tham số của bạn giống như một phỏng đoán sơ bộ, thì mong muốn về sự mạnh mẽ đối với giả định đó có thể thay đổi mọi thứ khá nhiều.
Ví dụ: (một lần nữa, thực hiện một thử nghiệm mẫu về dịch chuyển vị trí là đơn giản), nếu tôi lấy mẫu từ một dân số bình thường thì thử nghiệm t sẽ là tốt nhất. Nhưng hãy nói rằng tôi nghĩ rằng nó có thể không chính xác bình thường và trên hết có thể có một lượng nhỏ ô nhiễm bởi một số quy trình khác với một cái đuôi nặng vừa phải, sau đó là một thứ gì đó mạnh mẽ hơn (thậm chí có thể thay thế dựa trên xếp hạng như đã ký kiểm tra xếp hạng) có thể có xu hướng thực hiện tốt hơn trong một loạt các tình huống như vậy.