Giá trị quan trọng như thế nào so với danh sách các giá trị? Trong hầu hết các trường hợp, kiểm tra thống kê liên quan đến việc so sánh một tập hợp mẫu với dân số. Trong trường hợp của tôi, mẫu được tạo bởi một giá trị và chúng tôi so sánh nó với dân số.
Tôi là một chuyên gia trong thử nghiệm giả thuyết thống kê phải đối mặt với vấn đề có lẽ cơ bản nhất. Nó không chỉ là một thử nghiệm mà là hàng trăm trong số chúng. Tôi có một không gian tham số, và phải làm một bài kiểm tra quan trọng cho mọi điểm. Cả giá trị và danh sách nền (dân số) được tạo cho mỗi kết hợp tham số. Sau đó, tôi đang đặt hàng này theo giá trị p và tìm kết hợp tham số thú vị. Trong thực tế, việc tìm kiếm các kết hợp tham số trong đó p-val này cao (không đặc hiệu) cũng rất quan trọng.
Vì vậy, hãy thực hiện một thử nghiệm duy nhất: Tôi có một giá trị được tính toán được tạo từ một bộ đã chọn và một bộ giá trị nền được tính bằng cách chọn một bộ đào tạo ngẫu nhiên. Giá trị được tính là 0,35 và tập hợp nền là (có lẽ?) Thường được phân phối với giá trị trung bình là 0,25 và tiêu chuẩn rất hẹp (e-7). Tôi thực sự không có kiến thức về phân phối, bởi vì các mẫu được tính từ một thứ khác, chúng không phải là số mẫu ngẫu nhiên từ một số phân phối, vì vậy nền là từ chính xác cho nó.
Giả thuyết khống sẽ là "giá trị trung bình của phép thử mẫu bằng với giá trị tính toán của tôi là 0,35". Khi nào tôi nên coi đây là thử nghiệm Z hay thử nghiệm T? Tôi muốn giá trị cao hơn đáng kể so với trung bình dân số, do đó đây là một thử nghiệm đơn đuôi.
Tôi hơi bối rối không biết nên xem xét một mẫu nào: Tôi có một mẫu của một (quan sát) và danh sách nền là dân số HOẶC mẫu của tôi là danh sách nền và tôi đang so sánh nó với toàn bộ (không được ghép) dân số theo giả thuyết null nên có cùng một nghĩa. Một khi điều này được quyết định, thử nghiệm sẽ đi đến các hướng khác nhau tôi đoán.
Nếu là kiểm tra T, làm cách nào để tính giá trị p của nó? Tôi muốn tự tính toán nó thay vì sử dụng hàm R / Python / Excel (tôi đã biết cách thực hiện điều đó) do đó trước tiên tôi phải thiết lập công thức chính xác.
Để bắt đầu, tôi nghi ngờ một T-test là một chút quá chung chung, vì trong trường hợp của tôi T-test sẽ được liên kết với cỡ mẫu và sẽ có các hình thức: nơi Z = ˉ X
- Làm cách nào để tính giá trị p? (tức là không sử dụng hàm R / Python / Excel hoặc tra cứu bảng giá trị p nhưng thực sự tính toán nó dựa trên công thức, vì tôi muốn biết tôi đang làm gì)
- Làm cách nào để tôi quyết định ngưỡng ý nghĩa dựa trên kích thước mẫu của tôi? (một công thức sẽ tốt đẹp)