Ý định điều tra của người dùng và các ngưỡng / giá trị p


21

Tôi đang đọc các slide "Làm phân tích dữ liệu Bayesian" của John Kruschke , nhưng thực sự có một câu hỏi về cách giải thích của ông về các bài kiểm tra t và / hoặc toàn bộ khung kiểm tra ý nghĩa giả thuyết null. Ông lập luận rằng giá trị p là không xác định bởi vì chúng phụ thuộc vào ý định của điều tra viên.

Cụ thể, ông đưa ra một ví dụ (trang 3-6) của hai phòng thí nghiệm thu thập các bộ dữ liệu giống hệt nhau so sánh hai phương pháp điều trị. Một phòng thí nghiệm cam kết thu thập dữ liệu từ 12 đối tượng (6 đối tượng), trong khi phòng thí nghiệm khác thu thập dữ liệu trong một khoảng thời gian cố định, điều này cũng xảy ra để mang lại 12 đối tượng. Theo các slide, giá trị quan trọng cho khác nhau giữa hai lược đồ thu thập dữ liệu này: cho cái trước, nhưng cho cái sau !tp<0,05tcrit=2,33tcrit=2,45

Một bài đăng trên blog - mà bây giờ tôi không thể tìm thấy - đã đề xuất rằng kịch bản thời lượng cố định có nhiều mức độ tự do hơn vì họ có thể đã thu thập dữ liệu từ 11, 13 hoặc bất kỳ số lượng đối tượng nào khác, trong khi kịch bản N cố định, bởi định nghĩa, có .N= =12

Ai đó có thể vui lòng giải thích cho tôi:

  • Tại sao giá trị tới hạn sẽ khác nhau giữa các điều kiện này?

  • (Giả sử đó là một vấn đề) Làm thế nào một người sẽ sửa chữa / so sánh các tác động của các tiêu chí dừng khác nhau?

Tôi biết rằng việc đặt tiêu chí dừng dựa trên mức độ quan trọng (ví dụ: mẫu cho đến khi ) có thể làm tăng khả năng xảy ra lỗi Loại I, nhưng dường như điều đó không xảy ra ở đây, vì quy tắc dừng không phụ thuộc vào kết quả của phân tích.p<0,05

Câu trả lời:


11

Dưới đây là một số thông tin khác: http://doingbayesiandataanalysis.blogspot.com/2012/07/sampling-distribution-of-t-when.html

Một cuộc thảo luận đầy đủ hơn được cung cấp ở đây: http://www.indiana.edu/~kruschke/BEST/ Bài viết đó xem xét các giá trị p để dừng ở ngưỡng N, dừng ở ngưỡng thời gian và dừng ở giá trị ngưỡng t.


Ồ Ngay từ miệng con ngựa, vì nó ... Đó chắc chắn là một ý tưởng thú vị đã xảy ra với tôi. Cảm ơn thông tin bổ sung.
Matt Krause

Tôi muốn thêm rằng điều này được thảo luận rất dài trong cuốn sách của Tiến sĩ Kruschke (trong Chương 11).
Matt Krause

13

Cuối cùng tôi đã theo dõi bài báo liên quan đến các slide: Kruschke (2010) , cũng có sẵn trực tiếp từ tác giả (thông qua CiteSeerX) ở đây , vì tạp chí không được mang đi rộng rãi. Lời giải thích là một chút prosaic, nhưng tôi vẫn không chắc chắn tôi mua nó.

Trong trường hợp N cố định, giá trị quan trọng được tính như sau: 2 mẫu N được rút ngẫu nhiên từ dân số (cùng) và giá trị t được tính. Quá trình này được lặp đi lặp lại nhiều lần để xây dựng một bản phân phối null. Cuối cùng, t c r i t được đặt là phân vị thứ 95 của phân phối đó.t2Nttcrtôit

Đối với trường hợp thời gian cố định, ông giả định rằng đối tượng đến với tốc độ trung bình . Phân phối null được xây dựng bằng cách lặp lại hai bước. Trong bước đầu tiên, số lượng các đối tượng cho mỗi điều kiện N 1N 2 được rút ra từ một phân phối possion với tham số λ . Tiếp theo, N 1N 2 rút ngẫu nhiên từ dân số được sử dụng để tính giá trị t . Điều này được lặp đi lặp lại nhiều lần và t c r i t được đặt là tỷ lệ phần trăm thứ 95 của phân phối đó.λN1N2λN1N2ttcrtôit

tNNt2N-2

Trong điều kiện khác, có vẻ như phân phối giống như " " thực sự là sự kết hợp của các mẫu từ nhiều phân phối t khác nhau , tùy thuộc vào các lần rút cụ thể. Bằng cách đặt λ = N , người ta có thể nhận được trung bình bậc tự do để bằng 2 N - N , nhưng đó không phải là khá đủ. Ví dụ: trung bình của các phân phối t cho ν = 1ν = 5 dường như không phải là phân phối t với 3 bậc tự do.ttλ= =N2N-Ntν= =1ν= =5t

Tóm tắt:

  • Tác giả đã tạo ra bằng cách mô phỏng, thay vì chỉ tính toán chúng từ CDF.tcrtôit
  • Cách tác giả mô phỏng kịch bản thời lượng cố định có vẻ như nó có thể vỗ béo các đuôi của phân phối tương ứng .t
  • Tôi vẫn không tin rằng đây thực sự là một vấn đề, nhưng sẽ rất vui khi đọc / upvote / chấp nhận câu trả lời nếu có ai nghĩ khác.

Tại sao bạn có thể trả lời câu hỏi của riêng bạn và cho nó một dấu kiểm? Có vẻ như bạn không thể tự đưa ra ý kiến ​​của mình!
Michael R. Chernick

5
Không có gì sai khi trả lời câu hỏi của chính mình , Michael.
chl

@MichaelCécick, tôi tin rằng bạn không nhận được bất kỳ đại diện nào nếu bạn chấp nhận câu trả lời của riêng bạn. Vào thời điểm đó, có vẻ như đó là điều đúng đắn, vì tôi đã ít nhiều theo dõi câu trả lời trong hai tuần qua, nhưng tôi đã chuyển sự chấp nhận của mình sang câu trả lời của John K. Kruschke vì anh ấy rõ ràng là người có thẩm quyền slide :-)
Matt Krause

Cảm ơn thú vị. Nhưng tôi không hiểu tại sao người ta nên kiểm tra câu trả lời của mình bất cứ lúc nào ngay cả khi nó có vẻ đúng và tốt nhất. Chúng tôi đã thiết lập rằng việc kiểm tra câu trả lời của riêng bạn không mang lại cho bạn điểm đại diện.
Michael R. Chernick

3
Vì việc đánh dấu một câu trả lời là được chấp nhận không có mục đích nào khác ngoài việc chỉ ra một giải pháp chính xác (cho khách truy cập trong tương lai), đặc biệt khi không có đề xuất nào khác được đề xuất, tôi thấy không có vấn đề gì với điều đó. Cá nhân, tôi đã đưa ra câu trả lời này từ lâu, bởi vì tôi đánh giá cao việc OP cho phép chúng ta hưởng lợi từ nghiên cứu của chính mình. Và tôi thực sự xin lỗi vì không thể bỏ phiếu bổ sung cho thực tế đơn giản là theo chủ đề này và cập nhật quyết định của mình. PS "Chúng tôi đã thành lập ..." đề cập đến Tại sao có thể cho mình điểm danh tiếng? .
chl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.