Kiểm định giả thuyết tuần tự trong khoa học cơ bản


16

Tôi là một dược sĩ và, theo kinh nghiệm của tôi, hầu hết tất cả các bài báo trong nghiên cứu y sinh cơ bản đều sử dụng bài kiểm tra t của Sinh viên (để hỗ trợ suy luận hoặc phù hợp với mong đợi ...). Cách đây vài năm, tôi đã nhận thấy rằng bài kiểm tra t của Sinh viên không phải là bài kiểm tra hiệu quả nhất có thể được sử dụng: các bài kiểm tra tuần tự cung cấp nhiều năng lượng hơn cho bất kỳ cỡ mẫu nào, hoặc cỡ trung bình nhỏ hơn nhiều cho công suất tương đương.

Các quy trình tuần tự về độ phức tạp khác nhau được sử dụng trong nghiên cứu lâm sàng nhưng tôi chưa bao giờ thấy một quy trình được sử dụng trong một ấn phẩm nghiên cứu y sinh cơ bản. Tôi lưu ý rằng họ cũng vắng mặt trong sách giáo khoa thống kê cấp độ giới thiệu, đó là tất cả những gì mà hầu hết các nhà khoa học cơ bản có thể nhìn thấy.

Câu hỏi của tôi là ba lần:

  1. Với lợi thế hiệu quả rất đáng kể của các bài kiểm tra tuần tự, tại sao chúng không được sử dụng rộng rãi hơn?
  2. Có một nhược điểm liên quan đến việc sử dụng các phương pháp tuần tự có nghĩa là việc sử dụng chúng của những người không theo thống kê sẽ không được khuyến khích?
  3. Là sinh viên thống kê được dạy về thủ tục kiểm tra tuần tự?

3
Để chắc chắn, bạn đang nói về ST như được tìm thấy trong các thử nghiệm lâm sàng, ví dụ en.wikipedia.org/wiki/Sequential_analysis ?
chl

Đúng. Có khá nhiều biến thể của thử nghiệm tuần tự, bao gồm cả thử nghiệm t tuần tự, nhưng không có biến thể nào được sử dụng trong nghiên cứu cơ bản. Tôi không thấy bất kỳ trở ngại nào cho việc sử dụng chúng.
Michael Lew - phục hồi Monica

(+1) Chỉ tình cờ kiểm tra tuần tự và tự hỏi mình những câu hỏi tương tự.
steffen

Câu trả lời:


5

Tôi không biết nhiều thử nghiệm liên tiếp và ứng dụng của chúng ngoài phân tích tạm thời (Jennison và Turnbull, 2000) và thử nghiệm thích ứng trên máy vi tính (van der Linden và Graffiti, 2010). Một ngoại lệ là trong một số nghiên cứu fMRI có liên quan đến chi phí lớn và khó khăn khi đăng ký môn học. Về cơ bản, trong trường hợp này, thử nghiệm tuần tự chủ yếu nhằm mục đích dừng thử nghiệm sớm hơn. Vì vậy, tôi không ngạc nhiên khi những cách tiếp cận rất phù hợp này không được dạy trong các lớp thống kê thông thường.

Các thử nghiệm tuần tự không phải là không có những cạm bẫy của chúng, mặc dù (lỗi loại I và II phải được chỉ định trước, lựa chọn quy tắc dừng và xem xét nhiều kết quả nên được chứng minh, giá trị p không được phân phối đồng đều dưới giá trị null như trong một lỗi cố định thiết kế mẫu, v.v.). Trong hầu hết các thiết kế, chúng tôi làm việc với một thiết lập thử nghiệm được chỉ định trước hoặc nghiên cứu năng lượng sơ bộ đã được thực hiện, để tối ưu hóa một số tiêu chí hiệu quả chi phí, trong trường hợp áp dụng quy trình thử nghiệm tiêu chuẩn.

Tuy nhiên, tôi thấy bài báo sau của Maik Dierkes về thiết kế mẫu cố định mở rất thú vị: Một yêu cầu cho các thiết kế thử nghiệm liên tiếp .


Các nhà nghiên cứu y sinh cơ bản luôn phân tích tạm thời mọi lúc, họ chỉ không tuyên bố chúng vì họ thậm chí không biết rằng nó quan trọng! Tôi đã khảo sát các nhà nghiên cứu tại một đại hội quốc gia và thấy rằng hơn 50% không biết rằng việc kiểm soát tỷ lệ lỗi từ kiểm tra t của Sinh viên phụ thuộc vào cỡ mẫu cố định được xác định trước. Bạn có thể thấy bằng chứng về điều đó trong các cỡ mẫu đôi khi thay đổi thất thường được sử dụng.
Michael Lew - phục hồi Monica

Một số nhược điểm xuất phát từ sự phức tạp của các thiết kế tuần tự đặc biệt đến trong thiết kế các phân tích hơn là trong việc thực hiện chúng. Có lẽ chúng ta có thể có một bộ các thiết kế đóng hộp sẵn cho các thí nghiệm cơ bản mẫu nhỏ.
Michael Lew - phục hồi Monica

@Michael Giới thiệu về các phân tích tạm thời "giả mạo" (nhìn vào giá trị p trong khi nghiên cứu vẫn đang trong giai đoạn phát triển): có vẻ như đó là việc sử dụng số liệu thống kê không phù hợp, không còn nữa.
chl

@Chi Ở một cấp độ, có, các phân tích tạm thời không được khai báo và không được quan tâm là không phù hợp (nhưng nó được thực hiện trong sự thiếu hiểu biết, một sự thiếu hiểu biết mà tôi tin rằng chỉ ra những bất cập trong phương pháp giảng dạy thống kê cho các nhà nghiên cứu y sinh cơ bản ...). Tuy nhiên, nếu chúng tôi xem xét nó ở cấp độ meta, thì có thể tìm thấy một số biện minh một phần. Nhiều thí nghiệm liên quan đến các mẫu nhỏ như vậy mà tỷ lệ lỗi dương tính giả tăng lên có thể là một sự đánh đổi hợp lý để có thêm sức mạnh. Công ước loại trừ mức độ khai báo của alpha cao hơn 0,05.
Michael Lew - phục hồi Monica

Tôi lưu ý trong bối cảnh này, các nhà nghiên cứu y sinh cơ bản không làm việc theo cách tiếp cận Neyman-Pearson độc quyền, ngay cả khi các tuyên bố rằng "kết quả trong đó P <0,05 được coi là đáng kể" có thể gợi ý khác. Nếu chúng ta nằm trong giới hạn của thử nghiệm ý nghĩa của Fisher trong đó các cân nhắc khác với giá trị P đạt được có thể được đưa vào các quyết định về cách xử lý kết quả thử nghiệm, có lẽ các phân tích tạm thời có thể không quá tệ. Tuy nhiên, một điều chắc chắn là một bài kiểm tra tuần tự được thiết kế sẽ vượt trội hơn một bài kiểm tra không được ký.
Michael Lew - phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.