Tính công suất thống kê


22

Theo tôi hiểu, tôi cần biết ít nhất ba khía cạnh (trong số bốn) nghiên cứu đề xuất của tôi để tiến hành phân tích sức mạnh, cụ thể là:

  • loại thử nghiệm - Tôi dự định sử dụng Pearson's r và ANCOVA / Regression - GLM
  • mức ý nghĩa (alpha) - Tôi dự định sử dụng 0,05
  • kích thước hiệu ứng mong đợi - Tôi dự định sử dụng kích thước hiệu ứng trung bình (0,5)
  • cỡ mẫu

Bất cứ ai cũng có thể giới thiệu một máy tính năng lượng trực tuyến tốt mà tôi có thể sử dụng để thực hiện tính toán năng lượng tiên nghiệm . (SPSS có thể thực hiện tính toán sức mạnh tiên nghiệm không?)

Tôi đã đi qua GPower nhưng tôi đang tìm kiếm một công cụ đơn giản hơn!


Thật không may, gói SPSS không bao gồm một mô-đun để phân tích công suất. Công ty IBM SPSS bán một chương trình riêng để phân tích công suất.
ttnphns

6
Tôi sẽ cho GPower một cơ hội. Với 20 hoặc 30 phút khám phá nó, có lẽ bạn sẽ thấy nó rất dễ quản lý - ít nhất là đối với các thủ tục như tương quan, không nhất thiết phải là mô hình hồi quy phức tạp.
rolando2

Cảm ơn! Có hướng dẫn thân thiện với người dùng có sẵn trên GPower không?
Adhesh Josh

Điều này có vẻ như nó là cho một ứng dụng cấp. Đây là vexing để sản xuất và để đánh giá. Đối với các thiết kế thử nghiệm được sử dụng tốt (ví dụ nghiên cứu liên kết toàn bộ gen), có thể có các máy tính chuyên dụng được ghi chép tốt. Mặt khác, tôi nghĩ câu trả lời của G. Jay Kerns là cách phù hợp với phần bổ sung sau: trong khi bạn ở đó, bạn nên mô phỏng một loạt các tham số quan trọng nhất và trình bày biểu đồ.
Leo Schalkwyk

Câu trả lời:


43

Đây không phải là câu trả lời bạn sẽ muốn nghe, tôi sợ, nhưng tôi sẽ nói bằng mọi cách: cố gắng chống lại sự cám dỗ của máy tính trực tuyến (và tiết kiệm tiền của bạn trước khi mua máy tính độc quyền).

Dưới đây là một số lý do tại sao: 1) tất cả các máy tính trực tuyến đều sử dụng các ký hiệu khác nhau và thường được ghi chép kém. Đó là một sự lãng phí thời gian của bạn. 2) SPSS cung cấp một máy tính năng lượng nhưng tôi thậm chí chưa bao giờ thử nó vì nó quá đắt cho bộ phận của tôi đủ khả năng! 3) Các cụm từ như "kích thước hiệu ứng trung bình" ở mức sai lệch tốt nhất và tệ nhất là sai hoàn toàn đối với tất cả các thiết kế nghiên cứu đơn giản nhất. Có quá nhiều tham số và quá nhiều tương tác để có thể chưng cất kích thước hiệu ứng xuống một số duy nhất trong [0,1]. Ngay cả khi bạn có thể đặt nó thành một số duy nhất, không có gì đảm bảo rằng 0,5 của Cohen tương ứng với "trung bình" trong bối cảnh của vấn đề.

Hãy tin tôi - tốt hơn là về lâu dài để cắn viên đạn và dạy bản thân cách sử dụng mô phỏng để mang lại lợi ích cho bạn (và lợi ích của người mà bạn đang tư vấn). Ngồi xuống với họ và hoàn thành các bước sau:

1) Quyết định một mô hình phù hợp trong bối cảnh của vấn đề (có vẻ như bạn đã làm việc với phần này).

2) Tham khảo ý kiến ​​của họ để quyết định các tham số null nên là gì, hành vi của nhóm kiểm soát, bất kể điều này có nghĩa gì trong bối cảnh của vấn đề.

3) Tham khảo ý kiến ​​của họ để xác định các tham số nên là gì để sự khác biệt có ý nghĩa thực tế . Nếu có giới hạn kích thước mẫu thì điều này cũng nên được xác định ở đây.

4) Mô phỏng dữ liệu theo hai mô hình trong 2) và 3) và chạy thử nghiệm của bạn. Bạn có thể làm điều này với phần mềm galore - chọn mục yêu thích của bạn và thực hiện nó. Xem bạn có từ chối hay không.

5) Lặp lại 4) hàng ngàn lần, giả sử, . Theo dõi số lần bạn từ chối và tỷ lệ mẫu từ chối là ước tính sức mạnh. Ước tính này có lỗi tiêu chuẩn xấp xỉ .pnp^p^(1-p^)/n

Nếu bạn thực hiện phân tích sức mạnh của mình theo cách này, bạn sẽ tìm thấy một số điều: A) có rất nhiều thông số chạy xung quanh hơn bạn dự đoán. Nó sẽ khiến bạn tự hỏi làm thế nào trên thế giới có thể thu gọn tất cả chúng thành một số duy nhất như "phương tiện" - và bạn sẽ thấy rằng điều đó là không thể, ít nhất là không theo bất kỳ cách đơn giản nào. B) sức mạnh của bạn sẽ nhỏ hơn rất nhiều so với rất nhiều máy tính khác quảng cáo. C) bạn có thể tăng sức mạnh bằng cách tăng kích thước mẫu, nhưng xem ra! Bạn có thể thấy rằng tôi có thể phát hiện ra một sự khác biệt "thực tế có ý nghĩa", bạn cần một cỡ mẫu cực kỳ lớn.

Nếu bạn gặp rắc rối với bất kỳ bước nào ở trên, bạn có thể thu thập suy nghĩ của mình, hãy đặt ra một câu hỏi cho CrossValidated và những người ở đây sẽ giúp bạn.

EDIT: Trong trường hợp bạn thấy rằng bạn nhất định phải sử dụng máy tính trực tuyến, cái tốt nhất tôi tìm thấy là trang Sức mạnh và Kích cỡ mẫu của Russ Lenth . Nó đã tồn tại trong một thời gian dài, nó có tài liệu tương đối đầy đủ, nó không phụ thuộc vào kích thước hiệu ứng đóng hộp và có liên kết đến các giấy tờ khác có liên quan và quan trọng.

BẤT CỨ EDIT: Thật trùng hợp, khi câu hỏi này xuất hiện, tôi đã ngay giữa khi viết một bài đăng trên blog để đưa ra một số ý tưởng này (nếu không, tôi có thể đã không trả lời nhanh như vậy). Dù sao, tôi đã hoàn thành nó vào cuối tuần trước và bạn có thể tìm thấy nó ở đây . Nó không được viết với SPSS trong tâm trí, nhưng tôi cá là nếu một người thông minh họ có thể dịch các phần của nó sang cú pháp SPSS.


8
+1 Câu trả lời hay. Đó là giá trị chỉ ra những nhược điểm của mô phỏng. (Cách khác là các đường cong công suất có thể được tính toán bằng toán học.) Mô phỏng trở nên khó sử dụng khi nhiều tham số (như kích thước hiệu ứng và kích thước mẫu) phải được thao tác hoặc khi bạn đang tìm kiếm một giá trị ngưỡng nào đó, chẳng hạn như kích thước mẫu tối thiểu. Ngay cả một biểu thức chính xác gần đúng cho công suất cũng có thể có giá trị để chỉ ra nói chung cách thức hoạt động của công suất và để xác định các giải pháp ban đầu có thể được đánh bóng bằng một chút mô phỏng.
whuber

2
@whuber Cảm ơn, và bạn hoàn toàn đúng. Nhận xét của bạn nhắc nhở tôi rằng thường không có sự không chắc chắn trong các tham số null / alt (thông tin ít ỏi, nghiên cứu thí điểm nhàu nát, v.v.) làm tăng thêm một lớp phức tạp cho phương pháp mô phỏng. Đây là một lợi ích khác của phương pháp toán học.

2
Thay vì sửa các giá trị của các tham số chưa biết, rất hữu ích khi mô phỏng chúng bằng cách chỉ định phân phối trước cho các tham số này và sau đó lấy "quyền lực trước" (đây không phải là cách tiếp cận Bayes, mặc dù khái niệm phân phối trước, bởi vì chúng tôi mô phỏng kết quả của bài kiểm tra thường xuyên)
Stéphane Laurent

6
Có hai vấn đề với mô phỏng: Học nó (cái này có thể hòa tan) và thực hiện bước 3. Theo kinh nghiệm của tôi, không có khách hàng nào của tôi sẵn sàng làm 3). Nhiều người gặp khó khăn trong việc chỉ định BẤT K size kích thước hiệu ứng nào. Để yêu cầu họ chỉ định các tham số trong (giả sử) một phương trình hồi quy bội sẽ là .... tốt, họ sẽ không biết cách trả lời, ngay cả khi họ biết ý nghĩa, họ sẽ không sẵn sàng chỉ định.
Peter Flom - Tái lập Monica

2
Stephane vâng, bạn đúng, và đó là những gì tôi muốn nói bởi lớp thêm tôi đang cố gắng giao tiếp. @Peter thở dài! vâng, tôi cũng đã gặp điều này Tôi cố gắng nói về các phương tiện, lỗi tiêu chuẩn, vv và sau đó tìm ra càng nhiều toán học càng tốt sau đó. Một phần của nó là một rào cản giao tiếp đôi khi là một thách thức. Mặc dù vậy, phần không sẵn sàng thậm chí còn khó khăn hơn. Trước đây tôi thường từ bỏ và cố gắng tự điền vào chỗ trống, nhưng nó hiếm khi hoạt động tốt. Đó là, câu trả lời về cơ bản là một cú đánh trong bóng tối với bịt mắt và đứng về phía sau.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.