Tôi có thể thực hiện phân tích sức mạnh kiểm tra t cho các nhóm có kích thước không đồng đều tạo ra 2 mức tối thiểu khác nhau không?


9

Nó thường đơn giản để làm một Power Analysisphép tính minimum sample size, đặc biệt là trong R là môi trường tính toán thống kê ưa thích của tôi.

Tuy nhiên, tôi đang được yêu cầu thực hiện Phân tích sức mạnh khác một chút so với bất kỳ điều gì tôi đã làm hoặc tôi có thể tìm thấy tài liệu tham khảo trực tuyến. Tôi tự hỏi nếu những gì tôi đang được yêu cầu thậm chí có thể / hợp lệ.

Dự án về cơ bản có hai unequal groupstrạng thái và giả thuyết là hai nhóm này khác nhau đáng kể về một biến kết quả (đó là thời lượng của các cuộc gọi điện thoại cho khách hàng). Nhóm "kiểm soát" bao gồm 40 tiểu bang và tạo ra khoảng 2.500 quan sát. Nhóm "thử nghiệm" có khoảng 10 tiểu bang và 500 quan sát.

Ban đầu, tôi tìm thấy nhóm means+ pooled standard deviation, mà tôi đã sử dụng để tính toán một Effect Size. Sau đó, tôi sử dụng một gói gọi pwrtrong Rvà thấy rằng tôi cần một cỡ mẫu tối thiểu của khoảng 135 quan sát cho mỗi nhóm, trao .05 ý nghĩa và 0,8 điện.

Tuy nhiên, họ đã từ chối câu trả lời của tôi vì họ muốn một nhóm lớn hơn nhiều so với nhóm khác như hiện tại và họ đang mong đợi hai số lượng quan sát tối thiểu khác nhau cho mỗi nhóm hoặc tối thiểu% dân số về số lượng trạng thái hoặc các quan sát phải đi vào nhóm "thử nghiệm" của họ.

Tôi thấy Phân tích sức mạnh cho hai bài kiểm tra mẫu (tức là hàm R pwr.t2n.test), nhưng tôi phải chỉ định ít nhất một trong các cỡ mẫu trong khi họ muốn tôi nói với họ kích thước mẫu tối thiểu cho cả hai nhóm (dưới dạng số hoặc tỷ lệ phần trăm) và chức năng này không phản ánh sự khác biệt về độ lệch chuẩn cho hai nhóm.

Điều này có thể hay tôi chỉ nói với họ rằng đó không phải là cách nó hoạt động (tức là điều tốt nhất tôi có thể làm là nói với họ rằng với một trong các cỡ mẫu và độ lệch chuẩn gộp, nhóm thứ hai phải có ít nhất một kích thước nhất định)?

Câu trả lời:


7

Bạn có thể thực hiện tính toán kích thước mẫu cho kích thước mẫu không bằng nhau.

Ví dụ: bạn có thể quyết định số n theo tỷ lệ nào đó (chẳng hạn như tỷ lệ với dân số có lẽ).

Sau đó, có thể thực hiện các phép tính công suất (ít nhất là bạn có thể mô phỏng để có được sức mạnh trong bất kỳ trường hợp cụ thể nào, cho dù bạn có thể thực hiện đại số hay không).

Vấn đề là nó tương đối không hiệu quả trong việc tìm ra sự khác biệt so với tổng số quan sát ở cùng cỡ mẫu.

Hãy tưởng tượng bạn có tổng số mẫu là , với phương sai dân số bằng nhau và gần với phương sai mẫu bằng nhau, và lựa chọn của bạn nằm trong khoảng cách chia 50-50 và chia ( so với ).n 1 = 0,5 n n 1 = 0,9 nn=n1+n2n1=0.5nn1=0.9n

Thống kê t hai mẫu là:

t=X¯1X¯2spooled1n1+1n2

Tác động của kích thước mẫu là trong thuật ngữ .1/1n1+1n2

Nếu bạn chia 50-50, nó giống như có độ lệch chuẩn nhỏ hơn 40%; tại một bạn có thể nhận được hiệu ứng nhỏ hơn đáng kể với sự phân chia đồng đều.n1+n2

Nếu kích thước mẫu kết hợp không phải là một ràng buộc hiệu quả, tuy nhiên tính toán này có thể là vô nghĩa. Nó quan trọng trong trường hợp mọi quan sát đều mang cùng một chi phí cận biên, điều này không phải lúc nào cũng phù hợp.


Cảm ơn! Vì vậy, để thực sự thực hiện điều này là cách tốt nhất của tôi chỉ đơn giản là sử dụng một cái gì đó như pwr.t2n.test () trong R về cơ bản mọi kết hợp có thể có cho một cỡ mẫu kết hợp, hoặc có cách nào tốt hơn bạn khuyên bạn nên tính toán này không? Nếu bạn sử dụng ngôn ngữ / gói khác thì tôi có thể tìm ra cách dịch câu trả lời của bạn sang R. Trong cả hai trường hợp, cảm ơn giải pháp của bạn.
Hack-R

Tôi không hiểu những gì bạn nhận được ở đây. Theo như tôi có thể nói với bạn là bạn không có khả năng chia theo bất kỳ tỷ lệ nào bạn muốn; ví dụ của tôi là để minh họa hiệu ứng của sự phân chia không đồng đều. Nếu bạn có tổng kích thước mẫu cố định, thì hãy chia nó ở mức gần 50-50 như được chấp nhận. Nếu bạn không có tổng kích thước mẫu cố định, thì bạn sẽ tối ưu hóa dựa trên tuy nhiên chi phí và các ràng buộc của bạn thực sự sẽ đi.
Glen_b -Reinstate Monica

Phạm vi thông tin của tôi là họ hiện có hai nhóm thực sự không đồng đều với tổng số 3.000 quan sát trên 50 tiểu bang của Hoa Kỳ. Họ yêu cầu số lượng quan sát tối thiểu cho mỗi nhóm và / hoặc% sẽ đi vào mỗi nhóm, dựa trên các phương tiện và độ lệch chuẩn tôi nhận được từ dữ liệu. Tôi không biết họ có thể chia dữ liệu 50-50 hay bất kỳ cách nào họ thích hay không, nhưng tôi sẽ chỉ cho họ tối thiểu n trong nhóm 2 cho mỗi giá trị của nhóm 1 và cũng cho họ thấy chi phí chia tách ngoài 50 -50, có lẽ là về sức mạnh. Tôi nghĩ đó là khoảng những gì bạn đề nghị?
Hack-R

Tôi hiểu rồi. Bạn chắc chắn có thể tính toán một cái gì đó như thế, nhưng bạn không nhất thiết phải làm điều đó ở mọi ; những điều này tiến triển khá suôn sẻ. n
Glen_b -Reinstate Monica

1
@Glen: Đó là lý do tại sao tôi đã cố gắng nhanh chóng xóa nhận xét của mình về tính hữu ích (chưa) của thử nghiệm trong phân tích thời lượng. Nhưng bạn thậm chí còn nhanh hơn. Một mối quan tâm khác là cấu trúc nhóm của dữ liệu. Nhưng câu trả lời của bạn chính xác phù hợp với câu hỏi.
Michael M

2

Trước hết, tại sao bạn giả sử phương sai bằng nhau trong hai nhóm? Xin đừng nói, "Bởi vì nó thuận tiện." Tôi thực sự nghi ngờ rằng phương sai của nhóm là bằng nhau, mặc dù trong trường hợp kích thước mẫu bằng nhau không quan trọng. Mức độ tự do của bạn sẽ bị tắt, nhưng bạn biết bạn có ít nhất 130, vậy ai quan tâm? Có nhiều câu hỏi lớn hơn để giải quyết.

Nếu bạn định cho phép (hoặc yêu cầu) kích thước mẫu nhóm không đồng đều, vấn đề sẽ không có giải pháp duy nhất. Có hai ẩn số ( và và chỉ có một ràng buộc (sức mạnh tối thiểu phải là .) Tôi không nghĩ vấn đề có thể được giải quyết mà không có ràng buộc bổ sung. Có hai khả năng rõ ràng. trong số các cỡ mẫu (ví dụ: các nhà tài trợ muốn có ít nhất 300 quan sát từ Nhóm I). Khác là để sửa tỷ lệ (ví dụ: vì Nhóm I gấp mười lần số của Nhóm II, chúng tôi muốn ) Bây giờ tiến hành phân tích sức mạnh của bạn.n 2 ϕ n 1 = 10n1n2ϕn1=10n2


Làm thế nào tôi cho rằng có phương sai bằng nhau? Tôi biết không có ... đó là lý do tại sao tôi hỏi về khả năng sử dụng các độ lệch chuẩn khác nhau cho mỗi nhóm để thực hiện phép tính, mặc dù cách thông thường để thực hiện Phân tích sức mạnh là sử dụng độ lệch chuẩn gộp khi bạn có nhiều hơn 1 nhóm.
Hack-R

@NerdLife: Phương sai gộp, mà bạn nói bạn đã sử dụng, có nghĩa là giả sử phương sai bằng nhau. Cách làm "bình thường" là giả định rằng và trong trường hợp đó, việc gộp chung không quan trọng với giá trị của thống kê kiểm tra. OSL bị ảnh hưởng vì mức độ thay đổi tự do giữa và . Nhưng những thay đổi đó là khá nhỏ trên 30 hoặc hơn df. \ n 1 - 1 2n1=n2\n112(n11)
Dennis
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.