Có một định nghĩa chung về kích thước hiệu ứng?


10

Các effect-sizethẻ không có wiki. Các trang wikipedia về kích thước hiệu lực thi hành không cung cấp một định nghĩa tổng quát chính xác. Và tôi chưa bao giờ thấy một định nghĩa chung về kích thước hiệu ứng . Tuy nhiên, khi đọc một số cuộc thảo luận như cuộc thảo luận này, tôi có ấn tượng rằng mọi người nghĩ đến một khái niệm chung về kích thước hiệu ứng, trong bối cảnh kiểm tra thống kê . Tôi đã thấy rằng trung bình tiêu chuẩn được gọi là kích thước hiệu ứng cho một mô hình bình thường cũng như sự khác biệt trung bình được tiêu chuẩn hóaθ=μ/σN(μ,σ2)θ=(μ1μ2)/σcho một mô hình "hai Gaussian có nghĩa". Nhưng làm thế nào về một định nghĩa chung? Thuộc tính thú vị được chia sẻ bởi hai ví dụ trên là, theo như tôi có thể thấy, sức mạnh chỉ phụ thuộc vào các tham số thông qua và là một hàm tăng củaθ|θ|khi chúng tôi xem xét các thử nghiệm thông thường cho trong trường hợp đầu tiên và trong trường hợp thứ hai. H0:{μ=0}H0:{μ1=μ2}

Là tài sản này là ý tưởng cơ bản đằng sau khái niệm kích thước hiệu ứng? Điều đó có nghĩa là kích thước hiệu ứng được xác định theo một phép biến đổi một-một đơn điệu? Hoặc có một định nghĩa chung chính xác hơn?


+1, câu hỏi tuyệt vời. Một cách để suy nghĩ về kích thước hiệu ứng là các giá trị p đồng thời đo độ lớn & N, do đó ES được tách rời khỏi N (tất nhiên, điều này chỉ khá lỏng lẻo).
gung - Phục hồi Monica

Kích thước hiệu ứng chỉ dễ dàng để xác định trong một số trường hợp cụ thể. Với thử nghiệm hai mẫu phương tiện, khái niệm kích thước hiệu ứng rất đơn giản. Nhưng thêm vào một mẫu thứ ba và nó trở nên ít rõ ràng hơn (nếu bạn làm ANOVA, bạn có thể viết nó dưới dạng phương sai, mặc dù). Đối với một số thử nghiệm, nó chỉ đạt được không có gì rõ ràng hơn "bất cứ điều gì thống kê thử nghiệm này".
Glen_b -Reinstate Monica

câu hỏi tuyệt vời quá +1
Tim

@Glen_b Đối với bất kỳ mô hình tuyến tính Gaussian nào, sức mạnh của -test là một hàm tăng của tham số không trung tính (xem phần thứ hai của câu trả lời của tôi ở đây stats.stackexchange.com/a/59428/8402 ). Nó đôi khi giống như cho ANOVA. F(αi2)/σ2
Stéphane Laurent

1
@Glen_b Tôi không có gì chống lại câu trả lời cơ bản! Bất kỳ bình luận đều được hoan nghênh. Cảm ơn.
Stéphane Laurent

Câu trả lời:


5

Tôi không nghĩ rằng có thể có một câu trả lời chung chung và chính xác. Có thể có câu trả lời chung là lỏng lẻo, và câu trả lời cụ thể là chính xác.

Nhìn chung (và lỏng lẻo nhất) kích thước hiệu ứng là thước đo thống kê về mức độ lớn của một số mối quan hệ hoặc sự khác biệt.

Trong các bài toán kiểu hồi quy, một loại kích thước hiệu ứng là thước đo xem mức độ phương sai của biến phụ thuộc được tính cho mô hình. Nhưng, điều này chỉ có thể trả lời chính xác (AFAIK) trong hồi quy OLS - bởi . Có các biện pháp "giả- " cho hồi quy khác. Ngoài ra còn có các thước đo hiệu ứng cho các biến độc lập riêng lẻ - đây là các ước tính tham số (và biến đổi của chúng).R2R2

Trong thử nghiệm t, kích thước hiệu ứng tốt là sự khác biệt được tiêu chuẩn hóa của phương tiện (điều này cũng hoạt động trong ANOVA và có thể hoạt động trong hồi quy nếu chúng ta chọn các giá trị cụ thể của các vai độc lập)

và như thế.

Có toàn bộ sách về chủ đề này; Tôi đã từng có một, tôi tin rằng Ellis là phiên bản cập nhật của nó (tiêu đề nghe có vẻ quen thuộc)


Chào Peter. Tại sao bạn nói rằng sự khác biệt được tiêu chuẩn hóa là một lựa chọn tốt cho -test? Có phải vì thuộc tính tôi đã chỉ ra: sức mạnh phụ thuộc vào các tham số , , chỉ thông qua và là một chức năng tăng dần của. θtμ1μ2σθ|θ|
Stéphane Laurent

Xin chào @ StéphaneLaurent, vâng, đó là một cách chính thức hơn để đặt nó. Hoặc, bạn có thể nói rằng nó trở nên lớn hơn khi sự khác biệt trở nên lớn hơn, nhưng không bị ảnh hưởng bởi tỷ lệ.
Peter Flom - Tái lập Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.