Sự khác biệt giữa Cohen d và Hedges 'g cho số liệu kích thước hiệu ứng


19

Để phân tích kích thước hiệu ứng, tôi nhận thấy rằng có sự khác biệt giữa Cohen d, Hedges's g và Hedges 'g *.

  • Có phải ba số liệu này thường rất giống nhau?
  • Điều gì sẽ là một trường hợp mà họ sẽ tạo ra kết quả khác nhau?
  • Đây cũng là vấn đề ưu tiên mà tôi sử dụng hoặc báo cáo?

1
Trong trường hợp nó hữu ích cho một công thức trả lời tiềm năng được liệt kê ở đây: en.wikipedia.org/wiki/Effect_size
Jeromy Anglim

Một mô phỏng trong R với sự khác biệt n1, n2, s1, s2 và dân số sẽ làm cho một bài tập tốt. Bất kỳ ai?
Jeromy Anglim

1
Tài liệu này cũng được đề cập ở đây: Sự khác biệt giữa Hedges 'g và Cohen's d .
gung - Phục hồi Monica

Câu trả lời:


18

Cả hai nhóm phương sai của Cohen d và Hedges đều dựa trên giả định về phương sai dân số bằng nhau, nhưng nhóm g sử dụng n - 1 cho mỗi mẫu thay vì n, điều này mang lại ước tính tốt hơn, đặc biệt là kích thước mẫu nhỏ hơn. Cả d và g đều có xu hướng tích cực, nhưng chỉ không đáng kể đối với cỡ mẫu vừa hoặc lớn hơn. Độ lệch được giảm bằng g *. D by Glass không giả sử phương sai bằng nhau, do đó, nó sử dụng sd của nhóm kiểm soát hoặc nhóm so sánh cơ sở làm tiêu chuẩn hóa cho sự khác biệt giữa hai phương tiện.

Các kích thước hiệu ứng này và các kích thước hiệu ứng không theo tỷ lệ của Cliff và các hiệu ứng không theo tỷ lệ khác sẽ được thảo luận chi tiết trong cuốn sách của tôi:

Grissom, RJ, & Kim, J, J. (2005). Kích thước hiệu quả cho nghiên cứu: Một cách tiếp cận thực tế rộng rãi. Mahwah, NJ: Erlbaum.


8

Theo hiểu biết của tôi, g của Hedges là phiên bản chính xác hơn của Cohen d (với SD gộp) trong đó chúng tôi thêm hệ số hiệu chỉnh cho mẫu nhỏ. Cả hai biện pháp đều đồng ý khi giả định đồng đẳng không bị vi phạm, nhưng chúng ta có thể tìm thấy tình huống không phải là trường hợp này, xem ví dụ McGrath & Meyer, Phương pháp tâm lý 2006, 11 (4) : 386-401 ( pdf ). Các giấy tờ khác được liệt kê ở cuối trả lời của tôi.

Tôi thường thấy rằng trong hầu hết các nghiên cứu tâm lý hoặc y sinh, đây là báo cáo của Cohen; điều này có lẽ đứng từ quy tắc nổi tiếng để giải thích độ lớn của nó (Cohen, 1988). Tôi không biết về bất kỳ bài báo gần đây nào xem xét g của Hedges (hay Cliff delta như một sự thay thế không tham số). Bruce Thompson có phiên bản sửa đổi của phần APA về kích thước hiệu ứng.

Tìm hiểu về Monte Carlo nghiên cứu về các biện pháp kích thước hiệu ứng, tôi thấy bài báo này có thể thú vị (tôi chỉ đọc phần tóm tắt và thiết lập mô phỏng): Khoảng tin cậy mạnh mẽ cho kích thước hiệu ứng: Một nghiên cứu so sánh giữa Cohen d và Cliff's Delta dưới sự phi quy tắc và phương sai không đồng nhất (pdf).

Về nhận xét thứ 2 của bạn, MBESSgói R bao gồm các tiện ích khác nhau để tính toán ES (ví dụ: smdvà các chức năng liên quan).

Tài liệu tham khảo khác

  1. Zakzanis, KK (2001). Thống kê để nói sự thật, toàn bộ sự thật, và không có gì ngoài sự thật: Công thức, ví dụ số minh họa và giải thích heuristic về phân tích kích thước hiệu ứng cho các nhà nghiên cứu tâm thần kinh. Tài liệu lưu trữ về thần kinh học lâm sàng , 16 (7), 653-667. ( pdf )
  2. Durlak, JA (2009). Cách chọn, tính toán và giải thích kích thước hiệu ứng. Tạp chí Tâm lý học Nhi khoa ( pdf )

2
Một người dùng ẩn danh muốn thêm định nghĩa về tính đồng nhất sau đây cho những người có thể không quen thuộc với thuật ngữ: "một thuộc tính của một tập hợp các biến ngẫu nhiên trong đó mỗi biến có cùng phương sai hữu hạn".
gung - Phục hồi Monica

5

Có vẻ như khi mọi người nói Cohen là họ chủ yếu có nghĩa là:

d=x¯1x¯2s

s

S= =Σ(x1-x¯1)2+(x2-x¯2)2n1+n2-2

Có các ước tính khác cho độ lệch chuẩn gộp, có lẽ là phổ biến nhất ngoài các mục trên:

S*= =Σ(x1-x¯1)2+(x2-x¯2)2n1+n2

S*n1+n2dgSS

Những lần khác, Hedge g được dành để đề cập đến một trong những phiên bản được điều chỉnh sai lệch của sự khác biệt trung bình được tiêu chuẩn hóa mà Hedges đã phát triển. Hedges (1981) đã chỉ ra rằng Cohen d có xu hướng tăng (nghĩa là giá trị kỳ vọng của nó cao hơn giá trị tham số dân số thực), đặc biệt là trong các mẫu nhỏ và đề xuất hệ số hiệu chỉnh để điều chỉnh sai lệch của Cohen:

Hedges's g (công cụ ước tính không thiên vị):

g= =d*(Γ(df/2)df/2Γ((df-1)/2))
df= =n1+n2-2Γ là hàm gamma. (ban đầu là Hedges 1981, phiên bản này được phát triển từ Hedges và Olkin 1985, trang 104)

Tuy nhiên, hệ số hiệu chỉnh này khá phức tạp về mặt tính toán, do đó, Hedges cũng cung cấp một phép tính gần đúng không đáng kể về mặt tính toán mà trong khi vẫn hơi thiên vị thì vẫn ổn cho hầu hết các mục đích có thể hiểu được:

g*

g*= =d*(1-34(df)-1)
df= =n1+n2-2

(Ban đầu từ Hedges, 1981, phiên bản này từ Borenstein, Hedges, Higgins, & Rothstein, 2011, trang 27)

g*g* quá!).

n>20

Người giới thiệu:

Borenstein, M., Hedges, LV, Higgins, JP, & Rothstein, HR (2011). Giới thiệu về Phân tích tổng hợp. Tây Sussex, Vương quốc Anh: John Wiley & Sons.

Cohen, J. (1977). Phân tích sức mạnh thống kê cho các ngành khoa học hành vi (tái bản lần 2). Hillsdale, NJ, US: Lawrence Erlbaum Associates, Inc.

Hàng rào, LV (1981). Lý thuyết phân phối cho Công cụ ước tính kích thước hiệu ứng của Glass và Công cụ ước tính liên quan. Tạp chí Thống kê Giáo dục, 6 (2), 107-128. doi: 10.3102 / 10769986006002107

Hàng rào LV, Olkin I. (1985). Phương pháp thống kê để phân tích tổng hợp. San Diego, CA: Báo chí học thuật


3

Nếu bạn chỉ đang cố gắng để hiểu ý nghĩa cơ bản của Hedges, như tôi, bạn cũng có thể thấy điều này hữu ích:

Độ lớn của Hedges 'g có thể được giải thích bằng cách sử dụng quy ước của Cohen (1988 [2]) là nhỏ (0,2), trung bình (0,5) và lớn (0,8). [1]

Định nghĩa của họ là ngắn gọn và rõ ràng:

Hedges 'g là một biến thể của Cohen d, điều chỉnh sai lệch do kích thước mẫu nhỏ (Hedges & Olkin, 1985). [1] chú thích

Tôi sẽ đánh giá cao các chuyên gia thống kê chỉnh sửa điều này để thêm bất kỳ cảnh báo quan trọng nào vào yêu cầu nhỏ (0,2) (0,5) và lớn (0,8), để giúp mọi người tránh hiểu sai số g của Hedges được sử dụng trong nghiên cứu tâm lý và khoa học xã hội.

[1] http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2848393/ Hiệu quả của liệu pháp dựa trên chánh niệm đối với chứng lo âu và trầm cảm: Đánh giá tổng hợp siêu phân tích Stefan G. Hofmann, Alice T. Sawyer, Ashley A. Witt và Diana ơi. J Tham khảo ý kiến ​​lâm sàng tâm lý. Tháng 4 năm 2010; 78 (2): 169 Từ183. doi: 10.1037 / a0018555

[2] Cohen J. Phân tích sức mạnh thống kê cho các ngành khoa học hành vi. Tái bản lần 2 Erlbaum; Hillsdale, NJ: 1988 (được trích dẫn trong [1])


4
+1. Re: nhỏ-vừa-lớn, như một lượt đi đầu tiên, nếu bạn không có kiến ​​thức hoặc bối cảnh liên quan nào, những 'kích cỡ áo phông' này đều ổn, nhưng trong thực tế, hiệu ứng nhỏ hay lớn sẽ thay đổi theo môn học hoặc chủ đề . Hơn nữa, chỉ vì một hiệu ứng 'lớn' không nhất thiết có nghĩa là nó thực sự quan trọng hoặc có ý nghĩa về mặt lý thuyết.
gung - Phục hồi Monica

1

Các áp phích khác đã đề cập đến vấn đề tương đồng và khác biệt giữa g và d. Chỉ cần thêm vào điều này, một số học giả cảm thấy rằng các giá trị kích thước hiệu ứng được cung cấp bởi Cohen là quá hào phóng dẫn đến việc diễn giải quá mức các hiệu ứng yếu. Chúng cũng không được gắn với r dẫn đến khả năng các học giả có thể chuyển đổi qua lại để có được kích thước hiệu ứng có thể giải thích thuận lợi hơn. Ferguson (2009, Tâm lý học chuyên nghiệp: Nghiên cứu và PRactice) đã đề xuất sử dụng các giá trị sau đây để giải thích cho g:

.41, là mức tối thiểu được đề xuất cho "ý nghĩa thực tiễn." 1,15, hiệu ứng vừa phải 2,70, hiệu ứng mạnh

Đây rõ ràng là nghiêm ngặt hơn / khó đạt được hơn và không có nhiều thí nghiệm khoa học xã hội sẽ đạt được hiệu quả mạnh mẽ ... đó có lẽ là cách nó phải như vậy.


0

Bruce Thompson đã cảnh báo về việc sử dụng Cohen's (0,2) nhỏ (0,5) là trung bình và (0,8) là lớn. Cohen không bao giờ có nghĩa là cho những điều này được sử dụng như những diễn giải cứng nhắc. Tất cả các kích thước hiệu ứng phải được giải thích dựa trên bối cảnh của các tài liệu liên quan. Nếu bạn đang phân tích các kích thước hiệu ứng liên quan được báo cáo về chủ đề của bạn và chúng là (0,1) (0,3) (0,24) và bạn tạo ra hiệu ứng của (0,4) thì đó có thể là "lớn". Ngược lại, nếu tất cả các tài liệu liên quan có tác dụng của (0,5) (0,6) (0,7) và bạn có tác dụng của (0,4) thì có thể coi là nhỏ. Tôi biết đây là một ví dụ tầm thường nhưng rất quan trọng. Tôi tin rằng Thompson đã từng nói trong một bài báo, "Chúng ta sẽ chỉ ngu ngốc trong một số liệu khác nhau" khi so sánh các diễn giải về kích thước hiệu ứng với cách các nhà khoa học xã hội đang diễn giải các giá trị p vào thời điểm đó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.