Làm thế nào để giải thích và báo cáo eta bình phương / một phần eta bình phương trong các phân tích có ý nghĩa thống kê và không có ý nghĩa?


39

Tôi có dữ liệu có giá trị bình phương eta và giá trị bình phương eta một phần được tính như một thước đo kích thước hiệu ứng cho sự khác biệt trung bình nhóm.

  • Sự khác biệt giữa bình phương eta và bình phương một phần là gì? Cả hai có thể được giải thích bằng cách sử dụng cùng một hướng dẫn của Cohen (1988 Tôi nghĩ: 0,01 = nhỏ, 0,06 = trung bình, 0,13 = lớn)?

  • Ngoài ra, có sử dụng trong kích thước hiệu ứng báo cáo nếu thử nghiệm so sánh (tức là thử nghiệm t hoặc ANOVA một chiều) là không đáng kể? Trong đầu tôi, điều này giống như nói rằng "sự khác biệt trung bình không đạt được ý nghĩa thống kê nhưng vẫn được lưu ý đặc biệt bởi vì kích thước hiệu ứng được chỉ ra từ bình phương eta là trung bình". Hoặc, kích thước hiệu ứng có phải là giá trị thay thế cho thử nghiệm quan trọng, thay vì bổ sung không?


Trong thực tế SPSS tính toán một phần eta vuông cho tất cả các ANOVA. Điều này sẽ cho cùng một giá trị như eta bình phương trong các Thiết kế nhóm độc lập IV, nhưng một giá trị khác trong các thiết kế đo lặp lại IV đơn. Điều này gây ra không có kết thúc vấn đề với các sinh viên của tôi.

Câu trả lời:


43

Kích thước hiệu ứng cho sự khác biệt trung bình nhóm

  • Nói chung, tôi thấy sự khác biệt có nghĩa là nhóm được tiêu chuẩn hóa (ví dụ, Cohen's d) một thước đo kích thước hiệu ứng có ý nghĩa hơn trong bối cảnh của sự khác biệt nhóm. Các biện pháp như bình phương eta bị ảnh hưởng bởi liệu kích thước mẫu của nhóm có bằng nhau hay không, trong khi Cohen thì không. Tôi cũng nghĩ rằng ý nghĩa của các biện pháp dựa trên d là trực quan hơn khi những gì bạn đang cố gắng định lượng là một sự khác biệt giữa các phương tiện nhóm.
  • Điểm trên đặc biệt mạnh đối với trường hợp bạn chỉ có hai nhóm (ví dụ: hiệu quả của điều trị so với kiểm soát). Nếu bạn có nhiều hơn hai nhóm, thì tình hình phức tạp hơn một chút. Tôi có thể thấy các đối số cho các biện pháp giải thích phương sai trong trường hợp này. Ngoài ra, Cohen'sf2 là một lựa chọn khác.
  • Một lựa chọn thứ ba là trong bối cảnh hiệu ứng thử nghiệm, ngay cả khi có nhiều hơn hai nhóm, khái niệm hiệu ứng được khái niệm hóa tốt nhất dưới dạng so sánh nhị phân (nghĩa là hiệu ứng của một điều kiện so với điều kiện khác). Trong trường hợp này, một lần nữa bạn có thể quay lại các biện pháp dựa trên d. Biện pháp dựa trên d không phải là thước đo kích thước hiệu ứng cho yếu tố, mà là của một nhóm so với nhóm tham chiếu. Điều quan trọng là xác định một nhóm tham khảo có ý nghĩa.
  • Cuối cùng, điều quan trọng là phải nhớ mục tiêu rộng hơn bao gồm các biện pháp kích thước hiệu ứng. Nó là để cung cấp cho người đọc một cảm giác về kích thước của hiệu ứng quan tâm. Bất kỳ biện pháp hiệu quả tiêu chuẩn hóa nào cũng sẽ hỗ trợ người đọc trong nhiệm vụ này. Nếu biến phụ thuộc nằm trên thang đo có ý nghĩa vốn có, thì đừng ngại diễn giải quy mô hiệu ứng theo thang đo đó. Ví dụ, quy mô như thời gian phản ứng, tiền lương, chiều cao, cân nặng, vv vốn có ý nghĩa. Nếu bạn thấy, như tôi làm, eta bình phương là một chút không trực quan trong bối cảnh hiệu ứng thử nghiệm, thì có lẽ chọn một chỉ mục khác.

Eta bình phương so với một phần eta bình phương

  • Bình phương eta một phần là thước đo kích thước hiệu ứng mặc định được báo cáo trong một số quy trình ANOVA trong SPSS. Tôi cho rằng đây là lý do tại sao tôi thường xuyên nhận được câu hỏi về nó.
  • Nếu bạn chỉ có một biến dự đoán, thì bình phương eta một phần tương đương với bình phương eta.
  • Bài viết này giải thích sự khác biệt giữa bình phương eta và bình phương một phần (Levine và Hullett Eta Squared, Partial Eta Squared .. ).
  • Tóm lại, nếu bạn có nhiều hơn một yếu tố dự đoán, bình phương eta một phần là phương sai được giải thích bởi một biến số nhất định của phương sai còn lại sau khi loại trừ phương sai được giải thích bởi các yếu tố dự đoán khác.

Quy tắc ngón tay cái cho bình phương eta và bình phương một phần

  • Nếu bạn chỉ có một yếu tố dự đoán thì bình phương eta và bình phương một phần là như nhau và do đó, các quy tắc tương tự sẽ được áp dụng.
  • Nếu bạn có nhiều hơn một yếu tố dự đoán, thì tôi nghĩ rằng các quy tắc chung về bình phương eta sẽ áp dụng nhiều hơn cho bình phương một phần so với bình phương eta. Điều này là do bình phương một phần trong ANOVA được cho là gần đúng hơn gần đúng với những gì bình phương eta có được cho yếu tố nếu đó là ANOVA một chiều; và nó có lẽ là một ANOVA một chiều làm phát sinh quy tắc ngón tay cái của Cohen. Nói chung, bao gồm các yếu tố khác trong thiết kế thử nghiệm thường sẽ giảm bình phương eta, nhưng không nhất thiết phải bình phương một phần do thực tế là yếu tố thứ hai, nếu nó có ảnh hưởng, làm tăng tính biến thiên của biến phụ thuộc.
  • Bất chấp những gì tôi nói về quy tắc ngón tay cái cho bình phương eta và bình phương một phần, tôi nhắc lại rằng tôi không phải là người hâm mộ phương sai giải thích các biện pháp kích thước hiệu ứng trong bối cảnh diễn giải kích thước và ý nghĩa của hiệu ứng thử nghiệm. Tương tự, quy tắc của ngón tay cái chỉ là, thô, phụ thuộc vào bối cảnh và không được thực hiện quá nghiêm trọng.

Báo cáo kích thước hiệu ứng trong bối cảnh kết quả quan trọng và không quan trọng

  • Trong một số ý nghĩa, mục đích nghiên cứu của bạn là ước tính các ước tính định lượng khác nhau về tác động của các biến quan tâm của bạn trong dân số.
  • Kích thước hiệu ứng là một định lượng của ước tính điểm của hiệu ứng này. Kích thước mẫu của bạn càng lớn thì càng gần, nói chung, ước tính điểm mẫu của bạn sẽ có hiệu ứng dân số thực sự.
  • Theo nghĩa rộng, kiểm tra ý nghĩa nhằm loại trừ cơ hội như một lời giải thích về kết quả của bạn. Do đó, giá trị p cho bạn biết xác suất quan sát kích thước hiệu ứng là cực đoan hơn hoặc giả sử giả thuyết null là đúng.
  • Cuối cùng, bạn muốn loại trừ không có hiệu lực và muốn nói điều gì đó về quy mô của hiệu ứng dân số thực sự. Khoảng tin cậy và khoảng tin cậy xung quanh kích thước hiệu ứng là hai cách tiếp cận trực tiếp đến vấn đề này. Tuy nhiên, báo cáo giá trị p và ước tính điểm về kích thước hiệu ứng là khá phổ biến và tốt hơn nhiều so với chỉ báo cáo giá trị p hoặc chỉ đo kích thước hiệu ứng.
  • Liên quan đến câu hỏi cụ thể của bạn, nếu bạn có kết quả không đáng kể, quyết định của bạn là liệu bạn có báo cáo các biện pháp kích thước hiệu quả hay không. Tôi nghĩ rằng nếu bạn có một bảng có nhiều kết quả thì có một cột kích thước hiệu ứng được sử dụng bất kể ý nghĩa có ý nghĩa gì. Ngay cả trong các bối cảnh không đáng kể kích thước hiệu ứng với các khoảng tin cậy có thể là thông tin trong việc chỉ ra liệu các phát hiện không quan trọng có thể là do kích thước mẫu không phù hợp hay không.

1
Xin chào Jeremy - Tôi khác với bạn khi bạn nói "bình phương một phần trong giai đoạn ANOVA được cho là gần đúng hơn với những gì eta bình phương sẽ có đối với nhân tố đó là ANOVA một chiều." Trong thực tế, eta bình phương nếu công cụ dự đoán được sử dụng một mình có khả năng lớn hơn nhiều so với bình phương một phần của nó trong công ty của các công cụ dự đoán khác. Trong trường hợp sau, phương sai được chia sẻ được giải thích trong kết quả không được ghi có cho người dự đoán trong câu hỏi; trước đây, không có "sự cạnh tranh" nào đối với phương sai được giải thích, do đó, người dự đoán sẽ nhận được tín dụng cho bất kỳ sự trùng lặp nào mà nó thể hiện với kết quả.
rolando2

3
@ rolando2 Có lẽ quan điểm của tôi là mơ hồ. Tôi đang đề cập đến các thí nghiệm được thiết kế. Giả sử thí nghiệm 1 thao túng yếu tố A và thử nghiệm 2 A và B. Giả sử thiết kế cân bằng, cả hai yếu tố này đều trực giao. Giả sử cả hai yếu tố giải thích phương sai, phương sai được giải thích bởi yếu tố A trong thí nghiệm 2 sẽ nhỏ hơn trong thí nghiệm 1, trong đó mức độ của yếu tố B được giữ không đổi. Do đó, khi so sánh các thí nghiệm giai thừa với các thí nghiệm một yếu tố, tôi nghĩ rằng bình phương eta một phần giống nhau hơn giữa các thí nghiệm giai thừa và một yếu tố, đặc biệt là nếu không có hiệu ứng tương tác.
Jeromy Anglim
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.