Không biết loại dữ liệu nào được đánh giá, rất khó để đưa ra lời khuyên tốt ở đây. Và thực sự, đó là tất cả những gì bạn có thể nhận được. Không có thứ gọi là thước đo hiệu ứng tốt nhất cho các câu hỏi như thế này ... có lẽ đã từng.
Các kích thước hiệu ứng được đề cập trong câu hỏi là tất cả các kích thước hiệu ứng được tiêu chuẩn hóa. Nhưng nó hoàn toàn có thể là phương tiện hoặc trung bình của các biện pháp ban đầu là tốt. Ví dụ: nếu bạn đang đo thời gian để quá trình sản xuất hoàn thành thì sự khác biệt về thời gian sẽ là kích thước hiệu ứng hoàn toàn hợp lý. Mọi thay đổi trong quy trình, các phép đo trong tương lai, các phép đo trên các hệ thống và các phép đo giữa các nhà máy đều sẽ được xử lý kịp thời. Có thể bạn muốn trung bình hoặc có thể bạn muốn trung bình, hoặc thậm chí chế độ, nhưng điều đầu tiên bạn cần làm là nhìn vào thang đo thực tế và xem kích thước hiệu ứng có hợp lý để diễn giải và kết nối mạnh mẽ với thước đo hay không.
Để hỗ trợ suy nghĩ về điều đó, các hiệu ứng nên được tiêu chuẩn hóa là những thứ được đo lường gián tiếp hơn và theo nhiều cách. Ví dụ, thang đo tâm lý có thể thay đổi theo thời gian và theo nhiều cách và cố gắng để có được một biến số cơ bản không được đánh giá trực tiếp. Trong những trường hợp bạn muốn kích thước hiệu ứng tiêu chuẩn.
Với kích thước hiệu ứng được tiêu chuẩn hóa, vấn đề quan trọng không chỉ là sử dụng mà còn ý nghĩa của chúng. Khi bạn ngụ ý trong câu hỏi của mình, bạn cũng không biết ý nghĩa của chúng và đó là điều quan trọng. Nếu bạn không biết hiệu ứng được tiêu chuẩn hóa là gì thì bạn không thể báo cáo chính xác, giải thích chính xác hoặc sử dụng chính xác. Hơn nữa, nếu có nhiều cách bạn muốn thảo luận về dữ liệu thì hoàn toàn không có gì ngăn bạn báo cáo nhiều hơn một kích thước hiệu ứng. Bạn có thể thảo luận về dữ liệu của mình về mối quan hệ tuyến tính, như với tương quan thời điểm sản phẩm hoặc về mối quan hệ giữa các cấp bậc với Spearmanr
và sự khác biệt giữa những người hoặc chỉ cung cấp tất cả các thông tin trong bảng. Không có gì sai với điều đó cả. Nhưng hơn bất cứ điều gì bạn sẽ phải quyết định những gì bạn muốn kết quả của bạn có ý nghĩa. Đó là điều không thể trả lời từ thông tin được cung cấp và có thể yêu cầu nhiều thông tin và kiến thức cụ thể về miền hơn là hợp lý cho một câu hỏi trong loại diễn đàn này.
Và luôn suy nghĩ phân tích tổng hợp về cách bạn báo cáo hiệu ứng. Mọi người trong tương lai có thể nhận kết quả mà tôi đang báo cáo và tích hợp chúng với những người khác không? Có lẽ có một tiêu chuẩn trong lĩnh vực của bạn cho những điều này. Có lẽ bạn đã chọn một bài kiểm tra không tham số chủ yếu vì bạn không tin vào kết luận mà người khác đã đưa ra về các phân phối cơ bản và bạn muốn thận trọng hơn trong các giả định của mình trong một lĩnh vực chủ yếu sử dụng các bài kiểm tra tham số. Trong trường hợp đó, không có gì sai khi cung cấp thêm kích thước hiệu ứng thường được sử dụng với các thử nghiệm tham số. Những vấn đề này và nhiều vấn đề khác cần được xem xét khi suy nghĩ về cách bạn đặt phát hiện của mình trong một tài liệu lớn hơn về nghiên cứu tương tự. Thông thường thống kê mô tả tốt giải quyết những vấn đề này.
Vì vậy, đó là lời khuyên chính. Tôi có một vài ý kiến bổ sung. Nếu bạn muốn kích thước hiệu ứng của bạn liên quan mật thiết đến thử nghiệm bạn đã làm thì Z
đề xuất dựa trên rõ ràng là tốt nhất. Kích thước hiệu ứng tiêu chuẩn của bạn sẽ có nghĩa tương tự như thử nghiệm. Nhưng ngay khi bạn không làm điều đó thì không có gì sai khi sử dụng hầu hết mọi thứ khác, ngay cả những thứ như Cohen d
có liên quan đến các xét nghiệm tham số. Không có giả định về tính quy tắc để tính phương tiện, độ lệch chuẩn hoặcd
điểm số. Trong thực tế, có những giả định yếu hơn so với hệ số tương quan được khuyến nghị. Và luôn luôn báo cáo các biện pháp mô tả tốt. Một lần nữa, các biện pháp mô tả không có giả định bạn sẽ vi phạm nhưng hãy ghi nhớ ý nghĩa thực chất của chúng. Bạn báo cáo số liệu thống kê mô tả nói lên điều gì đó về dữ liệu của bạn mà bạn muốn nói và phương tiện và trung bình nói những điều khác nhau.
Nếu bạn muốn thảo luận về các biện pháp lặp đi lặp lại so với kích thước hiệu ứng thiết kế độc lập thì đó thực sự là một câu hỏi hoàn toàn mới.