Tỷ lệ, tỷ lệ và tỷ lệ phần trăm dữ liệu rất phổ biến trong hệ sinh thái (ví dụ:% hoa thụ phấn, tỷ lệ giới tính nam: nữ,% tỷ lệ tử vong khi điều trị,% lá ăn bởi động vật ăn cỏ). Một bài báo đã được xuất bản gần đây bởi một số nhà thống kê ứng dụng trong tạp chí Sinh thái học có tiêu đề " The arcsine is asinine: phân tích tỷ lệ trong sinh thái học ." Họ lưu ý rằng việc chuyển đổi arcsine đã được thúc đẩy bởi các văn bản chạy dài như "Phân tích thống kê sinh học" của Zar và "Sinh trắc học" của Sokal và Rohlf (cả trong phiên bản thứ 3 hoặc thứ 4 của họ.) Nhưng kỹ thuật này đã bị lỗi thời bởi các mô hình tuyến tính tổng quát và tính toán tốt hơn :
Chuyển đổi căn bậc hai arcsine từ lâu đã là quy trình chuẩn khi phân tích dữ liệu tỷ lệ trong sinh thái học, với các ứng dụng trong các bộ dữ liệu chứa các biến phản ứng nhị thức và không nhị thức. Ở đây, chúng tôi lập luận rằng biến đổi arcsine không nên được sử dụng trong cả hai trường hợp. Đối với dữ liệu nhị thức, hồi quy logistic có khả năng diễn giải lớn hơn và sức mạnh cao hơn so với phân tích dữ liệu được chuyển đổi. [...] Đối với dữ liệu không nhị thức, biến đổi arcsine là không mong muốn trên cơ sở khả năng giải thích và bởi vì nó có thể tạo ra các dự đoán vô nghĩa. Việc chuyển đổi logit được đề xuất như một cách tiếp cận khác để giải quyết các vấn đề này.
Tôi đã tự hỏi làm thế nào dữ liệu tỷ lệ phổ biến trong các lĩnh vực khác (tâm lý? Y học?)? Là arcsine vẫn thường được sử dụng trong các lĩnh vực khác hoặc là các nhà sinh thái học đặc biệt trong việc sử dụng này (hoặc khác) đã lỗi thời hoặc ít hơn các kỹ thuật tối ưu? Đã có giấy tờ trong các lĩnh vực khác làm nổi bật nhu cầu sử dụng các kỹ thuật tiên tiến hơn?