Có phải các nhà sinh thái học là những người duy nhất không biết rằng arcsine là asinine?


8

Tỷ lệ, tỷ lệ và tỷ lệ phần trăm dữ liệu rất phổ biến trong hệ sinh thái (ví dụ:% hoa thụ phấn, tỷ lệ giới tính nam: nữ,% tỷ lệ tử vong khi điều trị,% lá ăn bởi động vật ăn cỏ). Một bài báo đã được xuất bản gần đây bởi một số nhà thống kê ứng dụng trong tạp chí Sinh thái học có tiêu đề " The arcsine is asinine: phân tích tỷ lệ trong sinh thái học ." Họ lưu ý rằng việc chuyển đổi arcsine đã được thúc đẩy bởi các văn bản chạy dài như "Phân tích thống kê sinh học" của Zar và "Sinh trắc học" của Sokal và Rohlf (cả trong phiên bản thứ 3 hoặc thứ 4 của họ.) Nhưng kỹ thuật này đã bị lỗi thời bởi các mô hình tuyến tính tổng quát và tính toán tốt hơn :

Chuyển đổi căn bậc hai arcsine từ lâu đã là quy trình chuẩn khi phân tích dữ liệu tỷ lệ trong sinh thái học, với các ứng dụng trong các bộ dữ liệu chứa các biến phản ứng nhị thức và không nhị thức. Ở đây, chúng tôi lập luận rằng biến đổi arcsine không nên được sử dụng trong cả hai trường hợp. Đối với dữ liệu nhị thức, hồi quy logistic có khả năng diễn giải lớn hơn và sức mạnh cao hơn so với phân tích dữ liệu được chuyển đổi. [...] Đối với dữ liệu không nhị thức, biến đổi arcsine là không mong muốn trên cơ sở khả năng giải thích và bởi vì nó có thể tạo ra các dự đoán vô nghĩa. Việc chuyển đổi logit được đề xuất như một cách tiếp cận khác để giải quyết các vấn đề này.

Tôi đã tự hỏi làm thế nào dữ liệu tỷ lệ phổ biến trong các lĩnh vực khác (tâm lý? Y học?)? Là arcsine vẫn thường được sử dụng trong các lĩnh vực khác hoặc là các nhà sinh thái học đặc biệt trong việc sử dụng này (hoặc khác) đã lỗi thời hoặc ít hơn các kỹ thuật tối ưu? Đã có giấy tờ trong các lĩnh vực khác làm nổi bật nhu cầu sử dụng các kỹ thuật tiên tiến hơn?

Câu trả lời:


7

Tôi dạy nó cho sinh viên y tế công cộng vì hai lý do:

  • một trong những đồng nghiệp của tôi dạy nó (trong khóa học giới thiệu) như một công thức ma thuật, tôi chỉ cho họ phương pháp Delta và cách nó bắt nguồn;

  • Tôi nghĩ rằng phương pháp Delta và các phép biến đổi ổn định phương sai không phải là asinine và có thể hữu ích. Khoảng tin cậy được tính toán bằng cách sử dụng biến đổi arcsin với hiệu chỉnh tính liên tục là không hoàn hảo nhưng hoạt động tốt, và đối với các mẫu nhỏ, nó tốt hơn nhiều so với quy trình Wald, vẫn được sử dụng rộng rãi.

Là John về tâm lý học và khoa học thần kinh, tôi nghĩ nhiều người trong ngành dịch tễ học thậm chí không quan tâm, họ chỉ sử dụng mô hình tuyến tính theo cách nhấn nút.

Pires, Amado, 2008. Ước tính khoảng cho tỷ lệ nhị thức.


1
Bạn có biết làm thế nào mà chống lại Agresti-Coull CI không? (. Agresti, A. và Coull, BA (1998) xấp xỉ là tốt hơn so với “chính xác” cho ước lượng khoảng thời gian tỷ lệ nhị thức. The American Statistician , 52 (2):. 119-126)
Alexis

5

Tôi có thể nói từ kinh nghiệm rằng tâm lý học và khoa học thần kinh thường không nỗ lực biến đổi% giá trị để bình thường hóa chúng. Phân tích phương thức là một ANOVA hoặc kiểm tra t của% đúng hoặc% lỗi.


5

Câu hỏi về mức độ phổ biến của việc sử dụng biến đổi arcsine trong sinh thái học và các lĩnh vực khác có thể được đánh giá bằng cách đến JStor, chọn một vài tạp chí và tìm kiếm từ này trong 2 thập kỷ qua.

Thảo luận về chủ đề này có thể được làm rõ bằng cách lưu ý một (trong số nhiều lý do) không sử dụng arcsin. Tỷ lệ dựa trên số lượng các trường hợp. Bạn có cho trọng lượng tương đương với tỷ lệ 2 trong 4 trường hợp (không đáng tin cậy lắm) và tỷ lệ đáng tin cậy hơn là 20 trên 40 trường hợp? Giải pháp tự nhiên là sử dụng tỷ lệ cược và tỷ lệ cược và phân phối nhị thức để kiểm tra sự thay đổi tỷ lệ như thay đổi tỷ lệ cược, như được mô tả trong ấn phẩm arcsin asinine. Bằng cách đó, bạn cho 50% của 40 do, so với 50% của 4.


2
+1 Chào mừng đến với trang web của chúng tôi! Nếu bạn đã tình cờ thực hiện tìm kiếm từ bạn đề xuất, bạn đã quan sát thấy kết quả gì?
whuber

Công bằng mà nói, nó thường chỉ ra rằng nó chỉ thích hợp cho (ít nhất là xấp xỉ) các thử nghiệm nos bằng nhau trừ khi bạn cũng cân đối với kích thước mẫu đối ứng. Và lưu ý rằng các mô hình hỗn hợp tuyến tính tổng quát thường không được đề cập trong các khóa học thống kê đại học, ngay cả đối với các mức độ Toán / Thống kê; vì vậy có thể hiểu được tại sao việc chuyển đổi arcsine lại mất nhiều thời gian để chết.
Scortchi - Phục hồi Monica

2
Phương sai tiệm cận được trình bày rõ ràng trong bài viết được liên kết bởi OP, do đó, hồi quy có trọng số là đơn giản trong trường hợp mẫu số được biết đến. (Nếu mẫu số không xác định, hồi quy logistic cũng có vấn đề.)
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.