điều chỉnh giá trị p cho thống kê I của Moran (LISA)


10

Tôi đang làm việc với một số phân tích không gian khám phá trong R bằng cách sử dụng gói spdep.

Tôi đã bắt gặp một tùy chọn để điều chỉnh giá trị p của các chỉ số cục bộ của hiệp hội không gian (LISA) được tính bằng cách sử dụng localmoranhàm. Theo các tài liệu, nó nhằm mục đích:

... điều chỉnh giá trị xác suất cho nhiều thử nghiệm.

Hơn nữa trong các tài liệu của p.adjustSPtôi đọc rằng các tùy chọn có sẵn là:

Các phương pháp điều chỉnh bao gồm hiệu chỉnh Bonferroni ('"bonferroni") trong đó các giá trị p được nhân với số lượng so sánh. Bốn sửa chữa ít bảo thủ hơn cũng được bao gồm bởi Holm (1979) ('"holm"'), Hochberg (1988) ('"hochberg"'), Hommel (1988) ('"hommel"') và Stewamini & Hochberg (1995) ('"fdr"'), tương ứng. Tùy chọn chuyển qua ('"none"') cũng được bao gồm.

Bốn phương pháp đầu tiên được thiết kế để kiểm soát mạnh mẽ tỷ lệ lỗi thông minh của gia đình. Dường như không có lý do gì để sử dụng hiệu chỉnh Bonferroni chưa sửa đổi bởi vì nó bị chi phối bởi phương pháp của Holm, cũng có giá trị theo các giả định tùy ý.

Phương pháp của Hochberg và Hommel là hợp lệ khi các thử nghiệm giả thuyết là độc lập hoặc khi chúng không liên quan tiêu cực (Sarkar, 1998; Sarkar và Chang, 1997). Phương pháp của Hommel mạnh hơn so với Hồ Chí Minh, nhưng sự khác biệt thường nhỏ và giá trị p của Hồ Chí Minh nhanh hơn để tính toán.

Phương pháp "BH" (còn gọi là "fdr") và "BY" của Stewamini, Hochberg và Yekutieli kiểm soát tỷ lệ phát hiện sai, tỷ lệ dự kiến ​​của những khám phá sai trong số các giả thuyết bị từ chối. Tỷ lệ phát hiện sai là một điều kiện ít nghiêm ngặt hơn so với tỷ lệ lỗi thông minh của gia đình, vì vậy các phương pháp này mạnh hơn các phương pháp khác.

Vài câu hỏi xuất hiện:

  1. Nói một cách dễ hiểu - mục đích của sự điều chỉnh này là gì?
  2. Có cần thiết phải sử dụng chỉnh sửa như vậy?
  3. Nếu có - làm thế nào để chọn từ các tùy chọn có sẵn?

1
Tôi đã di chuyển câu hỏi này vì nhiều người rất thích nó đã được giải quyết ở đây trên CV. Xem những gì bạn có thể học được từ một tìm kiếm , ví dụ.
whuber

@whuber Ý kiến ​​hay. Tôi đã không nghĩ về CV, nhưng đó thực sự là một ngôi nhà tốt hơn cho nó. Cảm ơn.
radek

Câu trả lời:


1

một cách ngắn gọn, vấn đề mà bạn đang phải đối mặt được gọi là thử nghiệm nhiều giả thuyết . Nó phát sinh khi bạn đang thử nghiệm, như tên cho thấy, nhiều giả thuyết cùng một lúc.

Giả sử bạn có xác suất nhất định từ chối không chính xác giả thuyết khống (dương tính giả) cho một bài kiểm tra, giả sử 5%. Khi bạn tăng số lượng bộ dữ liệu mà bạn đang kiểm tra (trong trường hợp này, mỗi bộ bạn áp dụng thống kê Moran cục bộ), xác suất quan sát trong bất kỳ tập dữ liệu nào là dương tính giả sẽ tăng, độc lập với thực tế là xác suất quan sát một dương tính giả cho một tập dữ liệu duy nhất là như nhau.

Có rất nhiều "sửa chữa" có thể, đó là những cái mà bạn tìm thấy, để khắc phục vấn đề này; nếu bạn thực sự cần một thống kê địa phương, bạn không thể né tránh nó. Mặt khác, bạn có thể sử dụng thống kê toàn cầu như một giả thuyết duy nhất.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.