Tôi đang nghiên cứu sự xáo trộn do giao thông tàu đến một con chim biển nhỏ. Tôi quan sát động vật đầu mối trong một khoảng thời gian xác định và ghi lại xem chúng có bay từ mặt nước hay không trong quá trình quan sát. Loài chim đặc biệt này không bay với xác suất cao khi không bị quấy rầy (khoảng 10% thời gian). Sau khi học, tôi đã nối thêm khoảng cách với con tàu gần nhất cho mọi quan sát (tàu quan tâm có bộ định vị GPS ghi lại một điểm cứ sau 5 giây).
Tôi đã vẽ đồ thị hàm phân phối tích lũy cho TẤT CẢ các quan sát và cho các quan sát nơi con chim bay từ mặt nước như một hàm của khoảng cách đến con tàu gần nhất. Đúng như dự đoán, phần lớn các quan sát trong đó con chim bay được quan sát khi con tàu gần.
Tôi có thể sử dụng thử nghiệm Kolmogorov-Smirnov để kiểm tra xem có sự khác biệt thống kê nào trong việc phân phối các quan sát chuyến bay và tổng quan sát không? Tôi nghĩ là nếu hai bản phân phối này khác nhau thì nó sẽ gợi ý rằng khoảng cách tàu có ảnh hưởng đến chuyến bay. Tôi lo lắng vì các chức năng phân phối này không độc lập vì các quan sát chuyến bay là một tập hợp con của tổng số các quan sát.
Suy nghĩ?
Đã đọc thêm một chút trên trang web này, tôi nghĩ rằng tôi có thể kiểm tra sự phân phối của các quan sát trong đó chuyến bay xảy ra (F) chống lại sự phân phối của các quan sát mà nó không (NF) vì chúng là độc lập. Nếu các phân phối này là cùng F = NF, thì chúng ta có thể giả sử rằng phân phối của (F) và (TOT = tất cả các quan sát) giống như chúng ta biết rằng phân phối của (F) bằng với chính nó và (F) + (T) = (TOT). Đúng?
CẬP NHẬT: 2/12/14
Theo các gợi ý từ @Scortchi, tôi đã điều tra mối quan hệ của tỷ lệ chuyến bay so với khoảng cách đến con tàu gần nhất trong khuôn khổ hồi quy logistic. Có mối quan hệ nhỏ hiện tại (độ dốc âm) nhưng giá trị p là không đáng kể cho thấy độ dốc thực sự có thể bằng không. Dựa trên các số liệu thống kê mô tả (bao gồm các lô ecdf) tôi nghi ngờ rằng tác động của những con tàu gần bị nhấn chìm bởi nhiều quan sát khi con tàu không ảnh hưởng đến hành vi. Sau đó, tôi đã sử dụng gói R được phân đoạn ( http://cran.r-project.org/web/packages/segmented/segmented.pdf) để thử và tìm một điểm dừng trong mô hình. Chương trình đã phát hiện ra rằng việc phá vỡ dữ liệu ở cách tàu 2,6 km và lắp hai hệ số riêng biệt là tốt hơn so với mô hình hệ số đơn. Hệ số độ dốc của phương pháp tiếp cận tàu gần là âm và cho thấy tàu ảnh hưởng đến phản ứng bay cho đến khoảng 2,6 km (giá trị p <0,001). Hệ số cho độ dốc thứ hai hơi dương nhưng giá trị p không đáng kể ở mức 0,05 alpha (p-value = 0,11). Vì vậy, tóm lại, đường hồi quy được phân đoạn có thể phát hiện chênh lệch ngưỡng mà tại đó xác suất chuyến bay tăng. Ước tính xác suất của chuyến bay khi con tàu xa hơn 2,6 km là 0,11. Một cách phù hợp, tôi quan sát 79 con chim khi không có tàu ngay cả trong khoang nghiên cứu (>
Cảm ơn tất cả những lời đề nghị. Tôi hy vọng câu hỏi này cùng với các gợi ý và câu trả lời giúp người khác.