Phân tích thống kê đại bàng biến mất


8

Tóm tắt số phận thẻ theo mô hình thẻ

Những con đại bàng được gắn thẻ vệ tinh đang bị mất tích ở Scotland và bảng trên cho thấy số phận thẻ theo mô hình thẻ. Tôi đặc biệt quan tâm đến những thẻ "Dừng lại - không trục trặc", bởi vì rất có thể những con chim này cũng đang bị giết và xác và thẻ đang bị vứt bỏ.

Tôi đã thấy nó nói rằng bảng này và bảng này là bằng chứng cho thấy "Ngay cả với phân tích thống kê xa xôi, rõ ràng có mối quan hệ giữa" Dừng lại - Không có trục trặc "và loại thẻ được sử dụng" Vì vậy, câu hỏi của tôi là, có thể tuyên bố được sao lưu?

42/135  (31%) tags stopped for all types 
 8/17   (47%) tags stopped for 80NS     
29/77   (38%) tags stopped for 70GPS    
 3/22   (14%) tags stopped for 105GPS   
 2/13   (15%) tags stopped for 70GSM    
 0/6     (0%) tags stopped for 95BTOGSM 

Vì vậy, tôi đoán rằng tuyên bố này là đúng nếu tỷ lệ thất bại 80NS là 47% tồi tệ hơn đáng kể so với mức trung bình toàn cầu là 31%. Và điều đó sẽ không đúng nếu xác suất nhận được 8 lần thất bại trong một mẫu ngẫu nhiên gồm 17 thẻ trong số 135 thực sự là khá cao. Tóm tắt hơn, nếu có 42 quả bóng đen và 93 quả bóng trắng trong một cái túi và tôi chọn ra 17 quả ngẫu nhiên, xác suất tôi chọn 8 quả đen và 9 quả trắng là bao nhiêu?

Tôi có thể xác định 8 người đầu tiên có màu đen là (42/135) * (41/134), v.v. nhưng tôi bị mắc kẹt khi cố gắng tìm ra khả năng 8 trong số 17 người có màu đen


EDIT: Các thẻ vệ tinh được gắn vào chim trong khoảng thời gian 13 năm, 2004 đến 2016. Bảng này hiển thị 131 thẻ thay vì 135. 4 thẻ đã bị loại trừ vì chúng không thể xác định được vị trí triển khai chính xác của bốn thẻ đầu.

Loại thẻ theo năm thẻ

Đây là một bảng khác từ báo cáo hiển thị một số dữ liệu về tuổi thọ của các thẻ 70GPS / 70GSM:

Đã dừng không có sự cố thẻ thời gian hoạt động


2
Colin, câu hỏi của bạn thiếu một biến chính: thời gian kể từ khi thẻ được áp dụng. Cũng có thể các biến khác có thể bị nhầm lẫn với mô hình thẻ: ví dụ: có thể các mô hình khác nhau được sử dụng trên các loài khác nhau hoặc các loài chim có kích thước khác nhau hoặc một số già hơn và trẻ hơn. Do đó, giả sử rằng đây là một vấn đề thực sự đáng quan tâm, hãy xem xét đưa dữ liệu đó vào phân tích của bạn.
whuber

2
@Antoine Tôi có thể thấy lý do tại sao bạn nghĩ đó là bài tập về nhà, nhưng tôi sợ bây giờ tôi quá già để làm bài tập về nhà. Đây là một vấn đề trong thế giới thực mà tôi quan tâm. Một phần vì tôi quan tâm đến số liệu thống kê và lạm dụng số liệu thống kê, và một phần vì tôi không thích sự khủng bố của kẻ hiếp dâm. Đây là bài đăng đầu tiên của tôi trong khu vực thống kê trao đổi ngăn xếp vì vậy nếu nó không phù hợp, tôi xin lỗi
Colin

5
Hoàn toàn không phù hợp! Chúng tôi chỉ nhận được rất nhiều người dán bài tập về nhà của họ và dường như mong đợi chúng tôi trả lời nó cho họ, vì vậy có một số nhạy cảm xung quanh đó. Nhưng như một câu hỏi THỰC SỰ, đây chắc chắn là về chủ đề.
Jbowman

2
Nếu bạn không phiền, hãy để lại bảng thời gian. Nó thêm những thách thức thú vị cho câu hỏi. Bạn có biết những năm thẻ bị mất? Lý tưởng nhất, chúng ta có thể kết nối tệp đính kèm, số phận và loại tương ứng cho mỗi thẻ.
gung - Phục hồi Monica

1
Đối với câu hỏi của bạn: "Tuyên bố có thể được sao lưu?" Tôi sẽ trả lời có, nó có thể. Tuy nhiên, mối quan hệ không phải là nguyên nhân, có những yếu tố gây nhiễu rõ ràng như tuổi của các thiết bị không thể kiểm soát được. Đối với bất kỳ tuyên bố nào "rõ ràng để thấy mối quan hệ nhân quả như vậy và như vậy", người ta không cần phải trả lời với một suy luận nguyên nhân thích hợp cho thấy kết luận ngược lại. Người ta chỉ cần tìm một biến gây nhiễu đe dọa việc xác định mối quan hệ nhân quả này. Bây giờ, nếu mục tiêu của bạn là tiến hành suy luận nhân quả thích hợp, đó là một câu chuyện khác.
dv_bn

Câu trả lời:


0

Tôi đã tìm thấy một cách để có được câu trả lời của mình từ nhận xét này " tra cứu phân phối siêu bội " trên math.stackexchange:

Từ mục nhập của Wikipedia về phân phối siêu bội

Trong lý thuyết xác suất và thống kê, phân phối siêu bội là phân phối xác suất rời rạc mô tả xác suất k thành công (các lần rút ngẫu nhiên mà đối tượng được vẽ có một tính năng xác định) trong n vẽ, không thay thế.

Sau đó, sử dụng Máy tính siêu âm trực tuyến và các số liệu sau:

Dân số: 135

Số lượng thành công trong dân số: 42

Cỡ mẫu: 17

Số lượng thành công trong mẫu: 8

Tôi thấy rằng xác suất nhận được chính xác 8 là 0,0703 và xác suất nhận được 8 trở lên là 0,1095

Tôi nghĩ rằng con số "8 trở lên" là con số có liên quan trong trường hợp này và tôi phải nói rằng xác suất này thấp hơn so với dự đoán của tôi.

Vì vậy, các con số cho thấy có xác suất 89% rằng có tỷ lệ thất bại khác nhau khi được phân tách theo loại thẻ. Điều đó không có nghĩa là nguyên nhân của sự khác biệt loại thẻ.


1
Điều này không kiểm soát tuổi của các thẻ, tạo ra một số nghi ngờ liên quan đến ý nghĩa hoặc tính hữu ích của xác suất.
whuber

@whuber chúng tôi có một "nhà khoa học" tuyên bố rằng "một số thẻ nhất định có tỷ lệ hao hụt cao hơn nhiều (80NS ở mức 47%) [...] nếu chúng tôi sử dụng thẻ thì có nghĩa là có thể có thẻ và khai thác dễ bị lỗi hơn so với phần còn lại "vì vậy điều đầu tiên tôi muốn biết là xác suất nhận được tỷ lệ thất bại 47% là bao nhiêu nếu chúng tôi cho rằng tất cả các thẻ có cùng tỷ lệ thất bại.
Colin

@whuber Trên thực tế, đối số có lẽ là tranh luận vì nếu bạn đọc báo cáo ban đầu, 80NS phần lớn bị bỏ qua trong cuộc thảo luận về độ tin cậy của thẻ và trường hợp cho rằng kết quả "không dừng hoạt động" phần lớn là do sự khủng bố chủ yếu dựa trên bằng chứng từ các thẻ 70GPS / GSM. Mô hình 80NS chỉ được triển khai trong những năm đầu tiên, được tuyên bố là kém tin cậy hơn và được sử dụng một thiết kế khai thác có nhiều khả năng bị bỏ sớm.
Colin
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.