Phân phối Beta phù hợp trong Scipy


14

Theo Wikipedia các phân bố xác suất beta có hai tham số hình dạng: αβ .

Khi tôi gọi scipy.stats.beta.fit(x)bằng Python, trong đó xcó một loạt các số trong phạm vi , 4 giá trị được trả về. Điều này đánh tôi là kỳ quặc.[0,1]

Sau khi googling tôi thấy một trong các giá trị trả về phải là 'location', vì biến thứ ba là 0 nếu tôi gọi scipy.stats.beta.fit(x, floc=0).

Có ai biết biến thứ tư là gì không, và nếu hai biến đầu tiên là β ?αβ


1
Các tài liệu gọi là hai "vị trí" và "quy mô" thông số cuối cùng. Do đó, thứ tư là tham số tỷ lệ. Vị trí và quy mô có ý nghĩa thống kê tiêu chuẩn. Một cách giải thích trong bối cảnh này được đưa ra rõ ràng trong cẩm nang NIST .
whuber

Tôi đang gặp vấn đề chính xác như vậy, nhưng vì một số lý do, tất cả các mô hình beta của tôi có xu hướng "giữ nước". Ví dụ cho stats.beta.fit([60,61,62,72])tôi nhận được (0.7313395126217731, 0.7153715263378897, 58.999999999999993, 3.3500998441036982). Bất cứ ý tưởng những gì tôi có thể làm về điều này?
TheChymera

Chỉ cần thêm tài liệu này cho phương thức phù hợp với biến ngẫu nhiên liên tục chung, bao gồm một số ví dụ sử dụng beta.fit (): docs.scipy.org/doc/scipy/reference/generated/iêu
mathisfun

Câu trả lời:


13

Mặc dù thiếu tài liệu rõ ràng về đầu ra của beta.fitnó, nhưng nó lại xuất theo thứ tự sau:

, β , loc (giới hạn dưới), quy mô (trên giới hạn - giới hạn dưới)αβ


Có phải nó chỉ đưa ra các giới hạn dưới và trên dựa trên phạm vi của dữ liệu, hoặc làm một cái gì đó khác?
Shadowtalker

Các giới hạn được dựa trên phân phối xác suất. I E. Phân phối bình thường không có giới hạn, nhưng dữ liệu mẫu hiếm khi vượt quá ~ +/-3. Phân phối Beta có giới hạn cứng, với xác suất 0 nằm ngoài các giới hạn đó. Có khả năng dữ liệu của bạn sẽ không đạt đến giới hạn, tùy thuộc vào những gì bạn đang lập mô hình. Trong thực tế, việc cố gắng buộc các giới hạn đó phù hợp với phạm vi của dữ liệu có thể có vấn đề, vì nhiều bản phân phối beta có xu hướng không có xác suất ở các giới hạn. Xem bài đăng này để biết thêm về vấn đề đó.
jdj081

1
Vâng, tôi biết. Các giới hạn đó luôn là 0 và 1. Do đó: các giới hạn trên và dưới được trả về bởi hàm này là gì và chúng hoàn toàn giống như "vị trí" và "tỷ lệ" như thế nào? Tôi đoán tôi không hiểu câu trả lời này.
Shadowtalker

2
Cách phân phối beta được xác định, các giới hạn đó luôn là 0 và 1. Nhưng phân phối beta tổng quát bao gồm hai yếu tố tỷ lệ này. Dữ liệu tôi mô hình không nằm trong khoảng từ 0 đến 1, vì vậy tôi phải sử dụng các số đó. Nếu dữ liệu của bạn nằm trong khoảng từ 0 đến 1, thì các đầu ra đó phải rất gần với 0 và 1. Nếu bạn biết giới hạn của mình là 0 và 1, bạn có thể buộc các giá trị đó bằng floc=0fscale=1kwargs. Bạn vẫn sẽ nhận được những đầu ra đó, nhưng chúng sẽ giống hệt với những gì bạn buộc chúng phải có. Và nó có thể sẽ thay đổi giá trị alpha và beta của bạn.
jdj081
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.