Các phương pháp tốt nhất để điều chỉnh 'chế độ' dữ liệu được lấy mẫu từ phân phối liên tục là gì?
Vì chế độ không được xác định về mặt kỹ thuật (phải không?) Cho phân phối liên tục, tôi thực sự hỏi 'làm thế nào để bạn tìm thấy giá trị phổ biến nhất'?
Nếu bạn giả sử phân phối chính là gaussian, bạn có thể bin dữ liệu và thấy rằng chế độ là vị trí bin có số đếm lớn nhất. Tuy nhiên, làm thế nào để bạn xác định kích thước thùng? Có triển khai mạnh mẽ có sẵn? (tức là mạnh mẽ để vượt trội hơn). Tôi sử dụng python
/ scipy
/ numpy
, nhưng tôi có thể dịch R
mà không gặp quá nhiều khó khăn.