Phân phối phù hợp với dữ liệu không gian

Đăng chéo câu hỏi của tôi từ mathoverflow để tìm một số thống kê trợ giúp cụ thể.

Tôi đang nghiên cứu một quy trình vật lý tạo dữ liệu dự án độc đáo thành hai chiều với các giá trị không âm. Mỗi quá trình có một rãnh (dự kiến) các điểm - - xem hình ảnh bên dưới. $x$ $y$

Các bản nhạc mẫu có màu xanh lam, một loại bản nhạc rắc rối đã được vẽ bằng màu xanh lá cây và một vùng quan tâm được vẽ bằng màu đỏ: theo dõi và khu vực quan tâm

Mỗi ca khúc là kết quả của một thí nghiệm độc lập. Hai mươi triệu thí nghiệm đã được thực hiện trong nhiều năm, nhưng từ hai nghìn chỉ thể hiện tính năng mà chúng tôi vẽ như một bản nhạc. Chúng tôi chỉ quan tâm đến các thử nghiệm tạo ra một bản nhạc, vì vậy tập dữ liệu của chúng tôi là (khoảng) hai nghìn bản nhạc.

Có thể để một bản nhạc đi vào khu vực quan tâm và chúng tôi hy vọng theo thứ tự trong nhạc sẽ làm như vậy. Ước tính con số đó là câu hỏi trong tầm tay: $1$ $10^4$

Làm thế nào chúng ta có thể tính toán khả năng của một ca khúc tùy ý đi vào khu vực quan tâm?

Không thể tiến hành các thử nghiệm đủ nhanh để xem tần suất các bản nhạc được tạo ra đi vào khu vực quan tâm, vì vậy chúng tôi cần ngoại suy từ dữ liệu có sẵn.

Chúng tôi đã trang bị cho các giá trị ví dụ được đưa ra , nhưng điều này không đủ xử lý dữ liệu như xanh - dường như cần có một mô hình bao gồm cả hai chiều. $x$ $y\ge200$

Chúng tôi đã trang bị khoảng cách tối thiểu từ mỗi rãnh đến khu vực quan tâm, nhưng chúng tôi không tin rằng điều này sẽ tạo ra một kết quả chính đáng.

1) Có cách nào để phù hợp với phân phối cho loại dữ liệu này để ngoại suy không?

-hoặc là-

2) Có cách nào rõ ràng để sử dụng dữ liệu này để tạo mô hình để tạo các bản nhạc không? Ví dụ: sử dụng phân tích thành phần chính trên các rãnh như các điểm trong một không gian rộng, sau đó khớp phân phối (Pearson?) Cho các rãnh được chiếu lên các thành phần đó.

— Jeff Snider
nguồn

Tôi không được cung cấp thêm thông tin về quy trình cụ thể, nhưng tôi sẽ cập nhật câu hỏi để nói về cách thu thập dữ liệu.

— Jeff Snider

Tôi đã cập nhật ngôn ngữ để thử và cụ thể hơn. Hãy tưởng tượng chúng ta đang ném đá cuội vào một cửa sổ tầng trên cùng mở ra và chúng ta chỉ quan tâm làm thế nào những viên sỏi đi qua cửa sổ nảy trên sàn nhà bên trong. Chúng tôi đã ném hàng triệu viên sỏi, và khoảng 2000 đã đi qua cửa sổ. Khi một viên sỏi đi qua cửa sổ, chúng ta sẽ theo dõi tiến trình của nó trên sàn nhà. Đưa ra một viên sỏi đi qua cửa sổ, chúng tôi muốn ước tính khả năng nó đi qua khu vực quan tâm.

— Jeff Snider

Có vẻ như bạn muốn mô phỏng sự hình thành các bản nhạc và sau đó tiến hành mô phỏng Monte Carlo để xem có bao nhiêu bản nhạc rơi vào vùng màu đỏ. Để làm điều này, trước tiên tôi sẽ chuyển đổi các dòng thành hai chức năng, một hướng đưa ra và khoảng cách khác từ điểm này đến điểm tiếp theo trên bản nhạc đó. Bây giờ bạn có thể nghiên cứu các phân phối xác suất liên quan đến hai chức năng đó. Ví dụ: bạn có thể thấy rằng khoảng cách di chuyển theo một phân phối cụ thể (hãy cẩn thận rằng phân phối không thay đổi theo thời gian). Nếu một trong hai biến không thay đổi theo thời gian thì bạn phải đi sâu vào phân tích chuỗi thời gian (không phải lĩnh vực của tôi, xin lỗi).

Một ý nghĩ khác xuất hiện trong đầu là, vì hướng chuyển động trong xy thay đổi dần dần trong hầu hết các bản nhạc, bạn có thể kiểm tra tốt hơn sự thay đổi theo hướng so với thời gian cho các bản nhạc.

Bạn cũng sẽ cần ước tính xác suất của một bản nhạc bắt đầu tại một tọa độ xy nhất định với một hướng cho trước. Bạn có thể muốn xem xét sử dụng ước tính mật độ hạt nhân để làm mịn tệp PDF kết quả hoặc, nếu nó xuất hiện theo phân phối có mô hình phân tích thì có thể sử dụng tối đa hóa kỳ vọng để phù hợp với phân phối đó cho dữ liệu.

Mô phỏng Monte Carlo sau đó sẽ rút ra các mẫu ngẫu nhiên từ các bản phân phối này để mô phỏng hình dạng của các bản nhạc. Sau đó, bạn phải mô phỏng một số lượng lớn các bản nhạc và xem tần suất các bản nhạc đó đi qua vùng màu đỏ. Đây có thể là hàng ngàn hoặc hàng triệu bản nhạc, bạn sẽ phải thử nghiệm để xem khi phân phối ngừng thay đổi khi bạn thêm nhiều bản nhạc.

— chippies
nguồn