Tôi có hai bộ dữ liệu đại diện cho các tham số sao: một tham số được quan sát và một tham số được mô hình hóa. Với các bộ này, tôi tạo ra cái được gọi là sơ đồ hai màu (TCD). Một mẫu có thể được nhìn thấy ở đây:
A là dữ liệu được quan sát và B dữ liệu được trích xuất từ mô hình (không bao giờ quan tâm đến các đường màu đen, các chấm thể hiện dữ liệu) Tôi chỉ có một sơ đồ A , nhưng có thể tạo ra nhiều sơ đồ B khác nhau như tôi muốn, và điều tôi cần là để giữ một trong đó phù hợp nhất một .
Vì vậy, những gì tôi cần là một cách đáng tin cậy để kiểm tra mức độ phù hợp của sơ đồ B (mô hình) với sơ đồ A (quan sát).
Ngay bây giờ những gì tôi làm là tôi tạo một biểu đồ hoặc lưới 2D (đó là cái mà tôi gọi nó, có thể nó có một tên thích hợp hơn) cho mỗi sơ đồ bằng cách ghép cả hai trục (mỗi thùng 100 cái) Sau đó tôi đi qua từng ô của lưới và tôi tìm thấy sự khác biệt tuyệt đối về số lượng giữa A và B cho ô cụ thể đó. Sau khi trải qua tất cả các ô, tôi tổng hợp các giá trị cho mỗi tế bào và vì vậy tôi kết thúc với một tham số dương duy nhất đại diện cho sự tốt lành của sự phù hợp ( ) giữa A và B . Càng gần 0, càng phù hợp. Về cơ bản, đây là những gì tham số đó trông giống như:
; nơi là số của các ngôi sao trong sơ đồ Một cho rằng tế bào cụ thể (xác định bởi ) và là số cho B . i j b i j
Đây là những gì khác nhau về số lượng trong mỗi ô trông giống như trong lưới tôi tạo (lưu ý rằng tôi không sử dụng các giá trị tuyệt đối của ( a i j - b i j ) trong hình ảnh này nhưng tôi làm sử dụng chúng khi tính tham số):
Vấn đề là tôi đã được thông báo rằng đây có thể không phải là một công cụ ước tính tốt, chủ yếu là vì ngoài việc nói điều này phù hợp hơn so với điều này vì tham số thấp hơn , tôi thực sự không thể nói gì hơn.
Quan trọng :
(cảm ơn @PeterEllis đã đưa ra điều này)
1- Điểm trong B không liên quan một-một với điểm trong Một . Đó là một điều quan trọng cần lưu ý khi tìm kiếm phù hợp nhất: số lượng điểm trong Một và B là không nhất thiết phải giống nhau và sự tốt lành của sự phù hợp kiểm tra cũng nên giải thích cho sự khác biệt này và cố gắng giảm thiểu nó.
2- Số lượng điểm trong mỗi B tập hợp dữ liệu (mô hình đầu ra) Tôi cố gắng để phù hợp với A là không cố định.
Tôi đã thấy thử nghiệm Chi-Squared được sử dụng trong một số trường hợp:
Ngoài ra, tôi đã đọc một số người khuyên nên áp dụng thử nghiệm Poisson nhật ký trong các trường hợp như thế này khi có biểu đồ. Nếu điều này đúng, tôi thực sự đánh giá cao nếu ai đó có thể hướng dẫn tôi cách sử dụng bài kiểm tra đó cho trường hợp cụ thể này (hãy nhớ rằng kiến thức về thống kê của tôi khá kém, vì vậy hãy giữ nó đơn giản như bạn có thể :)