Làm thế nào để đánh giá mức độ phù hợp của một mô hình phi tuyến cụ thể? [đóng cửa]


10

Tôi có một mô hình phi tuyến , trong đó là cdf của phân phối chuẩn thông thường và f là phi tuyến (xem bên dưới). Tôi muốn kiểm tra mức độ phù hợp của mô hình này với tham số với dữ liệu của tôi , sau khi đã sử dụng ước tính khả năng tối đa để tìm . Điều gì sẽ là một bài kiểm tra thích hợp? Tôi muốn sử dụng thử nghiệm này để gắn nhãn phù hợp xấu là xấu và xác định xem có nên thu thập thêm dữ liệu hay không.y=Φ(f(x,a))+εΦa(x1,y1),(x2,y2),,(xn,yn)a

Tôi đã xem xét việc sử dụng độ lệch, so sánh mô hình này với mô hình bão hòa, với thử nghiệm mức độ phù hợp tương ứng của nó bằng cách sử dụng phân phối . Điều này sẽ thích hợp? Hầu hết những gì tôi đã đọc về sự lệch lạc áp dụng nó cho GLM, đó không phải là những gì tôi có. Nếu thử nghiệm sai lệch là phù hợp, những giả định nào cần phải giữ để làm cho thử nghiệm hợp lệ?χn12

Cập nhật: cho trong trường hợp điều này có ích.f=x1ax2+1x>1,a>0


1
Câu trả lời phụ thuộc vào mục đích phân tích và mô hình xác suất cơ bản mà bạn đã sử dụng; không có câu trả lời toán học duy nhất hoặc tốt nhất. Ví dụ: chúng tôi sẽ đo mức độ phù hợp khác nhau cho một mô hình có dạng so với một trong các dạng (với lỗi iid ). y=Φ(f(x,a)+ε)y=Φ(f(x,a))+εε
whuber

Cảm ơn. Tôi đã làm rõ câu hỏi của mình. Tôi biết rằng không có câu trả lời tốt nhất, tuy nhiên, tôi vẫn muốn biết liệu độ lệch có phù hợp để kiểm tra mức độ phù hợp ở đây hay không, và nếu không, một thử nghiệm khác phù hợp để đánh dấu sự phù hợp là gì rất kém và nói rằng cần thu thập thêm dữ liệu (giả sử mô hình là chính xác) hoặc nói rằng mô hình không mô tả dữ liệu.
spadequack

1
Là biến mục tiêu của bạn hay là liên tục? Nếu trước đây, bạn có thể đóng khung mô hình là thay vì có thuật ngữ lỗi phụ gia và so sánh dự đoán với thực tế và để nhận tỷ lệ dương đúng và sai, hoặc so sánh với mô hình cơ sở trong đó hoặc sai lệch hoặc một số lựa chọn thay thế khác. Nếu sau này, phân phối mà bạn giả định cho phần dư là gì? y0,1p(y=1)=Φ(f(x,a))y=0y=1p(y=1)=y¯
jbowman

1
Bỏ phiếu để đóng vì yêu cầu làm rõ đã không được trả lời.
whuber

Câu trả lời:


1

Sử dụng gói "npcmstest" trong thư viện "NP" nếu bạn đang sử dụng nền tảng R. Cảnh báo: Chức năng có thể mất vài phút để đánh giá mô hình của bạn.

Bạn cũng có thể xem xét so sánh lý thuyết thông tin về phân phối đáp ứng và phân phối dự báo (nghĩa là phân kỳ KL, entropy chéo, v.v.)


Dường như phương pháp đòi hỏi một mô hình từ một trong hai lmhoặc glm. Làm thế nào điều này sẽ làm việc cho một mô hình phi tuyến? (Có, tôi đang sử dụng R.) Tôi đã thêm vào câu hỏi của mình trong trường hợp có ích. f
spadequack

@are bạn đang sử dụng gamhay tương tự ( mgcvgói)? Nếu không, bạn nên kiểm tra nó.
suncoolsu

1

Đây là cách tôi sẽ làm điều đó, về cơ bản là một thử nghiệm tỷ lệ khả năng. Nhưng hãy nhớ rằng họ "chìa khóa" để hiểu được sự tốt của kiểm tra sự phù hợp, là để hiểu về các lựa chọn thay thế mà bạn đang kiểm tra. Bây giờ chúng tôi có khả năng cho từng điểm dữ liệu riêng lẻ như:

p(yi|xi,a,I)=g(ϵi)=g(yifi)

Trong đó là khả năng của thuật ngữ lỗi trong mô hình của bạn và là dự đoán mô hình cho điểm dữ liệu thứ i, được đưa ra và . Bây giờ với mỗi điểm dữ liệu chúng ta có thể chọn một sao cho - "mô hình bão hòa" như bạn gọi nó. Vì vậy, thử nghiệm của bạn là phù hợp ở đây, nếu bạn chỉ muốn thử nghiệm các lựa chọn thay thế trong lớp của những người có cùng khả năng lỗi, và bạn có sự độc lập của từng khả năng (nghĩa là biết khác sẽ không giúp ích gì trong việc dự đoáng(ϵ)fi=xi1axi2+1xia(xi,yi)afi=yiχ2g(ϵ)xj,yjyi, cho ). a


1
Điều này sẽ không hiệu quả, vì mức độ tự do của phép thử tỷ lệ khả năng tăng lên khi cho mô hình bão hòa. O(n)
StasK

0

Trong bối cảnh hồi quy tuyến tính, tính tốt của kiểm tra sự phù hợp thường được tiến hành chống lại một sự thay thế phức tạp hơn. Bạn có một hồi quy tuyến tính - đưa vào một số thuật ngữ đa thức để kiểm tra xem dạng tuyến tính có đủ không. Vì bạn đã có một dạng hàm phi tuyến, nên sự thay thế phức tạp mà bạn cần xem xét sẽ phải là dạng hồi quy không tham số . Tôi sẽ không cố gắng đưa ra một giới thiệu về chủ đề này, vì nó đòi hỏi một tư duy của riêng nó, và nó đáng để giới thiệu riêng biệt. Đối với thử nghiệm hồi quy tham số so với không hồi quy, Wooldridge (1992) hoặc Hardle và Mammen (1993) , họ làm những việc rất giống nhau. Hardle cũng đã viết một cuốn sách tuyệt vời về chủ đề này.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.