Làm thế nào tôi có thể so sánh các mô hình mà không phù hợp?


8

Hồi quy và học máy được sử dụng trong khoa học tự nhiên để kiểm tra các giả thuyết, ước tính các tham số và đưa ra dự đoán bằng cách khớp các mô hình với dữ liệu. Tuy nhiên, khi tôi có một mô hình tiên nghiệm , tôi không muốn thực hiện bất kỳ sự phù hợp nào --- ví dụ, một mô hình của một hệ thống vật lý xác định được tính toán từ các nguyên tắc đầu tiên. Tôi chỉ đơn giản muốn biết mô hình của mình khớp với dữ liệu tốt như thế nào và sau đó hiểu phần nào của mô hình đóng góp đáng kể cho trận đấu. Ai đó có thể chỉ cho tôi một cách nghiêm ngặt về mặt thống kê để làm điều này?

Nói một cách cụ thể hơn, giả sử tôi có một hệ thống vật lý mà tôi đã đo một biến phụ thuộc ( nằm trong khoảng từ 1 đến , cỡ mẫu) trong các điều kiện khác nhau được mô tả bởi ba biến độc lập , và . Mặc dù hệ thống thực sự tạo ra dữ liệu rất phức tạp, tôi đã thực hiện một số giả định đơn giản hóa để rút ra mô hình lý thuyết cho hệ thống, như vậyyiinx1,ix2,ix3,if

yi=f(x1,i,x2,i,x3,i)+ϵi ,

Trong đó là hàm phi tuyến tính (và không tuyến tính hóa) của các biến độc lập và là sự khác biệt giữa các giá trị được dự đoán theo mô hình và được đo. là hoàn toàn quy định trước; không có sự phù hợp nào được thực hiện và không có thông số nào được ước tính. Mục tiêu đầu tiên của tôi là xác định xem có phải là mô hình hợp lý cho quy trình tạo ra các giá trị đo được .fϵiffyi

Tôi cũng đã phát triển các mô hình đơn giản và , được lồng trong (nếu điều đó quan trọng trong trường hợp này). Mục tiêu thứ hai của tôi là xác định xem phù hợp với dữ liệu tốt hơn đáng kể so với hoặc , cho thấy các tính năng phân biệt mô hình với các mô hình và đóng vai trò quan trọng trong quá trình tạo ra .g(x1,i,x2,i)h(x1,i)ffghfghyi

Ý tưởng cho đến nay

Có lẽ nếu có một số cách để xác định số lượng tham số hoặc số bậc tự do cho mô hình toán học của tôi, thì có thể sử dụng các quy trình hiện tại như kiểm tra tỷ lệ khả năng hoặc so sánh AIC. Tuy nhiên, với dạng phi tuyến của và không có bất kỳ tham số rõ ràng nào, tôi không chắc liệu có hợp lý không khi gán tham số hoặc giả sử cái gì tạo thành một mức độ tự do.f

Tôi đã đọc rằng các biện pháp về mức độ phù hợp, chẳng hạn như hệ số xác định ( ), có thể được sử dụng để so sánh hiệu suất của mô hình. Tuy nhiên, đối với tôi không rõ ngưỡng cho sự khác biệt có ý nghĩa giữa các giá trị có thể là gì. Hơn nữa, vì tôi không khớp mô hình với dữ liệu, giá trị trung bình của phần dư không bằng 0 và có thể khác nhau đối với mỗi mô hình. Do đó, một mô hình phù hợp có xu hướng dự đoán thấp dữ liệu có thể mang lại giá trị kém như một mô hình không thiên vị nhưng khớp với dữ liệu kém.R2R2R2

Tôi cũng đã đọc một chút về các bài kiểm tra mức độ phù hợp (ví dụ: Anderson-Darling), nhưng vì số liệu thống kê không phải là lĩnh vực của tôi, tôi không chắc loại bài kiểm tra này phù hợp với mục đích của tôi như thế nào. Bất kỳ hướng dẫn sẽ được đánh giá cao.


Có bất kỳ giá trị tham số nào cho hàm phi tuyến f()cần được xác định từ mức phù hợp với dữ liệu hay là hàm f()hoàn toàn được chỉ định trước?
EdM

@EdM Cảm ơn vì điều đó! Chỉnh sửa câu hỏi để làm rõ đó flà hoàn toàn quy định trước. Nó giống như một hộp đen tạo ra phản hồi ytừ các biến đầu vào và tôi muốn biết nó hoạt động tốt như thế nào so với các hộp đen cạnh tranh. Một tình huống nguy hiểm có thể đang cố gắng đánh giá sự phù hợp giữa đầu ra của một mô phỏng số và các phép đo được thực hiện trong hệ thống vật lý thực.
jbacks

Câu trả lời:


4

Trong tình huống này, về cơ bản, bạn đang so sánh các bản phân phối của trong số 3 mô hình. Vì vậy, bạn cần kiểm tra các vấn đề như:ϵi

  1. Các giá trị trung bình của khác nhau giữa 3 mô hình không và có giá trị trung bình nào khác 0 không? (Đó là, có sự sai lệch trong bất kỳ mô hình nào không và 3 mô hình có khác nhau về độ lệch không?)ϵi
  2. Có bất kỳ mối quan hệ hệ thống nào của với các giá trị được dự đoán từ mô hình tương ứng hoặc với các giá trị của các biến độc lập ? Bạn nên xem xét cả ba biến độc lập ở đây ngay cả khi mô hình cụ thể chỉ sử dụng 1 hoặc 2 trong số chúng.ϵix1,i,x2,i,x3,1
  3. Có sự khác biệt đáng kể về phương sai của giữa 3 mô hình không?ϵi

Các chi tiết về cách tốt nhất để tiếp cận những câu hỏi này sẽ phụ thuộc vào bản chất của dữ liệu của bạn. Ví dụ: nếu các giá trị của nhất thiết là dương và có các lỗi đo lường điển hình tỷ lệ thuận với các giá trị của chúng (thường là trong trường hợp thực tế), thì có thể thực hiện phân tích này về sự khác biệt giữa chuyển đổi log và dự đoán chuyển đổi log từ mỗi mô hình của bạn.yiyi

Phân tích trực quan về các bản phân phối của trong số 3 mô hình, ví dụ với các ô mật độ, sẽ là bước đầu tiên quan trọng.ϵi

Tùy thuộc vào bản chất của dữ liệu, các thử nghiệm thống kê tham số tiêu chuẩn hoặc không tham số tiêu chuẩn về sự khác biệt về giá trị trung bình, được áp dụng cho cho 3 mô hình, sẽ giải quyết Vấn đề 1.ϵi

Vấn đề 2 về cơ bản là những gì được thực hiện để kiểm tra chất lượng của bất kỳ mô hình được trang bị nào; trong trường hợp của bạn, phân tích này có thể hiển thị các miền của các biến độc lập mà qua đó một hoặc nhiều mô hình được chỉ định trước của bạn không hoạt động tốt. Các sơ đồ của so với các giá trị dự đoán và các giá trị biến độc lập, với các đường cong hoàng thổ để làm nổi bật các xu hướng, cho mỗi mô hình của bạn sẽ hữu ích.ϵi

Nếu không có sai lệch trong bất kỳ mô hình nào và phân tích Vấn đề 2 cho thấy không có vấn đề gì, thì Vấn đề 3 còn lại là liệu có bất kỳ mô hình nào vượt trội về độ chính xác / phương sai hay không. Trong trường hợp lý tưởng với phân phối thông thường trong mỗi mô hình, các thử nghiệm F có thể kiểm tra sự bằng nhau của phương sai.ϵi


Suy nghĩ về phân phối còn lại là đối tượng so sánh là một sự thay đổi hữu ích trong quan điểm! a) Bạn có biết bất kỳ phân tích được công bố nào sử dụng một phương pháp tương tự không? Tôi cảm thấy như tình huống của tôi là bất thường. Bất kỳ tiền lệ được công bố sẽ hữu ích. b) Giá trị trung bình của mỗi phân phối dư là khác không và khác biệt rõ ràng đối với hai mô hình của tôi và tôi hy vọng ANOVA sẽ xác nhận điều này. Biết điều này, liệu có còn hợp lý để kiểm tra sự khác biệt giữa phương sai của mỗi phân phối dư (Vấn đề 3)? Các mẫu được phơi bày qua Vấn đề 2 có thể làm mất hiệu lực so sánh các phương sai không?
jbacks

1
@jbacks Tôi không biết về tiền lệ được xuất bản nhưng tôi không nghĩ cách tiếp cận này sẽ khó bán nếu có cơ sở lý thuyết vững chắc cho (các) mô hình của bạn. Trong phân tích dựa trên lý thuyết này, tập trung vào các lý do cho sai lệch hệ thống (lỗi trung bình khác không, Vấn đề I) giữa các dự đoán và quan sát. Điều đó dường như sẽ nhận được hầu hết trực tiếp ở giá trị tương đối của các mô hình. Vấn đề II (bất kỳ mẫu nào về cường độ / hướng lỗi liên quan đến các giá trị biến độc lập hoặc giá trị dự đoán) sẽ minh họa nơi các mô hình của bạn sẽ đi lạc hướng. So sánh các phương sai mô hình ít được quan tâm.
EdM

1
@jbacks cũng xem xét làm việc với các quan sát / dự đoán trong một quy mô được chuyển đổi, chẳng hạn như logarit. Một sai lệch về thuật ngữ lỗi trong thang đo không biến đổi có thể được giảm hoặc loại bỏ sau khi chuyển đổi. Lưu ý rằng việc sử dụng các lỗi phần trăm, được đề xuất trong câu trả lời khác, tương đương với việc xem xét sự khác biệt giữa các dự đoán và quan sát được chuyển đổi log. Bạn sẽ phải đánh giá liệu điều đó có phù hợp với tình huống này không.
EdM

Điều này có vẻ hợp lý, và tôi sẽ cho nó một shot. Cảm ơn bạn một lần nữa cho cái nhìn sâu sắc của bạn.
jbacks

1

Một so sánh xác suất của các mô hình, ví dụ như liên quan đến một số khả năng được tính toán từ với một số dữ liệu (và xuất phát từ thử nghiệm AIC hoặc tỷ lệ này), rất ít có ý nghĩa.ϵ

Đây là vì

  1. Bạn đã biết chắc chắn rằng mô hình sẽ sai.
  2. Phần dư mà bạn kết thúc không có liên quan đến phân phối lỗi được giả thuyết mà bạn sử dụng để kiểm tra các giả thuyết khác nhau. (bạn không có mô hình thống kê / xác suất)
  3. Mục tiêu của bạn không phải là kiểm tra một giả thuyết (khoa học cơ bản / thuần túy), mà là đặc trưng cho hiệu suất dự đoán của một mô hình đơn giản hóa (khoa học ứng dụng).

Hầu hết mọi người thường mô tả các mô hình theo tỷ lệ phần trăm lỗi cho các dự đoán.

Ví dụ:

Về cơ bản, bạn có thể google bất kỳ mô hình nào là đơn giản hóa thực tế và bạn sẽ tìm thấy những người mô tả sự khác biệt của họ với thực tế theo các hệ số tương quan, hoặc phần trăm biến thể.


Tôi muốn kiểm tra giả thuyết rằng "hiện tượng A" liên quan đến việc  x_3,i đóng góp đáng kể vào việc sản xuất  y. Mô hình  fkết hợp hiện tượng A trong khi  g và  hkhông, vì vậy nếu giả thuyết của tôi là đúng, tôi sẽ dự đoán mô hình đó hoạt động  ftốt hơn đáng kể so với  g hoặc  h.

Để so sánh như vậy, bạn có thể coi hiệu suất đo được như một mẫu, một mẫu được lấy ra từ một quần thể hiệu suất (giả thuyết) lớn hơn.

Vì vậy, bạn muốn mô tả các tham số về phân bố dân số của các lỗi  và so sánh các tham số đó. Điều này bạn có thể coi là xác suất. Chẳng hạn, bạn có thể gọi nó là 'lỗi trung bình của mô hình là  ' . Giả thuyết của bạn là về những tham số mô tả phân phối lỗi.ϵy ± xy±x

Tuy nhiên, quan điểm này có một chút vấn đề, vì thường "mẫu" được sử dụng để đo hiệu suất, không thực sự là một lựa chọn ngẫu nhiên (ví dụ: đó là các phép đo dọc theo một phạm vi được xác định trước hoặc trong một bộ vật phẩm thực tế được chọn). Sau đó, bất kỳ định lượng sai số nào trong ước tính hiệu suất chung không nên dựa trên một mô hình để lựa chọn ngẫu nhiên (ví dụ: sử dụng phương sai trong mẫu để mô tả lỗi te của ước tính). Vì vậy, vẫn còn ít ý nghĩa khi sử dụng một mô hình xác suất để mô tả các so sánh. Nó có thể là đủ để chỉ nêu dữ liệu mô tả và làm cho "ước tính" của bạn về khái quát hóa dựa trên các đối số logic.


Những ví dụ này rất hữu ích! Tôi hơi bối rối mặc dù bạn khẳng định rằng mục tiêu của tôi không liên quan đến kiểm tra giả thuyết. Khi tôi đóng khung nó, tôi muốn kiểm tra giả thuyết rằng "hiện tượng A" liên quan đến việc x_3,iđóng góp đáng kể cho việc sản xuất y. Mô hình fkết hợp hiện tượng A trong khi ghkhông, vì vậy nếu giả thuyết của tôi là đúng, tôi sẽ dự đoán mô hình đó hoạt động ftốt hơn đáng kể so với ghoặc h.
jbacks

2
@jbacks để so sánh như vậy, bạn có thể coi hiệu suất đo được như một mẫu được lấy ra từ một quần thể hiệu suất lớn. Vì vậy, bạn muốn mô tả các tham số về phân bố dân số của các lỗi và so sánh các tham số đó. Điều này bạn có thể coi là xác suất. Chẳng hạn, bạn có thể gọi nó là 'lỗi trung bình của mô hình là '. Giả thuyết của bạn là về những thông số đó. x ± yϵx±y
Sextus Empiricus

Cảm ơn bạn đã mở rộng về nhận xét đó với chỉnh sửa của bạn. Giữa quan điểm này và câu trả lời khác, tôi nghĩ rằng tôi có một cách hợp lý về phía trước. Nhiều đánh giá cao!
jbacks
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.