Hình dạng của khoảng tin cậy và dự đoán cho hồi quy phi tuyến


13

Các dải tin cậy và dự đoán xung quanh hồi quy phi tuyến tính có phải là đối xứng xung quanh đường hồi quy không? Có nghĩa là chúng không có hình dạng đồng hồ cát như trong trường hợp các dải cho hồi quy tuyến tính. Tại sao vậy?

Đây là mô hình trong câu hỏi:
Đây là hình:

F(x)= =(Một-D1+(xC)B)+D

http://i57.tinypic.com/2q099ok.jpg

và đây là phương trình:

nhập mô tả hình ảnh ở đây


Câu hỏi của bạn không rõ ràng, bởi vì bạn chuyển từ hỏi họ có "được cho là đối xứng" trong câu 1 không, để ngụ ý rằng họ không ở câu 2 và hỏi (có lẽ là) tại sao họ không ở câu 3. Bạn có thể làm Điều này phù hợp hơn / rõ ràng?
gung - Phục hồi Monica

OK, cho tôi hỏi theo cách này - tại sao các dải tin cậy và dự đoán đối xứng xung quanh đường hồi quy khi hồi quy là phi tuyến tính nhưng lại có hình dạng đồng hồ cát khi nó là tuyến tính?
Serge

00

Bạn đúng rồi. Các ban nhạc không băng qua lãnh thổ tiêu cực. Tuy nhiên, tôi không quan tâm đến các giá trị của chính các băng tần, mà là các giá trị EC50 tương ứng với các giới hạn băng tần. Có cách nào khác để xây dựng các ban nhạc theo cách này không?
Serge

Có, nhưng khi tôi hăm dọa họ có thể trở nên phức tạp. Các phương pháp bình phương tối thiểu và chuỗi thời gian tổng quát có thể đối phó với mối tương quan nối tiếp. Các phép biến đổi phi tuyến của biến phụ thuộc là một công cụ để xử lý lỗi không phụ gia. Một công cụ tinh vi hơn là một mô hình tuyến tính tổng quát. Các lựa chọn phụ thuộc một phần vào bản chất của biến phụ thuộc. BTW, mặc dù tôi không chắc ý của bạn về "giá trị EC50" (có vẻ như bạn đang mô hình hóa các mối quan hệ đáp ứng liều), mọi thứ được tính toán từ các dải được minh họa sẽ bị nghi ngờ.
whuber

Câu trả lời:


8

Các dải tin cậy và dự đoán nên được dự kiến ​​sẽ rộng hơn ở gần cuối - và vì lý do tương tự mà chúng luôn làm như vậy trong hồi quy thông thường; nói chung, độ không đảm bảo của tham số dẫn đến các khoảng rộng hơn gần cuối hơn ở giữa

Bạn có thể thấy điều này bằng cách mô phỏng đủ dễ dàng, bằng cách mô phỏng dữ liệu từ một mô hình nhất định hoặc bằng cách mô phỏng từ phân phối lấy mẫu của vectơ tham số.

Các tính toán thông thường (gần đúng) được thực hiện cho hồi quy phi tuyến liên quan đến việc lấy xấp xỉ tuyến tính cục bộ (điều này được đưa ra trong câu trả lời của Harvey), nhưng ngay cả khi không có những điều chúng ta có thể hiểu được về những gì đang diễn ra.

Tuy nhiên, thực hiện các tính toán thực tế là không cần thiết và có thể các chương trình có thể sử dụng một phím tắt trong tính toán mà bỏ qua hiệu ứng đó. Cũng có thể đối với một số dữ liệu và một số mô hình, hiệu ứng tương đối nhỏ và khó thấy. Thật vậy, với các khoảng dự đoán, đặc biệt là với phương sai lớn nhưng nhiều dữ liệu đôi khi khó có thể nhìn thấy đường cong trong hồi quy tuyến tính thông thường - chúng có thể trông gần như thẳng và tương đối dễ dàng để nhận ra độ lệch khỏi độ thẳng.

Đây là một ví dụ về mức độ khó có thể nhìn thấy chỉ với khoảng tin cậy cho giá trị trung bình (khoảng dự đoán có thể khó nhìn hơn nhiều vì biến thể tương đối của chúng ít hơn rất nhiều). Đây là một số dữ liệu và bình phương nhỏ nhất phù hợp với bình phương, với khoảng tin cậy cho trung bình dân số (trong trường hợp này được tạo từ phân phối lấy mẫu vì tôi biết mô hình thực sự, nhưng có thể thực hiện điều gì đó tương tự bằng cách xấp xỉ tiệm cận hoặc bằng cách khởi động)

nhập mô tả hình ảnh ở đây

Các giới hạn màu tím trông gần như song song với các dự đoán màu xanh ... nhưng chúng không. Đây là lỗi tiêu chuẩn của phân phối mẫu của các dự đoán trung bình đó:

nhập mô tả hình ảnh ở đây

mà rõ ràng là không đổi.


Biên tập:

Những biểu thức "sp" mà bạn vừa đăng xuất phát trực tiếp từ khoảng dự đoán cho tuyến tính hồi quy !


Có phải bạn cũng nói rằng sự gia tăng độ không đảm bảo của tham số khi một người di chuyển ra khỏi trung tâm sẽ làm cho dải mở rộng ở hai đầu ngay cả trong trường hợp hồi quy phi tuyến, nhưng điều đó không rõ ràng? Hoặc có một lý do lý thuyết tại sao việc mở rộng này không xảy ra trong trường hợp hồi quy phi tuyến? Các ban nhạc của tôi chắc chắn trông rất đối xứng.
Serge

1
Việc mở rộng đó sẽ xảy ra là điển hình, nhưng nó sẽ không xảy ra theo cùng một cách với mọi mô hình phi tuyến và sẽ không rõ ràng với mọi mô hình, và bởi vì nó không dễ thực hiện theo một chương trình nhất định . Tôi không biết các ban nhạc bạn đang xem đã được tính toán như thế nào - Tôi không phải là người đọc ý nghĩ và tôi không thể thấy mã của chương trình mà bạn chưa từng đề cập đến tên của nó.
Glen_b -Reinstate Monica

@ user1505202, đây vẫn là một câu hỏi khó trả lời đầy đủ. Bạn có thể nói mô hình của bạn là gì (dạng chức năng của nó) không? Bạn có thể đính kèm một hình ảnh của con số gây bối rối cho bạn?
gung - Phục hồi Monica

1
Cảm ơn. Tôi có các số và về cơ bản chúng là không đổi - sự khác biệt giữa đường hồi quy và mỗi giới hạn dự đoán nằm trong khoảng từ 18.21074 ở giữa đến 18.24877 ở cuối. Vì vậy, một sự mở rộng nhẹ, nhưng rất nhẹ. Nhân tiện, @gung, tôi có phương trình tính khoảng dự đoán. Đó là:Y-hat +/- sp(Y-hat)
Serge

1
Đó là về loại biến thể bạn có thể thấy với khoảng dự đoán với các mẫu lớn. Sp là gì?
Glen_b -Reinstate Monica

5

Toán học về độ tin cậy và các dải dự đoán của các đường cong phù hợp với hồi quy phi tuyến được giải thích trong trang Xác thực chéo này. Nó cho thấy rằng các dải không phải luôn luôn / thường là đối xứng.

Và đây là một lời giải thích với nhiều từ hơn và ít toán hơn:

Trước tiên, hãy xác định G | x, là độ dốc của các tham số tại một giá trị cụ thể của X và sử dụng tất cả các giá trị phù hợp nhất của các tham số. Kết quả là một vectơ, với một phần tử cho mỗi tham số. Đối với mỗi tham số, nó được định nghĩa là dY / dP, trong đó Y là giá trị Y của đường cong cho giá trị cụ thể của X và tất cả các giá trị tham số phù hợp nhất và P là một trong các tham số.)

G '| x là vectơ gradient được hoán vị, vì vậy nó là một cột chứ không phải là một hàng các giá trị. Cov là ma trận hiệp phương sai (đảo ngược Hessian từ lần lặp cuối cùng). Nó là một ma trận vuông với số lượng hàng và cột bằng số lượng tham số. Mỗi mục trong ma trận là hiệp phương sai giữa hai tham số. Chúng tôi sử dụng Cov để chỉ ma trận hiệp phương sai chuẩn hóa , trong đó mỗi giá trị nằm trong khoảng -1 đến 1.

Bây giờ tính toán

c = G '| x * Cov * G | x.

Kết quả là một số duy nhất cho bất kỳ giá trị nào của X.

Các dải tin cậy và dự đoán được tập trung vào đường cong phù hợp nhất và mở rộng trên và dưới đường cong một lượng bằng nhau.

Các dải tin cậy mở rộng trên và dưới đường cong bằng cách:

= sqrt (c) * sqrt (SS / DF) * CriticalT (Độ tin cậy%, DF)

Các dải dự đoán mở rộng một khoảng cách xa hơn trên và dưới đường cong, bằng:

= sqrt (c + 1) * sqrt (SS / DF) * CriticalT (Độ tin cậy%, DF)

Trong cả hai phương trình này, giá trị của c (được xác định ở trên) phụ thuộc vào giá trị của X, do đó các dải tin cậy và dự đoán không phải là một khoảng cách không đổi từ đường cong. Giá trị của SS là tổng bình phương cho sự phù hợp và DF là số bậc tự do (số điểm dữ liệu trừ số tham số). CriticalT là một hằng số từ phân phối t dựa trên mức độ tin cậy mà bạn muốn (theo truyền thống là 95%) và số bậc tự do. Đối với giới hạn 95% và df khá lớn, giá trị này gần bằng 1,96. Nếu DF nhỏ, giá trị này cao hơn.


Cảm ơn, Harvey. Tôi đang làm việc để có được độ dốc của các tham số cho chức năng của tôi. Bạn có bất kỳ cơ hội nào biết về một ví dụ đã làm việc không, vì tôi không rõ về cách thức ma trận hiệp phương sai thu được.
Serge

Nếu bạn sử dụng bản demo GraphPad Prism, bạn có thể điều chỉnh dữ liệu cho bất kỳ mô hình nào bạn muốn và xem ma trận hiệp phương sai (một kết quả tùy chọn được chọn trong tab Chẩn đoán) và các dải tin cậy hoặc dự đoán (cả hai số và biểu đồ; cũng chọn trong Tab chẩn đoán). Đó không phải là một ví dụ tốt, nhưng ít nhất bạn có thể so sánh ma trận hiệp phương sai và xem vấn đề là trước hay sau ...
Harvey Motulsky 7/214

Hai điều, mặc dù. 1. Lăng kính đã cho tôi ma trận Cov. Tuy nhiên, nó chỉ là một số cho toàn bộ dữ liệu. Tôi không được phép nhận một giá trị trên mỗi giá trị X? 2. Tôi nhận được dải dự đoán trong biểu đồ nhưng tôi muốn đầu ra chứa các giá trị. Lăng kính không xuất hiện để làm điều đó. Tôi rất mới với Prism và vì vậy tôi có thể không nhìn khắp nơi, nhưng tôi đã thử!
Serge

1. Ma trận hiệp phương sai cho thấy mức độ mà các tham số được đan xen. Vì vậy, có một giá trị cho mỗi cặp tham số mà bạn yêu cầu hồi quy phi tuyến tính phù hợp. 2. Nhìn vào tab Phạm vi để yêu cầu Prism tạo một bảng tọa độ XY của đường cong, với các giá trị cộng / trừ cho các dải tin cậy hoặc dự đoán. 3. Để được hỗ trợ kỹ thuật với Prism, hãy gửi email tới support@graphpad.com Sử dụng diễn đàn này cho các câu hỏi thống kê, không phải hỗ trợ kỹ thuật.
Harvey Motulsky
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.