Loại hồi quy nào để sử dụng, xem xét một biến có giới hạn trên?


9

Tôi không chắc chắn nên sử dụng phương pháp nào để mô hình hóa mối quan hệ giữa hai biến ( và ) trong thử nghiệm được mô tả như sau:xy

  • Có 3 biến: , và .xaimxy
  • Giá trị của được đặt khi vận hành thử nghiệm. Tuy nhiên, và không phải lúc nào cũng bằng nhau.xaimxxaim
  • Hệ số tương quan của Pearson giữa và là khoảng 0,9.xaimx
  • Hệ số tương quan của Pearson giữa và ít hơn nhiều: khoảng 0,5.xy
  • y có giá trị tối đa có thể ( ) không thể vượt quá.ymax
  • Mỗi điểm dữ liệu thu được sau khi đặt và đọc và .xaimxy

Mặc dù hệ số tương quan của Pearson giữa và không lớn, nhưng có vẻ như có xu hướng tăng theo .xyyx

Sau khi thực hiện các hồi quy tuyến tính đơn giản của và (và chuyển đổi trở lại sau thành , để được hiển thị trên cùng một biểu đồ như chẳng hạn), cả hai độ dốc là dương, nhưng độ dốc của lớn hơn độ dốc của .y=f(x)x=g(y)g1fg1f

Liệu có ý nghĩa gì khi nói hoặc ? ( sẽ đạt được trước đó trong trường hợp thứ hai.)xmax=f1(ymax)xmax=g(ymax)xmax

Xem xét rằng bị ràng buộc bởi , có thể nói gì về giá trị tối đa có thể có của có thể đạt được?yymaxx

Theo tôi hiểu, sẽ có ý nghĩa khi thực hiện hồi quy tuyến tính có dạng khi là biến độc lập và là biến phụ thuộc. Tuy nhiên, trong bối cảnh này, tôi không chắc liệu có ý nghĩa khi xem xét là độc lập và là phụ thuộc.y=f(x)xyxy

Tổng hồi quy vuông nhỏ nhất sẽ thích hợp hơn? Có phương pháp nào khác để xác định giá trị nào của có thể đạt được (và với khả năng nào) không?xmax

(Nếu điều này có vấn đề, và dường như không tuân theo phân phối bình thường, vì đã có nhiều nỗ lực hơn để cố gắng đạt được giá trị cao hơn của .)xyx


Bạn sẽ làm gì với mối quan hệ này, nếu bạn tìm thấy nó? Bạn sẽ kiểm tra các giả thuyết, hoặc chỉ quan tâm nó trông như thế nào? Nếu có nhiều điểm dữ liệu, bạn nên xem xét các mô hình phi tuyến tính.
mpiktas

@mpiktas, cuối cùng, tôi muốn biết x_max nào là mục tiêu hợp lý mà tôi có thể cố gắng đạt được một cách thường xuyên (không chỉ một lần), xem xét việc tiếp cận hoặc vượt lên trên y_max làm cho thử nghiệm bị vô hiệu hóa (ngụ ý hiệu quả x = x_min cho nỗ lực đó).
Bruno

Hồi quy tổng bình phương tối thiểu (hoặc sai số trong biến) được biểu thị khi phương sai của trở nên khá lớn so với . Tương quan 90% với cho thấy phương sai của có thể đủ nhỏ để bạn có thể coi nó là một biến độc lập một cách an toàn. Đây là điều bạn có thể kiểm tra hồi quy sau bằng cách so sánh RMSE của phần dư của so với với RMSE của phần dư của so với . Liệu có phải là vấn đề hay không; nếu bạn thấy một điểm cắt trên trong biểu đồ phân tán có , thì đó là một sự cân nhắc quan trọng.xyxaimxxaimxyxaimymaxxaim
whuber

Câu trả lời:


4

Tôi muốn điểm thứ hai @ King. Sẽ rất trực quan khi nghi ngờ rằng hồi quy lên ('hồi quy trực tiếp') và hồi quy lên ('hồi quy ngược') phải giống nhau. Tuy nhiên , điều này không đúng về mặt toán học cũng như liên quan đến cách hồi quy có liên quan đến tình huống bạn đang phân tích. Nếu bạn vẽ trên trục tung của đồ thị và trên trục hoành, bạn có thể thấy những gì đang xảy ra. Hồi quy trực tiếp tìm đường thu nhỏ khoảng cách dọc giữa các điểm dữ liệu và đường thẳng, trong khi hồi quy ngược giảm thiểu khoảng cách ngang. Dòng thu nhỏ cái này sẽ chỉ giảm thiểu cái kia nếuyxxyyxrxy=1.0 . Bạn cần phải quyết định những gì bạn muốn giải thích, và những gì bạn muốn sử dụng để giải thích nó. Câu trả lời cho câu hỏi đó cung cấp cho bạn biến nào là và và chỉ định mô hình của bạn. Ngoài ra, (một lần nữa sau @King), tôi không đồng ý với việc cố gắng nói , vì những lý do tương tự. yxxmax=f1(ymax)

Liên quan đến vấn đề của một biến bị ràng buộc, thông thường, có thể hình dung rằng số tiền 'thực' có thể tăng cao hơn, nhưng bạn không thể đo lường được. Ví dụ, một nhiệt kế bên ngoài cửa sổ của tôi lên tới 120, nhưng nó có thể là 140 ở bên ngoài ở một số nơi và bạn sẽ chỉ có 120 như số đo của mình. Do đó, biến sẽ có giới hạn trên, nhưng điều bạn thực sự muốn nghĩ về không. Nếu đây là trường hợp, mô hình quỹ đạo tồn tại cho chỉ những tình huống như vậy.

Một cách tiếp cận khác là sử dụng thứ gì đó mạnh mẽ hơn như hoàng thổ, có thể hoàn toàn phù hợp với nhu cầu của bạn.


Xin lỗi vì sự chậm trễ, tôi đã không nhận thấy câu trả lời của bạn. Tôi sẽ cần đọc về mô hình Tobit.
Bruno

Không vấn đề gì. Để biết thêm về bản chất của hồi quy (so với hồi quy ngược) xem tại đây . Đối với một số trợ giúp với việc áp dụng hồi quy quỹ đạo bằng các phần mềm khác nhau, hãy thử tại đây .
gung - Phục hồi Monica

3

Đầu tiên, tôi không nghĩ rằng nên nói ở đây, điều đó giống như ngụ ý rằng đó là một hàm một mặc dù được giải thích bởi các biến không quan sát khác.xmax=f1(ymax)xmax

Thứ hai, nó thực sự phụ thuộc vào bối cảnh mà người ta coi là một biến độc lập hoặc phụ thuộc. Từ kinh nghiệm của tôi, trừ khi lý thuyết mạnh mẽ gợi ý một cách; một trong hai cách là ok Từ nhận xét của bạn vào ngày 7 tháng 10, có vẻ như là người phụ thuộc trong khi là người độc lập.xy

Nếu có thể, hãy nhìn vào phần dư và xem liệu bạn có thể vắt bất cứ thứ gì ra khỏi nó không. Có thể có một biến khác mà bạn quên mất; hoặc nó có thể giúp biến đổi các biến của bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.