Sự khác biệt giữa phân tích hồi quy và khớp đường cong


17

Ai đó có thể vui lòng giải thích cho tôi sự khác biệt thực sự giữa phân tích hồi quy và khớp đường cong (tuyến tính và phi tuyến), với một ví dụ nếu có thể?

Dường như cả hai đều cố gắng tìm mối quan hệ giữa hai biến (phụ thuộc so với độc lập) và sau đó xác định tham số (hoặc hệ số) liên quan đến các mô hình được đề xuất. Ví dụ: nếu tôi có một bộ dữ liệu như:

Y = [1.000 1.000 1.000 0.961 0.884 0.000] 
X = [1.000 0.063 0.031 0.012 0.005 0.000]

Bất cứ ai có thể đề xuất một công thức tương quan giữa hai biến này? Tôi đang gặp khó khăn để hiểu sự khác biệt giữa hai phương pháp này. Nếu bạn muốn hỗ trợ câu trả lời của mình với các bộ dữ liệu khác, thì điều đó có vẻ khó phù hợp (có lẽ chỉ dành cho tôi).

Tập dữ liệu trên biểu thị trục và của đường cong đặc tính vận hành máy thu (ROC), trong đó là tỷ lệ dương thực sự (TPR) và là tỷ lệ dương tính giả (FPR).xyyx

Tôi đang cố gắng điều chỉnh đường cong hoặc phân tích hồi quy theo câu hỏi ban đầu của tôi, chưa chắc chắn, trong số những điểm này để ước tính TPR cho bất kỳ FPR cụ thể nào (hoặc ngược lại).

Đầu tiên, liệu có thể chấp nhận được về mặt khoa học khi tìm thấy hàm khớp đường cong như vậy giữa hai biến độc lập (TPR và FPR) không?

Thứ hai, liệu có thể chấp nhận được về mặt khoa học khi tìm thấy một hàm như vậy nếu tôi biết rằng các phân phối của âm tính thực tế và các trường hợp dương tính thực tế là không bình thường?


1
Các thuật ngữ (không may) được sử dụng khác nhau bởi những người khác nhau & trong các bối cảnh khác nhau. Bạn có thể liên kết đến / cung cấp một ví dụ nơi mọi người đang phân biệt giữa chúng không?
gung - Phục hồi Monica

Đó là những gì tôi đang cố gắng tìm ra, chúng khác nhau như thế nào và làm thế nào tôi có thể phân biệt giữa chúng.
Ali Sultan

1
Đủ công bằng, nhưng ai đó đã nói với bạn rằng họ đáng ra phải khác biệt?
gung - Phục hồi Monica

2
Trên trang này, một số người đã sử dụng "khớp đường cong" theo các giác quan không thể được coi là hồi quy. Ví dụ, một số người trong số họ xem ước tính mật độ là một dạng "khớp đường cong" với biểu đồ.
whuber

Câu trả lời:


22

Tôi nghi ngờ rằng có một sự khác biệt rõ ràng và nhất quán giữa các ngành khoa học và lĩnh vực có đầu óc thống kê giữa hồi quykhớp đường cong .

Hồi quy không có trình độ ngụ ý hồi quy tuyến tính và ước lượng bình phương nhỏ nhất. Điều đó không loại trừ các giác quan khác hoặc rộng hơn: thực sự một khi bạn cho phép logit, Poisson, hồi quy nhị thức âm, v.v., v.v ... sẽ khó khăn hơn để xem mô hình nào không phải là hồi quy theo nghĩa nào đó.

Phù hợp theo đường cong thực sự gợi ý một đường cong có thể được vẽ trên mặt phẳng hoặc ít nhất là trong một không gian chiều thấp. Hồi quy không quá giới hạn và có thể dự đoán các bề mặt trong một không gian nhiều chiều.

Phù hợp đường cong có thể hoặc không thể sử dụng hồi quy tuyến tính và / hoặc bình phương nhỏ nhất. Nó có thể đề cập đến việc lắp một đa thức (chuỗi lũy thừa) hoặc một tập hợp các số hạng sin và cos hoặc theo một cách khác thực sự đủ điều kiện là hồi quy tuyến tính theo nghĩa chính là khớp một dạng tuyến tính của hàm trong các tham số. Thật vậy, khớp đường cong khi hồi quy phi tuyến cũng là hồi quy.

Thuật ngữ khớp đường cong có thể được sử dụng theo nghĩa miệt thị, xúc phạm, phản đối hoặc bác bỏ ("đó chỉ là khớp đường cong!") Hoặc (gần như hoàn toàn ngược lại) nó có thể ám chỉ đến một đường cong cụ thể được lựa chọn cẩn thận với vật lý cụ thể (sinh học, kinh tế, bất cứ điều gì) hợp lý hoặc được điều chỉnh để phù hợp với các loại hành vi ban đầu hoặc giới hạn cụ thể (ví dụ: luôn luôn tích cực, bị ràng buộc theo một hoặc cả hai hướng, đơn điệu, với một sự thay đổi, với một bước ngoặt duy nhất, dao động, v.v.).

Một trong một số vấn đề mờ nhạt ở đây là hình thức chức năng tương tự có thể ở mức thực nghiệm tốt nhất trong một số trường hợp và lý thuyết xuất sắc ở những người khác. Newton đã dạy rằng quỹ đạo của các viên đạn có thể là parabol, và do đó được trang bị một cách tự nhiên bởi tứ giác, trong khi một phương trình bậc hai phù hợp với độ tuổi phụ thuộc trong khoa học xã hội thường chỉ là một sự sai lệch phù hợp với một số độ cong trong dữ liệu. Phân rã theo cấp số nhân là một xấp xỉ thực sự tốt cho các đồng vị phóng xạ và đôi khi không phải là dự đoán quá điên rồ đối với cách mà giá trị đất giảm theo khoảng cách từ một trung tâm.

Ví dụ của bạn không có dự đoán rõ ràng từ tôi. Phần lớn vấn đề ở đây là với một tập hợp dữ liệu rất nhỏ và chính xác không có thông tin nào về các biến là gì hoặc chúng được dự kiến ​​sẽ hành xử như thế nào, có thể là vô trách nhiệm hoặc dại dột khi đề xuất một hình thức mô hình. Có lẽ dữ liệu sẽ tăng mạnh từ (0, 0) và sau đó tiếp cận (1, 1), hoặc có lẽ một cái gì đó khác. Bạn nói họ!

Ghi chú. Cả hồi quy và khớp đường cong đều không giới hạn ở các yếu tố dự đoán đơn hoặc tham số đơn (hệ số).


2
"Phù hợp đường cong" bao hàm một cái gì đó về mặt lý thuyết (ví dụ, lowess) với tôi. Các nhà kinh tế đôi khi coi một "chức năng lý thuyết phù hợp là" biểu đồ ", nghe có vẻ giống với một số cách sử dụng khớp đường cong. Tôi nghĩ rằng nó (ví dụ như lowess) có cả ưu và nhược điểm, khi hiểu đúng. Mặc dù vậy, thật khó để biết ai đó có nghĩa là các thuật ngữ rõ ràng như thế nào với nhiều bối cảnh hơn.
gung - Phục hồi Monica

1
@gung Tôi nghĩ rằng có một cách sử dụng tương tự một phần, nghiêm trọng một phần trong một số khoa học tự nhiên (và không tự nhiên). Một trong những vấn đề là đưa ra đủ thông số, bạn nhất thiết phải có nhiều phòng ngọ nguậy. Tôi được nhắc nhở về các mô hình chuỗi thời gian cho phép không chỉ ARIMA mà cả các điều khoản và bước hình sin, đường dốc và gai bất cứ nơi nào dữ liệu đề xuất.
Nick Cox

Tôi thứ hai @gung, phù hợp với đường cong có ý nghĩa không đối xứng hơn, ít nhất là với tôi.
Christoph Hanck

1
@ChristophHanck Xin đừng mang "không đối xứng" vào đây! Cuộc thảo luận đã đủ bùn rồi!
Nick Cox

1
@gung: Nghĩ đến việc làm mịn splines và các phương pháp RKHS nói chung là xương sống của "khớp đường cong" chẳng hạn, tôi cảm thấy "khớp đường cong" mang tính lý thuyết hơn nhiều so với "hồi quy". (+1 cho NickCox cho câu trả lời này)
usεr11852 nói Phục hồi Monic

8

Ngoài câu trả lời xuất sắc của @ NickCox (+1), tôi muốn chia sẻ ấn tượng chủ quan của mình về chủ đề thuật ngữ hơi mờ này. Tôi nghĩ rằng một sự khác biệt khá tinh tế giữa hai thuật ngữ nằm ở sau. Một mặt, hồi quy thường, nếu không luôn luôn, ngụ ý một giải pháp phân tích (tham chiếu đến các hồi quy ngụ ý xác định các tham số của chúng , do đó lập luận của tôi về giải pháp phân tích). Mặt khác, khớp đường cong không nhất thiết có nghĩa là tạo ra một giải pháp phân tích và IMHO thường có thể và được sử dụng như một phương pháp thăm dò .


2
Không thể một cái gì đó với một giải pháp phân tích được sử dụng cho lý do thăm dò quá? Tôi không nghĩ rằng tôi nhận được sự phản đối mà bạn đang thực hiện.
amip nói rằng Phục hồi Monica

@amoeba: Các giải pháp phân tích chắc chắn cũng có thể được sử dụng cho nghiên cứu khám phá. Tuy nhiên, điểm tôi đang đưa ra là về bản chất ngụ ý phổ biến nhất của các thuật ngữ trong câu hỏi.
Alexanderr Blekh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.