Nếu hồi quy tuyến tính có liên quan đến tương quan của Pearson, có bất kỳ kỹ thuật hồi quy nào liên quan đến tương quan của Kendall và Spearman không?


27

Có thể câu hỏi này là ngây thơ, nhưng:

Nếu hồi quy tuyến tính có liên quan mật thiết đến hệ số tương quan của Pearson, thì có kỹ thuật hồi quy nào liên quan chặt chẽ đến các hệ số tương quan của Kendall và Spearman không?


3
Như một ví dụ đơn giản, nơi bạn có một giải thích và biến phụ thuộc: Một tuyến tính hồi quy của các cấp bậc của và sẽ mang lại hệ số tương quan Spearman như hệ số hồi quy. Và trong trường hợp này, và có thể hoán đổi cho nhau trong hồi quy. xyxy
COOLSerdash

2
Chỉ cần một vài suy nghĩ. Kendall's và Spearman's đều là các hệ số tương quan dựa trên các cấp bậc. Mối quan hệ được tìm kiếm giữa và sau đó sẽ cần liên quan đến hàng ngũ của họ. Tuy nhiên, tính toán các cấp bậc đưa ra sự phụ thuộc giữa các quan sát, từ đó áp đặt sự phụ thuộc giữa các thuật ngữ lỗi, loại bỏ hồi quy tuyến tính. Tuy nhiên, trong một cài đặt khác, việc mô hình hóa cấu trúc phụ thuộc giữa và với các công thức sẽ tạo ra một liên kết với và / hoặc Spearman của , tùy thuộc vào sự lựa chọn của copula. τρxyxyτρ
QuantIbex

1
@QuantIbex sự phụ thuộc đó có nhất thiết ngụ ý không? E[εtôiεj]0
Shadowtalker

Câu trả lời:


21

Có một phương tiện rất đơn giản để sử dụng hầu hết mọi biện pháp tương quan để phù hợp với hồi quy tuyến tính và tái tạo các bình phương nhỏ nhất khi bạn sử dụng tương quan Pearson.

Hãy xem xét rằng nếu độ dốc của một mối quan hệ là , mối tương quan giữa y - β xx nên được dự kiến sẽ được 0 .βy-βxx0

Thật vậy, nếu nó là bất cứ điều gì khác hơn , có muốn có một số mối quan hệ tuyến tính uncaptured - đó là những gì các biện pháp tương quan sẽ được chọn lên.0

Do đó chúng tôi có thể ước lượng độ dốc bằng cách tìm độ dốc, mà làm cho các mẫu tương quan giữa y - ~ β xx được 0 . Trong nhiều trường hợp - ví dụ: khi sử dụng các biện pháp dựa trên xếp hạng - mối tương quan sẽ là một hàm bước của giá trị của ước tính độ dốc, do đó có thể có một khoảng trong đó bằng không. Trong trường hợp đó, chúng ta thường định nghĩa ước lượng mẫu là tâm của khoảng. Thường thì hàm bước nhảy từ trên 0 đến dưới 0 tại một số điểm và trong trường hợp đó, ước tính nằm ở điểm nhảy.β~y-β~xx0

Định nghĩa này hoạt động, ví dụ, với tất cả các cách tương quan dựa trên xếp hạng và mạnh mẽ. Nó cũng có thể được sử dụng để có được một khoảng cho độ dốc (theo cách thông thường - bằng cách tìm các độ dốc đánh dấu đường biên giữa chỉ tương quan đáng kể và chỉ tương quan không đáng kể).

Điều này chỉ xác định độ dốc, tất nhiên; khi độ dốc ước tính, đánh chặn có thể dựa trên một ước tính vị trí phù hợp tính trên dư . Với các mối tương quan dựa trên xếp hạng, trung vị là một lựa chọn phổ biến, nhưng có nhiều lựa chọn phù hợp khác.y-β~x

Đây là mối tương quan được vẽ theo độ dốc cho cardữ liệu trong R:

nhập mô tả hình ảnh ở đây

Tương quan Pearson vượt qua 0 ở độ dốc bình phương nhỏ nhất, 3.932
Tương quan Kendall vượt 0 tại độ dốc Theil-Sen, 3.667
Mối tương quan Spearman vượt qua 0 tạo ra độ dốc "Spearman-line" là 3.714

Đó là ba ước tính độ dốc cho ví dụ của chúng tôi. Bây giờ chúng tôi cần chặn. Để đơn giản, tôi sẽ chỉ sử dụng phần dư trung bình cho lần đánh chặn đầu tiên và trung vị cho hai phần còn lại (điều này không quan trọng lắm trong trường hợp này):

           intercept
 Pearson:  -17.573 *     
 Kendall:  -15.667
 Spearman: -16.285

* (sự khác biệt nhỏ so với bình phương tối thiểu là do sai số làm tròn trong ước tính độ dốc; không có nghi ngờ gì về lỗi làm tròn tương tự trong các ước tính khác)

Các đường được trang bị tương ứng (sử dụng cùng tông màu như trên) là:

nhập mô tả hình ảnh ở đây

Chỉnh sửa: Để so sánh, độ dốc tương quan góc phần tư là 3.333

Cả hai sườn tương quan Kendall và sườn tương quan Spearman đều mạnh hơn đối với các ngoại lệ có ảnh hưởng so với bình phương nhỏ nhất. Xem ở đây để có một ví dụ ấn tượng trong trường hợp của Kendall.


(+1) Giải thích tuyệt vời! Có bất kỳ lý do nào khiến Kendall dường như được Spearman ưa thích hơn trong bối cảnh này (ít nhất là đánh giá từ thực tế rằng mối tương quan Kendall tương ứng với một công cụ ước tính độ dốc có tên, Theil-Sen, trong khi Spearman thì không)?
amip nói rằng Phục hồi lại

4
Có một số lý do tại sao điều này dường như là trường hợp. Đầu tiên là dòng Theil-Sen có một công cụ ước tính được mô tả đơn giản (trung vị của các cặp dốc), mà Spearman thiếu; trong các mẫu nhỏ, nó rất phù hợp để tính toán tay. Mối tương quan Kendall tiếp cận tính quy phạm nhanh hơn và dễ tính toán hơn . Xem thêm ở đâyở đây .
Glen_b -Reinstate Monica

20

XYY

χ2

Mô hình PO là trường hợp đặc biệt của một mô hình xác suất tích lũy chung (một số liên kết tích lũy cuộc gọi) bao gồm probit, mối nguy theo tỷ lệ và mô hình log-log bổ sung. Đối với một nghiên cứu trường hợp, xem Chương 15 của Tài liệu của tôi .


4

Aaron Han (1987 về kinh tế lượng) đã đề xuất công cụ ước lượng tương quan xếp hạng tối đa phù hợp với mô hình hồi quy bằng cách tối đa hóa tau. Dougherty và Thomas (2012 trong tài liệu tâm lý học) gần đây đã đề xuất một thuật toán rất giống nhau. Có rất nhiều công việc trên MRC minh họa các thuộc tính của nó.

Aaron K. Han, Phân tích phi tham số của mô hình hồi quy tổng quát: Công cụ ước lượng tương quan xếp hạng tối đa, Tạp chí Kinh tế lượng, Tập 35, Số phát hành 2, 3 tháng 7 năm 1987, Trang 303-316, ISSN 0304-4076, http: // dx.doi.org/10.1016/0304-4076(87)90030-3 . ( http://www.scTHERirect.com/science/article/pii/0304407687900303 )

Dougherty, MR, & Thomas, RP (2012). Ra quyết định mạnh mẽ trong một thế giới phi tuyến. Đánh giá tâm lý, 119 (2), 321. Lấy từ http://damlab.umd.edu/pdf%20articles/DoughertyThomas2012Rev.pdf .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.