Người ta thường nói rằng bình phương của tương quan mẫu tương đương với hệ số xác định cho hồi quy tuyến tính đơn giản. Tôi đã không thể chứng minh điều này bản thân mình và sẽ đánh giá cao một bằng chứng đầy đủ về thực tế này.
Người ta thường nói rằng bình phương của tương quan mẫu tương đương với hệ số xác định cho hồi quy tuyến tính đơn giản. Tôi đã không thể chứng minh điều này bản thân mình và sẽ đánh giá cao một bằng chứng đầy đủ về thực tế này.
Câu trả lời:
Dường như có một số thay đổi trong ký hiệu: trong hồi quy tuyến tính đơn giản, tôi thường thấy cụm từ "hệ số tương quan mẫu" với ký hiệu là một tham chiếu đến mối tương quan giữa các giá trị và được quan sát . Đây là ký hiệu tôi đã thông qua cho câu trả lời này. Tôi cũng đã thấy cụm từ và ký hiệu tương tự được sử dụng để chỉ mối tương quan giữa quan sát và trang bị ; trong câu trả lời của tôi, tôi đã gọi này là "hệ số tương quan nhiều" và sử dụng biểu tượng . Câu trả lời này giải quyết tại sao hệ số xác định là cả bình phương của và cũng là bình phương của, vì vậy nó không quan trọng việc sử dụng đã được dự định.
Các kết quả sau trong một dòng của đại số lần một số sự kiện đơn giản về sự tương quan và ý nghĩa của được thành lập, vì vậy bạn có thể thích để bỏ xuống để phương trình đóng hộp. Tôi giả sử chúng ta không phải chứng minh các tính chất cơ bản của hiệp phương sai và phương sai, cụ thể là:
Lưu ý rằng cái sau có thể được bắt nguồn từ cái trước, một khi chúng ta biết rằng hiệp phương sai là đối xứng và . Từ đây chúng ta rút ra một thực tế cơ bản khác, về mối tương quan. Đối với và miễn là và có phương sai khác không,
Ở đây là hàm dấu hoặc hàm : giá trị của nó là nếu và nếu . Cũng đúng là nếu , nhưng trường hợp đó không liên quan đến chúng tôi: sẽ là một hằng số, vì vậy in mẫu số và chúng ta không thể tính được mối tương quan. Đối số đối xứng cho phép chúng ta khái quát kết quả này, cho :
Chúng ta sẽ không cần công thức chung hơn này để trả lời câu hỏi hiện tại, nhưng tôi bao gồm nó để nhấn mạnh hình dạng của tình huống: nó chỉ đơn giản nói rằng mối tương quan là không thay đổi khi một trong hai biến được thu nhỏ hoặc dịch, nhưng đảo ngược dấu hiệu khi một biến là phản ánh.
Chúng ta cần một thực tế hơn: cho một mô hình tuyến tính bao gồm một thuật ngữ không đổi, hệ số xác định là bình phương của hệ số tương quan nhiều , đó là mối tương quan giữa các câu trả lời quan sát và trang bị của mô hình giá trị . Điều này áp dụng cho cả nhiều và hồi quy đơn giản, nhưng chúng ta hãy hạn chế sự chú ý của chúng tôi để đơn giản tuyến tính mô hình . Kết quả xuất phát từ quan sát rằng là phiên bản thu nhỏ, có thể được phản ánh và được dịch của :
Vì vậy, trong đó dấu hiệu khớp với dấu hiệu của độ dốc ước tính, điều này đảm bảo không bị âm. Rõ ràng .
Đối số trước được thực hiện đơn giản hơn bằng cách không phải xem xét các tổng bình phương. Để đạt được điều này, tôi đã bỏ qua các chi tiết về mối quan hệ giữa , mà chúng ta thường nghĩ về các tổng bình phương và , trong đó chúng ta nghĩ về mối tương quan của các phản ứng được trang bị và quan sát được. Các biểu tượng làm cho mối quan hệ có vẻ như tautological nhưng đây không phải là trường hợp và mối quan hệ bị phá vỡ nếu không có thuật ngữ chặn trong mô hình! Tôi sẽ đưa ra một phác thảo ngắn gọn về một lập luận hình học về mối quan hệ giữa và lấy từ một câu hỏi khác : sơ đồ được vẽ trong chiều không gian chủ đề, do đó, mỗi trục (không được hiển thị) đại diện cho một đơn vị quan sát và các biến được hiển thị dưới dạng vectơ. Các cột của ma trận thiết kế là vectơ (cho thuật ngữ không đổi) và vectơ quan sát của biến giải thích, vì vậy không gian cột là một mặt phẳng hai chiều.
Các trang bị là chiếu trực giao của các quan sát vào không gian cột của . Điều này có nghĩa là vectơ của phần dư vuông góc với mặt phẳng và do đó là . Sản phẩm chấm là . Khi phần dư tổng bằng 0 và , thì để cả hai phản ứng được trang bị và quan sát được có nghĩa là . Các đường đứt nét trong sơ đồ, và , do đó, là các vectơ trung tâm cho các phản ứng được quan sát và được trang bị, và cosin của góc giữa chúng là tương quan .
Tam giác các vectơ này hình thành với vectơ dư là góc vuông vì nằm trong căn hộ nhưng là trực giao với nó. Áp dụng Pythagoras:
Đây chỉ là sự phân tách của các tổng bình phương, . Công thức thông thường cho hệ số xác định là mà trong tam giác này là nên thực sự là bình phương của . Bạn có thể quen thuộc hơn với công thức , ngay lập tức cho , nhưng lưu ý rằng mang tính tổng quát hơn và sẽ (như chúng ta vừa thấy) giảm xuống nếu một thuật ngữ không đổi được bao gồm trong mô hình .
Các được định nghĩa là Hệ số tương quan mẫu bình phương: là tương đương, vì nó được xác minh dễ dàng bằng cách sử dụng: (xem Verbeek , §2.4)