Các biến độc lập có tương quan thấp với biến phụ thuộc có thể là yếu tố dự báo quan trọng không?


10

Tôi có tám biến độc lập và một biến phụ thuộc. Tôi đã chạy một ma trận tương quan và 5 trong số chúng có tương quan thấp với DV. Sau đó tôi đã chạy một hồi quy nhiều bước để xem liệu bất kỳ / tất cả các IV có thể dự đoán DV hay không. Hồi quy cho thấy chỉ có hai IV có thể dự đoán DV (chỉ có thể chiếm khoảng 20% ​​phương sai) và SPSS đã loại bỏ phần còn lại khỏi mô hình. Người giám sát của tôi cho rằng tôi đã không chạy hồi quy một cách chính xác, do sức mạnh của các mối tương quan, tôi đã tìm thấy nhiều dự đoán hơn trong mô hình hồi quy. Nhưng các mối tương quan là rất nhỏ, vì vậy câu hỏi của tôi là: nếu IV và DV hầu như không tương quan với nhau, IV có thể vẫn là những yếu tố dự đoán tốt về DV không?


5
Tiêu đề và nội dung của bạn cho thấy một số nhầm lẫn giữa các thuật ngữ "phụ thuộc" và "độc lập". Vui lòng kiểm tra xem chỉnh sửa của tôi bảo tồn ý nghĩa dự định của bạn. Thực tế là mọi người bị nhầm lẫn về cái nào củng cố trường hợp cho thuật ngữ gợi mở hơn, chẳng hạn như "phản ứng" hoặc "kết quả" thay vì "biến phụ thuộc". Cuối cùng, viết tắt lưu ý rằng đối với nhiều người, "IV" có nghĩa là biến công cụ .
Nick Cox

4
Vâng nó có thể. Một lý do là kích thước mẫu cao. Một lý do khác gây bối rối: biến độc lập chính có thể cho thấy mối tương quan thấp với người phụ thuộc vì nó được xác định bởi một biến độc lập khác. Khi bộ gây nhiễu đó được thêm vào mô hình, nó có thể làm cho biến độc lập ban đầu thay đổi từ không dự đoán sang dự đoán (hoặc dự đoán thành không dự đoán, tùy thuộc vào các loại gây nhiễu.) Hồi quy sẽ hoàn toàn đồng ý với tất cả các thử nghiệm tương quan chỉ khi tất cả các biến độc lập là không quan tâm, điều đó gần như không bao giờ xảy ra.
Penguin_Knight

3
Nói một hồi quy theo từng bước "cho thấy chỉ có hai IV có thể dự đoán DV" cho thấy bạn không hiểu cách thức hoạt động của nó. Nếu hai IV tương quan mạnh, và dự đoán DV cũng tương đương nhau, một quy trình từng bước có thể loại bỏ một IV khá tùy tiện. Có vấn đề gì với việc sử dụng mô hình 8-IV đầy đủ?
Scortchi - Phục hồi Monica

3
Nếu muốn sử dụng từng bước, hãy tìm đến Frank Harrell, chiến lược mô hình hóa hồi quy Springer, NY, 2001 như một thuốc giải độc. Anh ta hoạt động trên trang này và có khả năng bắn tên lửa nếu anh ta nghe thấy từ "từng bước".
Nick Cox

1
Nắm bắt số liệu thống kê của bạn càng yếu, bạn càng ít phải loay hoay với các thủ tục lựa chọn biến. Nếu mục tiêu của bạn là kiểm tra xem mỗi IV liên quan đến DV như thế nào sau khi kiểm soát các IV khác, thì đó chính xác là những gì hệ số ước tính (với khoảng tin cậy của chúng) từ mô hình đầy đủ đang nói với bạn. Nhìn vào các yếu tố lạm phát phương sai cùng với việc chỉ ra mối tương quan giữa các IV đang góp phần vào sự không chắc chắn. Sử dụng hệ số xác định chéo được xác thực hoặc điều chỉnh, , để đánh giá khả năng dự đoán của toàn bộ mô hình & để kiểm tra sự phù hợp quá mức. R2
Scortchi - Phục hồi Monica

Câu trả lời:


8

Với ma trận tương quan, bạn đang kiểm tra các liên kết vô điều kiện (thô) giữa các biến của bạn. Với mô hình hồi quy, bạn đang kiểm tra các hiệp hội chung của IV với các DV của bạn, do đó xem xét các hiệp hội có điều kiện (đối với mỗi IV, liên kết của nó với DV có điều kiện trên các IV khác). Tùy thuộc vào cấu trúc dữ liệu của bạn, hai dữ liệu này có thể mang lại kết quả rất khác nhau, thậm chí trái ngược nhau.


5

Thật trùng hợp, tôi chỉ nhìn vào một ví dụ mà tôi đã tạo ra trước đó để hiển thị các khái niệm tương tự (thực sự là cho thấy một trong những vấn đề với hồi quy từng bước). Dưới đây là mã R để tạo và phân tích dữ liệu mô phỏng:

set.seed(1)
x1 <- rnorm(25)
x2 <- rnorm(25, x1)
y <- x1-x2 + rnorm(25)
pairs( cbind(y,x1,x2) )    # Relevant results of each following line appear below...
cor( cbind(y,x1,x2) )      # rx1y  =   .08      rx2y = -.26      rx1x2 = .79
summary(lm(y~x1))          # t(23) =   .39         p = .70
summary(lm(y~x2))          # t(23) = -1.28         p = .21
summary(lm(y~x1+x2))       # t(22) =  2.54, -2.88  p = .02, .01 (for x1 & x2, respectively)

Các mối tương quan và hồi quy tuyến tính đơn giản cho thấy mối quan hệ thấp (không có ý nghĩa thống kê) giữa và mỗi biến . Nhưng được định nghĩa là một hàm của cả hai s và hồi quy bội cho thấy cả hai đều là các yếu tố dự báo quan trọng.x y xyxyx


4

Câu hỏi của bạn sẽ dễ trả lời hơn nếu chúng tôi có thể thấy chi tiết định lượng từ đầu ra phần mềm của bạn và lý tưởng là cũng có thể nhìn thấy dữ liệu.

"Tương quan thấp", cụ thể là gì? Mức độ quan trọng nào bạn đang sử dụng? Có mối quan hệ tích hợp nào giữa các yếu tố dự đoán dẫn đến SPSS giảm một số không?

Lưu ý rằng chúng tôi không có phạm vi để đánh giá liệu bạn đã sử dụng cú pháp phù hợp nhất hay tốt nhất cho mục đích của mình, vì bạn không nêu chính xác những gì bạn đã làm.

Theo nghĩa rộng, mối tương quan thấp giữa các yếu tố dự đoán và kết quả ngụ ý rằng hồi quy có thể gây thất vọng theo cách tương tự như bạn cần sô cô la để làm bánh sô cô la. Cung cấp cho chúng tôi chi tiết hơn, và bạn sẽ nhận được một câu trả lời tốt hơn.

Cũng theo nghĩa rộng, sự thất vọng của người giám sát của bạn không ngụ ý rằng bạn đã làm sai. Nếu người giám sát của bạn biết ít số liệu thống kê hơn bạn, bạn cần tìm kiếm lời khuyên và hỗ trợ từ những người khác trong tổ chức của bạn.


Cảm ơn mọi người. Tôi biết đây là một câu hỏi nhỏ. Tôi đã nhận thấy căng thẳng khi DV và IV của tôi là Locus of Control (với 3 tiểu cảnh), Hỗ trợ xã hội, Tự kiểm soát hiệu quả (3 tiểu cảnh) và Trí thông minh cảm xúc (tất cả đều liên quan đến bản câu hỏi tự báo cáo) và tôi muốn biết các DV có thể dự đoán căng thẳng nhận thức. Tôi đã xem xét mối tương quan giữa tất cả các biến, tất cả chúng đều chủ yếu dưới 0,40, mức ý nghĩa là 0,001. Trước tiên, tôi đã chạy một tương quan Pearsons để xem các DV có tương quan với căng thẳng nhận thức hay không, sau đó là hồi quy để xem liệu chúng có thể dự đoán được căng thẳng hay không.
Elle

1
Như @miura nhấn mạnh một cách đúng đắn, những điều buồn cười có thể xảy ra, nhưng những kết quả này có vẻ hoàn toàn phù hợp với tương đối thấp . R2
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.