Tại sao các hệ số hồi quy trong một mô hình phân tích nhân tố được gọi là tải trọngvv


7

Trong chủ đề này @ttnphns viết rằng

Bởi vì đó là hệ số hồi quy [...] Tôi nhấn mạnh rằng tốt hơn nên nói "yếu tố tải biến" hơn là "hệ số tải biến".

Tôi đã học được từ đây rằng một mô hình phân tích nhân tố là hệ thống các phương trình

V1= =một1TôiFTôi+một1TôiTôiFTôiTôi+E1

V2= =một2TôiFTôi+một2TôiTôiFTôiTôi+E2

...

Vp= =Giáo dục

trong đó hệ số a là tải, F là hệ số [...] và biến E là phần dư hồi quy.

Tuy nhiên, tôi không hiểu làm thế nào mà chúng ta nên nói "yếu tố tải biến" thay vì ngược lại. Điều gì về thuật ngữ "tải" làm cho nó theo sau?

Tôi cũng không biết tại sao chúng ta cần thuật ngữ "tải" cả, khi chúng ta đã có thuật ngữ "hệ số hồi quy". Có phải bởi vì đôi khi các hệ số hồi quy cũng là hệ số tương quan, và các nhà thống kê muốn có một thuật ngữ chung để bao quát cả hai trường hợp?

Tôi hy vọng rằng câu trả lời cho câu hỏi này sẽ giúp học sinh dễ nhớ hơn rằng các yếu tố tải các biến quan sát, thay vì ngược lại.


1
Tôi không bao giờ có thể nhớ những gì được cho là "tải" (hoặc tải vào? Hoặc được tải bởi? V.v.), và vì vậy tôi tránh sử dụng động từ "để tải" trong ngữ cảnh này. Tôi nói "tải" mặc dù. Tuy nhiên, lưu ý rằng FA không phải là hồi quy và không có "hệ số hồi quy" ở đây, ít nhất là không theo nghĩa thông thường của từ này. Tôi nghĩ rằng nó sẽ chỉ gây nhầm lẫn gọi hồi quy hệ số. Hoặc không gọi nó là bất cứ điều gì cả, hoặc gọi nó là "tải". Nhưng chúng không phải là hệ số hồi quy! Một
amip

@amoeba, nói FA is not a regressionbạn vừa đúng vừa không đúng. FA là thủ tục trích xuất tất nhiên không phải là thủ tục hồi quy. Nhưng mô hình FA là một mô hình hồi quy. Nếu chúng tôi có thể biết các giá trị F thực sự (thay vì điểm gần đúng) và mức độ phù hợp là tuyệt vời (tái tạo tương quan bằng các tải trọng) và chúng tôi quyết định hồi quy các giá trị Vs theo các giá trị F đó, các tải sẽ xuất hiện khi chúng tôi ước lượng tham số.
ttnphns

Câu trả lời:


5

Tôi không hiểu làm thế nào mà chúng ta nên nói "yếu tố tải biến" thay vì ngược lại

Giải thích trừu tượng . Nếu một điểm được xem là đối tượng có tọa độ trên một trục được xem là tính năng thì tọa độ là tính năng tải điểm đó bao nhiêu, chính nó tính phí bao nhiêu, điểm đó. Nếu chiều cao của tôi là 1,86 m thì đây là cách tôi tải theo chiều cao (không phải tôi tải bao nhiêu chiều cao). Lưu ý rằng tải là tọa độ của biến trên trục nhân tố trên biểu đồ tải .

Giải thích tiềm ẩn . Yếu tố được khái niệm hóa như một thực thể đóng vai trò "trong" các biến hoặc "đằng sau" chúng và làm cho chúng tương quan với nhau. Do đó, "tải" theo trực giác là một từ tốt để diễn tả mức độ của biến số phụ thuộc mạnh mẽ, được thúc đẩy bởi yếu tố tiềm ẩn. Mô hình phân tích nhân tố là mô hình hồi quy, theo đó các yếu tố giải thích hoặc "ảnh hưởng" các biến quan sát. Bất kỳ hệ số hồi quy nào (không chỉ phân tích nhân tố) có thể được gắn nhãn là "tải": hệ số hồi quy = trọng số hồi quy = tải hồi quy. Thêm lý do để gọi hệ số là "tải" xuất phát từ thực tế là trong mô hình nhân tố, các yếu tố được đặt chuẩn, mỗi phương sai đơn vị, trong khi biếnFVkhông nhất thiết phải chuẩn hóa. Do đó, hiệu ứng trên được nhận ra / thể hiện hoàn toàn và chỉ thông qua các hệ số tải. Bất cứ khi nào trong mô hình hồi quy, một biến được tiêu chuẩn hóa dự đoán một biến có khả năng không được chuẩn hóa - gọi hệ số là "tải".V

Tại sao chúng ta cần thuật ngữ "tải" cả, khi chúng ta đã có thuật ngữ "hệ số hồi quy"

Chúng tôi thực sự không cần. Từ "tải" chỉ đơn giản là một truyền thống xuất phát từ ý thích của các nhà tâm lý học theo nghĩa bóng (FA bắt đầu phát triển cách đây một thế kỷ giữa các nhà tâm lý học). Ngoài ra, thuật ngữ "tải" có thể có ý nghĩa thống kê khác nhau trong các phương pháp đa biến liên quan khác (như phân tích phân biệt). Nói chung, một số người trong một số trường hợp gọi là hệ số hồi quy "tải", trong khi các trường hợp khác hoặc trong các trường hợp khác - hệ số tương quan. Vì vậy, thuật ngữ này là khó hiểu. Nó không phải là một thuật ngữ thống kê , cuối cùng.

Nếu bạn không thích từ này, đừng sử dụng nó. Bạn cũng có thể nói "hệ số tải biến (bật)" nếu bạn muốn; Đối với tôi, nó chỉ đơn giản là một bài phát biểu thiếu suy nghĩ, không phải là một phó.

PS Tôi vừa tìm trong một từ điển tiếng Anh (tiếng Anh không phải là ngôn ngữ của tôi) và nhận thấy rằng để tải có thể có ý nghĩa như (1) "Tôi đã tải giỏ hàng" (bằng một cái túi, hoặc tự mình bắt tay); (2) "tàu tải (lên) nhiều hành khách (trên đó)". Nếu tuân theo cách sử dụng từ thứ hai, sẽ khá ổn khi nói "biến tải tải nhân tố (chính nó, biến)".


+1. Nhưng tôi không thích gọi các hệ số "hệ số hồi quy". Đối với tôi, "hồi quy" ngụ ý rằng có các biến phụ thuộc và độc lập và mục tiêu là tìm các hệ số hồi quy. Trong các mô hình biến tiềm ẩn như FA chỉ có một bộ biến và mục tiêu là tìm các biến tiềm ẩn. Đây không phải là một hồi quy; toán học và các tính toán hoàn toàn khác nhau (người ta thường cần một cái gì đó giống như sự tối đa hóa kỳ vọng đó để tìm ra một giải pháp FA; không cần EM trong hồi quy). Tôi sẽ giữ thuật ngữ "hệ số hồi quy" cho hồi quy.
amip

1
This is not a regression@amoeba, tôi không phản đối cách hiểu của bạn về các thuật ngữ này, mặc dù cách của tôi hơi khác so với bạn. Sự khác biệt đó của chúng ta có tầm quan trọng nhỏ. Lưu ý rằng việc nói "mô hình hồi quy (= hồi quy giống như") không chính xác như nói "hồi quy (phân tích)". FA không phải là một hồi quy, rõ ràng, bởi vì không có (các) biến Y bên ngoài. Tuy nhiên, nó mô hình hóa các X bằng các F được trích xuất bằng cách nào đó như thể các X là các Y đó. Giải thích FA về "mô hình hồi quy" cho sinh viên là một cách dễ dàng.
ttnphns

Liệu thuật ngữ này có ảnh hưởng đến việc giải thích sau đây của tải? Việc giải thích tải là: 1. Tải PC càng cao thì ảnh hưởng của nó càng lớn trong quá trình hình thành biến. 2. Tải của một biến càng cao, nó càng có ảnh hưởng trong việc hình thành điểm thành phần chính. 3. Cả hai? Nếu nó quan trọng, bài viết đầy đủ ở đây .
user_anon

1
OK bây giờ. 1. Đúng (tốt, thông thường chúng ta không lấy PC cho một yếu tố trung thực ). 2. Đúng, nhưng không đơn giản. Vui lòng xem cách các hệ số điểm thành phần được tính từ các lần tải: stats.stackexchange.com/a/126985/3277 , và điều này cũng thảo luận về sự khác biệt của các coef-s đó từ các lần tải: stats.stackexchange.com/a/191332/3277
ttnphns

1
@user_anon, 3). Tuy nhiên, cả 1 và 2 cũng hợp lệ nếu bạn đang nói về các biến ngẫu nhiên thay vì tập dữ liệu. Phân phối bình thường là không cần thiết, nói chung.
ttnphns
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.