Tại sao đặt trọng số lên 1 trong phân tích nhân tố xác nhận?


8

Tôi viết câu hỏi này với tham chiếu đến một ví dụ trên p138-142 của tài liệu sau: ftp://ftp.software.ibm.com/software/analytics/spss/documentation/amos/20.0/en/Manuals/IBM_SPSS_Amos_User_Guide.p .

Dưới đây là số liệu minh họa và một bảng: Ví dụ CFA

Tôi hiểu rằng biến tiềm ẩn không có số liệu tự nhiên và việc đặt hệ số tải thành 1 được thực hiện để khắc phục sự cố này. Tuy nhiên, có một số điều tôi không (hoàn toàn) hiểu:

  1. Làm thế nào để sửa một yếu tố tải lên 1 khắc phục sự không rõ ràng của vấn đề quy mô này?

  2. Tại sao phải sửa thành 1, thay vì một số khác?

  3. Tôi hiểu rằng bằng cách sửa một trong các yếu tố-> trọng số hồi quy chỉ số thành 1, do đó chúng tôi làm cho tất cả các trọng số hồi quy khác cho yếu tố đó liên quan đến nó. Nhưng điều gì xảy ra nếu chúng ta đặt một yếu tố cụ thể tải lên 1 nhưng sau đó hóa ra điểm số cao hơn của yếu tố đó dự đoán điểm thấp hơn trên biến quan sát trong câu hỏi? Sau khi ban đầu chúng ta đặt hệ số tải lên 1, chúng ta có thể đạt được trọng số hồi quy dưới mức tiêu chuẩn hoặc đến trọng số hồi quy tiêu chuẩn hóa không?

  4. Trong bối cảnh này, tôi đã thấy các yếu tố tải được gọi là cả hai hệ số hồi quy và hiệp phương sai. Cả hai định nghĩa này có hoàn toàn chính xác không?

  5. Tại sao chúng ta cần sửa không gian-> visperc và paragrap bằng cả hai thành 1? Điều gì sẽ xảy ra nếu chúng ta chỉ sửa một trong những đường dẫn đó thành 1?

  6. Nhìn vào hệ số chuẩn hóa, làm sao có thể là hệ số không chuẩn hóa cho wordmean> câu> paragrap, nhưng nhìn vào hệ số chuẩn hóa paragrap> wordmean> câu. Tôi nghĩ rằng bằng cách sửa paragrap thành 1 ban đầu, tất cả các biến khác được tải trên hệ số được tạo ra có liên quan đến paragrap.

Tôi cũng sẽ thêm vào một câu hỏi mà tôi tưởng tượng có một câu trả lời liên quan: tại sao chúng ta sửa hệ số hồi quy cho các thuật ngữ duy nhất (ví dụ err_v-> visperc) thành 1? Điều đó có nghĩa gì khi err_v có hệ số 1 trong dự đoán visperc?

Tôi rất hoan nghênh các câu trả lời ngay cả khi chúng không giải quyết tất cả các câu hỏi.


1
Dưới đây là hai bài viết thú vị về cài đặt tỷ lệ của các biến tiềm ẩn: Gonzalez & Griffin (2001): Kiểm tra các tham số trong SEM: Mọi vấn đề "một" ( www-personal.umich.edu/~gonzo/ con / em.pdf ), Little, Slegers, & Card (2006): Một cách không độc đoán trong việc xác định và nhân rộng các biến tiềm ẩn trong các mô hình SEM và MACS ( agencylab.ku.edu/~agencylab/manuscripts/ tựa )
Patrick Coulombe

Điều gì nếu bạn đặt nhiều hơn 1 trọng lượng thành một? Kết quả có giống nhau không?
Behacad

Câu trả lời:


10
  1. Bởi vì sau đó nó cho phép bạn sử dụng mối quan hệ giữa biến tiềm ẩn và biến quan sát để xác định phương sai của biến tiềm ẩn. Ví dụ, hãy xem xét hồi quy của Y trên X. Nếu tôi được phép thay đổi phương sai của X, giả sử, bằng cách nhân nó với một hằng số, thì tôi có thể thay đổi hệ số hồi quy tùy ý. Nếu thay vào đó tôi sửa giá trị của hệ số hồi quy, thì điều này xác định phương sai của X.
  2. Theo quy ước, và để dễ dàng so sánh các hệ số với nhau.
  3. Trong trường hợp đó, biến tiềm ẩn đơn giản trở thành đảo ngược. Ví dụ: giả sử biến tiềm ẩn của chúng tôi là khả năng toán học, biến quan sát của chúng tôi là số lỗi trong bài kiểm tra và chúng tôi sửa hệ số hồi quy thành 1. Sau đó, biến tiềm ẩn của chúng tôi sẽ trở thành "khó khăn với toán học" thay vì khả năng toán học và hệ số cho bất kỳ biến quan sát khác sẽ thay đổi tương ứng.
  4. Nếu cả biến quan sát và biến tiềm ẩn đều được chuẩn hóa (nghĩa là độ lệch chuẩn bằng 1), thì hệ số hồi quy bằng với hiệp phương sai.
  5. Đó là sửa lỗi không gian -> visperc thành 1 cho phép ước tính phương sai của không gian (xem câu trả lời cho (1) ở trên). Tương tự như vậy, sửa lỗi bằng lời nói -> paragrap cho phép ước tính phương sai của lời nói. Một mô hình chỉ có một trong những ràng buộc này sẽ không thể được xác định.
  6. SDverbalSDwordmean2.234×9.682(2.2342×9.682)+19.925=0.841

visperc=β0+β1spatial+err_v

7
  1. Tôi có thể đang hiểu nhầm cụm từ "không xác định quy mô", nhưng tôi tin rằng nó được đặt thành một để nhận dạng. (Nghĩa là, số lượng ẩn số trong hệ phương trình này không được vượt quá số phương trình.) Không đặt một trong các liên kết thành một, có quá nhiều ẩn số. Đó có phải là điều tương tự như không xác định quy mô?

  2. Trong hầu hết các ứng dụng SEM, bạn đang làm việc với ma trận hiệp phương sai, không phải dữ liệu thô. Có một thuật toán thay thế sử dụng dữ liệu gốc, được gọi là PLS (Partial Least Squares), có thể làm sáng tỏ thêm một số thứ cho bạn.


1. Hầu hết các bài viết có xu hướng đối xử không xác định quy mô và nhận dạng như thể chúng là những vấn đề riêng biệt. Một lập luận ủng hộ sự khác biệt là nếu chúng ta thêm vào các biến quan sát nhiều hơn thì tỷ lệ của những điều chưa biết sẽ tăng lên nhưng điều đó không làm giảm nhu cầu tải để được đặt thành 1. 2. Cảm ơn về mẹo về PLS .
user1205901 - Phục hồi lại

4
  1. Hãy suy nghĩ về việc giải thích như thể nó chỉ là một hồi quy đơn giản. Hệ số phản ánh sự khác biệt đơn vị trong biến phụ thuộc liên quan đến chênh lệch 1 đơn vị trong biến độc lập. Do đó, nếu thay đổi 1 đơn vị trong IV được liên kết với thay đổi 1 đơn vị trong DV, thì các đơn vị đó tương đương với nhau. Bạn cần một đơn vị cho biến tiềm ẩn vì bạn muốn ước tính phương sai của nó, không phải là đơn vị. Vấn đề nhận dạng có liên quan, trong đó đối với CFA đơn giản với 1 biến tiềm ẩn và 3 chỉ số, mô hình không được xác định trừ khi thực hiện ràng buộc.

  2. Bạn có thể đặt nó thành bất kỳ số nào và bản chất tổng thể của các kết quả sẽ giống nhau (dễ dàng kiểm tra bằng cách xem mức độ phù hợp của mô hình, sẽ giống hệt nhau). Nó chỉ dễ dàng hơn để giải thích mô hình nếu bạn đặt nó thành 1.

  3. Bất kể bạn sửa bất kỳ tải yếu tố nào, bạn có thể nhận được các mục được tải tích cực và tiêu cực cho cùng một biến tiềm ẩn. Bạn có thể kiểm tra điều này bằng cách nhân một trong các chỉ số của bạn với -1 và ước tính lại mô hình của bạn.

  4. Chúng có chức năng giống nhau nếu hệ số hồi quy không được điều chỉnh (tức là biến phụ thuộc chỉ có 1 mũi tên chỉ vào nó). Nếu đây là trường hợp, người ta có thể bị vôi hóa từ người khác.

  5. Thử nó! Mỗi biến tiềm ẩn cần một thang đo, vì những lý do đã được nêu.

  6. Đây là một vấn đề quy mô và chính xác lý do sử dụng các hệ số chuẩn. Tôi có thể làm cho bất kỳ hệ số hồi quy nào lớn tùy ý bằng cách chia DV cho các số lớn hơn và lớn hơn. Do đó, thay đổi 1 đơn vị trong IV sẽ tạo ra những thay đổi lớn hơn và lớn hơn trong các đơn vị của DV. Bằng cách bình thường hóa, và so sánh like cho thích, chúng tôi tránh được vấn đề này.

  7. Việc sửa hệ số lỗi tải lên 1 chỉ giúp việc giải thích dễ dàng hơn. Nó làm cho phương trình hồi quy tương ứng trong SEM có dạng Y = BX + e (hoặc Y = BX + 1 * e) quen thuộc.


Tôi bối rối về những gì bạn nói trong # 5 về việc sửa hiệp phương sai thành 1. Chắc chắn bạn có nghĩa là tương quan và không hiệp phương sai (trừ khi cả hai biến có phương sai là 1), đúng không? Ngoài ra, nếu bạn có nghĩa là đặt tương quan thành 1, có vẻ như hai biến đó đã được giảm hiệu quả thành một biến duy nhất (và không chỉ được đặt trên cùng một thang đo), vì chúng sẽ luôn có cùng giá trị
Patrick Coulombe

2

Stata có một tài liệu rất hay về SEM ở đây , hãy tìm phần "Nhận dạng 2", nó có câu trả lời cho tất cả các câu hỏi của bạn.

sự vắng mặt của quy mô xuất hiện bởi vì biến tiềm ẩn của bạn không thể quan sát được. bạn có thể đưa ra câu trả lời bằng số trong khảo sát về hạnh phúc, nhưng bản thân hạnh phúc không được đo trực tiếp. bây giờ bạn phải bằng cách nào đó liên kết các câu trả lời như 1 đến 10 với hạnh phúc. vì vậy bạn chỉ định một trong những câu hỏi là một neo và đặt tải của nó thành 1.

nó không phải là 1, nó có thể là bất kỳ giá trị nào, nhưng 1 là thuận tiện.

cả không gian và lời nói đều không thể quan sát được, vì vậy bạn cần đặt tỷ lệ cho cả hai, do đó bạn có các neo cho mỗi cái.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.