Có nên sử dụng mô hình phương trình cấu trúc để phân tích các nghiên cứu quan sát trong tâm lý học


20

Tôi đã nhận thấy vấn đề này xuất hiện rất nhiều trong các thiết lập tư vấn thống kê và tôi rất muốn biết suy nghĩ của bạn.

Bối cảnh

Tôi thường nói chuyện với các sinh viên nghiên cứu đã thực hiện một nghiên cứu như sau:

  • Nghiên cứu quan sát
  • Cỡ mẫu có thể là 100, 200, 300, v.v.
  • Nhiều thang đo tâm lý đã được đo lường (ví dụ, có thể là lo lắng, trầm cảm, tính cách, thái độ, thang đo lâm sàng khác, có lẽ là trí thông minh, v.v.)

Các nhà nghiên cứu đã đọc các tài liệu liên quan và có một số suy nghĩ về các quá trình nguyên nhân có thể. Thông thường sẽ có một số khái niệm chung về các biến thành tiền đề, biến quá trình và biến kết quả. Họ cũng thường nghe nói rằng mô hình phương trình cấu trúc phù hợp hơn để kiểm tra các mô hình tổng thể về mối quan hệ giữa tập hợp các biến mà họ đang nghiên cứu.

Câu hỏi

  • Trong những điều kiện nào bạn nghĩ rằng mô hình phương trình cấu trúc là một kỹ thuật thích hợp để phân tích các nghiên cứu như vậy?
  • Nếu bạn không đề xuất mô hình hóa phương trình cấu trúc, bạn sẽ đề xuất những kỹ thuật thay thế nào?
  • Bạn có lời khuyên nào cho các nhà nghiên cứu xem xét sử dụng mô hình phương trình cấu trúc trong những trường hợp như vậy?

Câu trả lời:


14

Từ chối trách nhiệm của tôi : Tôi nhận ra câu hỏi này đã không hoạt động trong một thời gian, nhưng nó dường như là một câu hỏi quan trọng và là câu hỏi mà bạn dự định gợi ra nhiều câu trả lời. Tôi là một nhà tâm lý học xã hội, và từ những âm thanh của nó, có lẽ thoải mái hơn một chút với những thiết kế như vậy so với Henrik (mặc dù mối quan tâm của anh ấy về diễn giải nguyên nhân là hoàn toàn hợp pháp).

Trong điều kiện nào SEM là một kỹ thuật phân tích dữ liệu phù hợp?

Đối với tôi, câu hỏi này thực sự có hai câu hỏi phụ khác nhau:

  1. Tại sao sử dụng SEM ở nơi đầu tiên?
  2. Nếu một nhà nghiên cứu đã quyết định sử dụng SEM, các yêu cầu liên quan đến dữ liệu để sử dụng SEM là gì?

Tại sao sử dụng SEM ở nơi đầu tiên?

SEM là một cách tiếp cận phân tích dữ liệu phức tạp và phức tạp hơn - và do đó ít dễ tiếp cận hơn so với các cách tiếp cận mô hình tuyến tính chung, điển hình hơn (ví dụ ANOVAs, tương quan, hồi quy và phần mở rộng của chúng, v.v.). Bất cứ điều gì bạn có thể nghĩ đến khi làm với những cách tiếp cận đó, bạn có thể làm với SEM.

Do đó, tôi nghĩ rằng trước tiên người dùng nên đánh giá mạnh mẽ lý do tại sao họ buộc phải sử dụng SEM ngay từ đầu. Để chắc chắn, SEM cung cấp một số lợi ích mạnh mẽ cho người dùng của mình, nhưng tôi đã xem xét các bài báo trong đó không có lợi ích nào trong số này và sản phẩm cuối là phần phân tích dữ liệu trong một bài báo khó hiểu hơn đối với những người đọc thông thường . Nó chỉ đơn giản là không có giá trị rắc rối - cho nhà nghiên cứu hoặc người đọc - nếu lợi ích của SEM so với các phương pháp phân tích dữ liệu khác không được gặt hái.

Vậy tôi thấy lợi ích chính của phương pháp SEM là gì? Những cái lớn, theo tôi là:

(1) Mô hình hóa các biến tiềm ẩn : SEM cho phép người dùng kiểm tra các mối quan hệ cấu trúc (phương sai, hiệp phương sai / tương quan, hồi quy, khác biệt trung bình nhóm) giữa các biến tiềm ẩn không quan sát được, về cơ bản là hiệp phương sai được chia sẻ giữa một nhóm biến (ví dụ đo lường học sinh của bạn có thể sử dụng).

Điểm bán hàng lớn để phân tích các biến tiềm ẩn (ví dụ: lo lắng tiềm ẩn) so với điểm số quan sát được của cấu trúc (ví dụ: trung bình của các mục lo lắng) là các biến tiềm ẩn không có lỗi - các biến tiềm ẩn được hình thành từ hiệp phương sai chung, và lỗi được lý thuyết hóa để không có gì. Điều này có nghĩa là tăng sức mạnh thống kê, vì người dùng không còn phải lo lắng về việc đo lường độ tin cậy không đáng tin cậy làm giảm hiệu ứng mà họ đang cố gắng mô hình hóa.

Một lý do khác, ít nói hơn, để xem xét sử dụng SEM là trong một số trường hợp, đó là một cách hợp lệ hơn để kiểm tra lý thuyết của chúng tôi về các cấu trúc. Ví dụ, nếu học sinh của bạn đang sử dụng ba biện pháp lo âu khác nhau, sẽ không tốt hơn để hiểu nguyên nhân / hậu quả của những gì ba biện pháp đó có chung - có lẽ là lo lắng-- trong khuôn khổ SEM, thay vì ưu tiên bất kỳ biện pháp cụ thể như một sự đo lường của sự lo lắng?

(2) Mô hình hóa nhiều biến phụ thuộc: Ngay cả khi ai đó sẽ không sử dụng SEM để mô hình các biến tiềm ẩn, nó vẫn có thể khá hữu ích như một khung để phân tích đồng thời nhiều biến kết quả trong một mô hình. Ví dụ, có lẽ các sinh viên của bạn quan tâm đến việc khám phá cách các yếu tố dự đoán tương tự có liên quan đến một số kết quả lâm sàng khác nhau (ví dụ: lo lắng, trầm cảm, cô đơn, lòng tự trọng, v.v.). Tại sao chạy bốn mô hình riêng biệt (tăng tỷ lệ lỗi Loại I), khi bạn chỉ có thể chạy một mô hình cho cả bốn kết quả mà bạn quan tâm? Đây cũng là một lý do để sử dụng SEM khi xử lý một số loại dữ liệu phụ thuộc nhất định, trong đó nhiều người trả lời phụ thuộc có thể mang lại kết quả dự đoán và phản ứng kết quả (ví dụ: dữ liệu nhuộm; xem Kenny, Kashy và Cook, 2006,

(3) Mô hình hóa các giả định, thay vì đưa ra : Với nhiều cách tiếp cận khác để phân tích dữ liệu (ví dụ: ANOVA, tương quan, hồi quy), chúng tôi đưa ra rất nhiều giả định về các thuộc tính của dữ liệu mà chúng tôi đang xử lý - chẳng hạn như tính đồng nhất của phương sai / homoskedasticity. SEM (thường được kết hợp với cách tiếp cận biến tiềm ẩn) cho phép người dùng thực sự mô hình hóa các tham số phương sai đồng thời bên cạnh các phương tiện và / hoặc tương quan / đường hồi quy. Điều này có nghĩa là người dùng có thể bắt đầu lý thuyết hóa và kiểm tra giả thuyết về tính biến thiên, ngoài ra còn có nghĩa là sự khác biệt / khả năng cộng hưởng, thay vì chỉ coi biến đổi là một suy nghĩ liên quan đến giả định gây phiền nhiễu.

Một giả định có thể kiểm chứng khác, khi so sánh các mức trung bình của nhóm trên một số biến, là liệu biến đó có thực sự cùng ý nghĩa với từng nhóm hay không - được gọi là bất biến đo lường trong tài liệu SEM (xem Vandenberg & Lance, 2000, để xem xét quá trình này ). Nếu vậy, thì so sánh về mức trung bình của biến đó là hợp lệ, nhưng nếu các nhóm có sự hiểu biết khác nhau đáng kể về cái gì đó, thì việc so sánh mức trung bình giữa các nhóm là đáng nghi ngờ. Chúng tôi thực hiện giả định đặc biệt này mọi lúc trong nghiên cứu bằng cách sử dụng so sánh nhóm.

Và sau đó, có một giả định rằng, khi bạn tính trung bình hoặc tổng điểm của vật phẩm (ví dụ: trên thước đo lo âu) để tạo ra một chỉ số tổng hợp, thì mỗi vật phẩm là một thước đo tốt như nhau của cấu trúc cơ bản (vì mỗi vật phẩm đều có trọng số như nhau trong tính trung bình / tổng hợp). SEM loại bỏ giả định này khi các biến tiềm ẩn được sử dụng, bằng cách ước tính các giá trị tải nhân tố khác nhau (sự liên kết giữa mục và biến tiềm ẩn) cho mỗi mục.

Cuối cùng, các giả định khác về dữ liệu (ví dụ: tính quy tắc), mặc dù vẫn quan trọng đối với SEM, có thể được quản lý (e..g, thông qua việc sử dụng các công cụ ước tính "mạnh mẽ", xem Finney & DiStefano, 2008) khi dữ liệu không đáp ứng tiêu chí nhất định (mức độ xiên và kurtosis thấp).

(4) Chỉ định các ràng buộc mô hình: Theo tôi, lý do lớn cuối cùng để xem xét sử dụng SEM là bởi vì nó rất dễ kiểm tra các giả thuyết cụ thể mà bạn có thể có về mô hình dữ liệu của mình, bằng cách buộc ("ràng buộc" các thuật ngữ SEM) trong một số mô hình nhất định trong mô hình của bạn để đảm nhận các giá trị cụ thể và kiểm tra xem điều đó tác động đến sự phù hợp của mô hình của bạn với dữ liệu của bạn. Một số ví dụ bao gồm: (A) ràng buộc đường hồi quy về 0, để kiểm tra xem nó có cần thiết trong mô hình hay không; (B) chứa nhiều con đường hồi quy có độ lớn bằng nhau (ví dụ: sức mạnh liên kết của một số yếu tố dự đoán gần bằng với lo âu và trầm cảm?); (C) ràng buộc các tham số đo cần thiết để đánh giá bất biến đo lường (mô tả ở trên); (D) ràng buộc một con đường hồi quy để có sức mạnh ngang nhau giữa hai nhóm khác nhau,

Các yêu cầu liên quan đến dữ liệu cho SEM là gì?

Các yêu cầu liên quan đến dữ liệu cho SEM khá khiêm tốn; bạn cần một cỡ mẫu phù hợp và để dữ liệu của bạn đáp ứng các giả định của công cụ ước tính mô hình mà bạn đã chọn (Tối đa Liklihood là điển hình).

Rất khó để đưa ra khuyến nghị một kích cỡ phù hợp cho tất cả kích thước mẫu. Dựa trên một số mô phỏng đơn giản, Little (2013) cho rằng đối với các mô hình rất đơn giản, 100-150 quan sát có thể là đủ, nhưng nhu cầu kích thước mẫu sẽ tăng lên khi các mô hình trở nên phức tạp hơn và / hoặc như độ tin cậy / hiệu lực của các biến được sử dụng trong mô hình giảm dần. Nếu độ phức tạp của mô hình là một mối quan tâm, bạn có thể xem xét phân tích các chỉ số của các biến tiềm ẩn của mình, nhưng không phải tất cả đều có trên phương pháp này (Little, Cickyham, Shahar, & Widaman, 2002). Nhưng nói chung, tất cả những thứ khác đều bằng nhau, các mẫu lớn hơn (tôi phấn đấu tối thiểu 200 trong nghiên cứu của riêng tôi) là tốt hơn.

Đối với việc đáp ứng các giả định của một công cụ ước tính đã chọn, thông thường điều này khá dễ dàng để đánh giá (ví dụ: xem xét các giá trị độ lệch và kurtosis để ước tính khả năng tối đa). Và ngay cả khi dữ liệu rời khỏi các thuộc tính giả định, một nghiên cứu có thể xem xét việc sử dụng công cụ ước tính "mạnh mẽ" (Finney & DiStefano, 2008) hoặc công cụ ước tính giả định một loại dữ liệu khác (ví dụ: công cụ ước tính phân loại, như trọng số theo đường chéo hình vuông).

Các lựa chọn thay thế cho SEM để phân tích dữ liệu?

Nếu một nhà nghiên cứu sẽ không tận dụng các lợi ích được cung cấp bởi cách tiếp cận SEM mà tôi đã nêu ở trên, tôi khuyên bạn nên sử dụng phiên bản phân tích cụ thể và dễ tiếp cận hơn của phân tích cụ thể đó (e..g, t -tests, ANOVAs, phân tích tương quan, mô hình hồi quy [bao gồm hòa giải, kiểm duyệt và mô hình quy trình có điều kiện]). Người đọc quen thuộc hơn với họ, và do đó sẽ dễ hiểu họ hơn. Thật không đáng để người đọc nhầm lẫn với những chi tiết vụn vặt của SEM nếu về cơ bản bạn đang sử dụng SEM để có hiệu quả tương tự như một phương pháp phân tích đơn giản hơn.

Lời khuyên cho các nhà nghiên cứu xem xét việc sử dụng SEM?

Đối với những người hoàn toàn mới với SEM:

  1. Nhận một văn bản SEM nền tảng toàn diện, dễ tiếp cận bằng văn bản. Tôi thích Beaujean (2014), Brown (2015; phiên bản trước đó cũng rất chắc chắn) và Little (2013; giới thiệu tổng thể tốt, mặc dù sau này tập trung đặc biệt vào các mô hình dọc).
  2. Tìm hiểu cách sử dụng lavaangói cho R(Rosseel, 2012). Cú pháp của nó dễ như cú pháp SEM có thể nhận được, chức năng của nó đủ rộng cho nhiều nhu cầu SEM của nhiều người (chắc chắn dành cho người mới bắt đầu) và hoàn toàn miễn phí. Cuốn sách Beaujean giới thiệu đồng thời tuyệt vời về SEM và lavaangói.
  3. Tư vấn / sử dụng CrossValidated và StacksOverflow thường xuyên. Những điều bất ngờ có thể xảy ra khi lắp các mô hình SEM, và rất có thể, nhiều điều kỳ lạ bạn có thể gặp đã được mô tả và gây rắc rối trên Stacks.
  4. Như Herik chỉ ra, lưu ý rằng chỉ vì bạn đang chỉ định một mô hình ngụ ý các mối liên hệ nhân quả, điều đó không có nghĩa là SEM giúp thiết lập quan hệ nhân quả trong một nghiên cứu cắt ngang / không thử nghiệm. Ngoài ra, hoàn toàn đáng để xem xét việc sử dụng SEM để phân tích dữ liệu từ các thiết kế theo chiều dọc và / hoặc thử nghiệm.

Và đối với những người bắt đầu thực sự sử dụng SEM:

  1. Tại một thời điểm nào đó, bạn sẽ bị cám dỗ chỉ định phần dư tương quan willy-nilly, trong nỗ lực cải thiện sự phù hợp của mô hình của bạn. Đừng. Ít nhất không phải không có một lý do tiên nghiệm tốt . Thường xuyên hơn không, một mẫu lớn hơn, hoặc một mô hình đơn giản hơn là phương pháp chữa bệnh.
  2. Tránh sử dụng phương pháp nhận dạng biến đánh dấu cho các biến tiềm ẩn (nghĩa là sửa lỗi hệ số đầu tiên tải thành 1). Nó đặc quyền chỉ báo là chỉ báo "tiêu chuẩn vàng" của biến tiềm ẩn của bạn, khi trong hầu hết các trường hợp, không có lý do nào để cho rằng đây là trường hợp. Xin lưu ý rằng đây là cài đặt nhận dạng mặc định trong hầu hết các chương trình.

Tài liệu tham khảo

Beaujean, AA (2014). Mô hình biến tiềm ẩn bằng R: Hướng dẫn từng bước . New York, NY: Routledge.

Nâu, TA (2015). Phân tích nhân tố khẳng định cho các nhà nghiên cứu ứng dụng (ấn bản 2). New York, NY: Nhà xuất bản Guilford.

Finney, SJ, & DiStefano, C. (2008). Dữ liệu không bình thường và phân loại trong mô hình phương trình cấu trúc. Trong GR Hancock & RD Mueller (Eds.), Mô hình hóa phương trình cấu trúc: Một khóa học thứ hai (trang 269-314). Thời đại xuất bản thông tin.

Kenny, DA, Kashy, DA, & Cook, WL (2006). Phân tích dữ liệu Dyadic . New York, NY: Nhà xuất bản Guilford.

Ít, TD (2013). Mô hình phương trình cấu trúc dọc . New York, NY: Nhà xuất bản Guilford.

Little, TD, Cickyham, WA, Shahar, G., & Widaman, KF (2002). Để bưu kiện hoặc không bưu kiện: Khám phá câu hỏi, cân nhắc công đức. Mô hình phương trình cấu trúc , 9 , 151-173.

Rosseel, Y. (2012). lavaan: Một gói R cho mô hình phương trình cấu trúc. Tạp chí phần mềm thống kê , 48 (2), 1-36.

Vandenberg, RJ, & Lance, CE (2000). Một đánh giá và tổng hợp các tài liệu bất biến đo lường: Gợi ý, thực hành và khuyến nghị cho các nhà nghiên cứu tổ chức. Phương pháp nghiên cứu tổ chức , 3 , 4-70.


1
+1 câu trả lời hay. Tôi đang mong chờ những đóng góp khác của bạn!
Momo

1
+1 Câu trả lời tuyệt vời. Tôi đồng ý với hầu hết những gì bạn nói. Một điểm tiếp theo: Tôi không nghĩ SEM có sức mạnh thống kê lớn hơn bởi vì nó đang ước tính mối quan hệ giữa các biến tiềm ẩn. Nói chung, tôi sẽ nghĩ rằng nếu bất cứ điều gì SEM đưa ra một nguồn lỗi bổ sung. Do đó, có lỗi thông thường trong việc ước tính biến quan sát và lỗi bổ sung trong việc ước tính phương sai lỗi hoặc các yếu tố khác của cấu trúc tiềm ẩn.
Jeromy Anglim

Tôi sẽ duy trì tương ứng rằng SEM, bằng cách mô hình hóa lỗi trong các yếu tố duy nhất, trên thực tế, làm tăng sức mạnh Điều này có thể được chứng minh dễ dàng nhất, tôi nghĩ, bằng cách so sánh một mô hình SEM về sự khác biệt nhóm trong phương tiện tiềm ẩn với một mô hình về sự khác biệt trung bình quan sát được của cùng một dữ liệu. Nếu bạn chạy SEM bằng cách sử dụng phương pháp mã hóa hiệu ứng (xem Little, Slegers, & Card, 2006), phương tiện tiềm ẩn của bạn cho mỗi nhóm sẽ có cùng giá trị như phương tiện quan sát được của bạn. Nhưng phương sai cho mỗi nhóm trong mô hình SEM sẽ nhỏ hơn so với quan sát được, cho thấy kích thước hiệu ứng lớn hơn dễ phát hiện hơn.
jsakaluk

Tôi nhận ra nhận xét trên có thể không phải là cách tốt nhất để đáp lại mối quan tâm của bạn; nếu bạn hỏi một câu hỏi riêng về SEM và bật nguồn CV, tôi rất vui lòng đăng câu trả lời công phu hơn, với một số ví dụ đầu ra có thể hữu ích.
jsakaluk

12

Tuyên bố miễn trừ trách nhiệm: Tôi coi mình là một nhà tâm lý học kinh nghiệm với trọng tâm là thực nghiệm. Do đó, tôi có một sự khó chịu tự nhiên với các thiết kế như thế này.

Để trả lời câu hỏi thứ nhất và thứ hai của bạn: Tôi nghĩ đối với một thiết kế như thế này là SEM hoặc, tùy thuộc vào số lượng biến có liên quan, phân tích hòa giải hoặc kiểm duyệt là cách xử lý dữ liệu tự nhiên. Tôi không có ý tưởng tốt nào khác để giới thiệu.

Đối với câu hỏi thứ ba của bạn: Tôi nghĩ rằng lợi thế chính với một thiết kế như thế này là nhược điểm chính. Cụ thể là bạn (đã cung cấp đủ các biến) sẽ tìm thấy kết quả quan trọng. Câu hỏi là, làm thế nào bạn giải thích những kết quả này.

Đó là, bạn có thể xem xét rất nhiều giả thuyết (một số ít lấy cảm hứng từ các tài liệu liên quan) mà bạn có thể sẽ tìm thấy một cái gì đó có ý nghĩa (không phải theo nghĩa đen của việc từ chối SEM) sẽ được giải thích theo nghĩa tâm lý. Do đó, lời khuyên của tôi cho bất cứ ai làm điều này sẽ có hai mặt:

  1. Nhấn mạnh vấn đề với giải thích nguyên nhân của các thiết kế này. Tôi không phải là một chuyên gia trong vấn đề này nhưng biết rằng, một thiết kế cắt ngang hoàn toàn khó có thể được giải thích theo nguyên nhân, độc lập với cách nghe có vẻ hợp lý. Các thiết kế tiên tiến hơn như thiết kế pnael chéo hoặc những thứ như thế này là cần thiết cho các can thiệp nhân quả. Tôi nghĩ rằng công việc của Shadish, Cook & Campbell (hoặc ít nhất là một số trong số họ) là một nguồn tài nguyên tốt để thảo luận thêm về các chủ đề này.
  2. Nhấn mạnh trách nhiệm cá nhân và đạo đức khoa học. Nếu bạn thấy rằng ý tưởng ban đầu của bạn không được dữ liệu hỗ trợ, thì đó là bước tiếp theo tự nhiên để kiểm tra dữ liệu hơn nữa. Tuy nhiên, bạn sẽ không bao giờ dựa vào HARKing (Giả thuyết sau khi kết quả được biết đến; Kerr, 1998 , xem thêm Maxwell, 2004 ). Đó là, bạn nên nhấn mạnh rằng có một ranh giới mỏng giữa một sự thích nghi hợp lý của các giả thuyết của bạn được cung cấp dữ liệu và chọn kết quả quan trọng.

1
và Bernd: Ditto! Từ viết tắt tuyệt vời và tôi hy vọng nó bắt kịp.
rolando2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.