Sự khác biệt giữa hồi quy PLS và mô hình hóa đường dẫn PLS. Phê bình của PLS


11

Câu hỏi này đã được hỏi ở đây nhưng không ai đưa ra một câu trả lời hay. Vì vậy, tôi nghĩ rằng đó là một ý tưởng tốt để đưa nó lên một lần nữa và tôi cũng muốn thêm một số ý kiến ​​/ câu hỏi.

  • Câu hỏi đầu tiên là sự khác biệt giữa "mô hình hóa đường dẫn PLS" và "hồi quy PLS" là gì? Để làm cho nó tổng quát hơn, mô hình phương trình cấu trúc (SEM), mô hình đường dẫn và hồi quy là gì? Theo hiểu biết của tôi, hồi quy tập trung nhiều hơn vào dự đoán trong khi SEM tập trung vào mối quan hệ giữa phản ứng và dự đoán và mô hình hóa đường dẫn là trường hợp đặc biệt của SEM?

  • Câu hỏi thứ hai của tôi là PLS đáng tin cậy như thế nào? Gần đây, nó đã chịu nhiều chỉ trích như được nhấn mạnh trong Rönkkö et al. 2016Rönkkö et al. Năm 2015 dẫn đến việc từ chối các bài báo dựa trên PLS trên các tạp chí cấp cao như Tạp chí Quản lý hoạt động ( đây là ghi chú từ biên tập viên tạp chí):

    Chúng tôi đang từ chối thực tế tất cả các bản thảo dựa trên PLS, bởi vì chúng tôi đã kết luận rằng PLS đã không ngoại lệ cách tiếp cận mô hình sai trong các loại mô hình mà các nhà nghiên cứu OM sử dụng .

    Tôi nên lưu ý lĩnh vực của tôi là quang phổ, không phải quản lý / tâm lý cũng như thống kê. Trong các bài viết được liên kết ở trên, các tác giả đang nói nhiều hơn về PLS như một phương pháp SEM, nhưng đối với tôi, sự chỉ trích của họ cũng có thể áp dụng cho hồi quy PLS.


Liên kết của bạn là tất cả đằng sau paywalls.
Jeremy Miles

bạn hoàn toàn đúng! và tôi xin lỗi, tôi có các tệp PDF nhưng tôi không chắc mình có thể tải lên hoặc chia sẻ hay không. Khoa học nên miễn phí :)
Ress

Hồi quy PLS được giải thích và thảo luận khá chi tiết trong stats.stackexchange.com/questions/179733 . Thật không may, tôi không biết gì về "mô hình đường dẫn".
amip

Tôi nghĩ rằng "mô hình hóa đường dẫn" chỉ là một tên gọi khác của SEM
rep_ho

Từ bài báo năm 2016: "Hầu hết các văn bản giới thiệu về PLS đều đề cập đến mục đích của các trọng số, cho rằng PLS là SEM và do đó nó phải cung cấp lợi thế về hồi quy với vật liệu tổng hợp (ví dụ: Gefen et al., 2011); thường không chỉ ra một cách rõ ràng rằng chính PLS cũng chỉ đơn giản là hồi quy với vật liệu tổng hợp. " là sai lệch. Lực đẩy chính của lập luận tôi có thể thấy nếu các tác giả khẳng định rằng SEM phải là một cấu trúc lý thuyết thuần túy và họ đã coi thường các phương trình cấu trúc có nguồn gốc thực nghiệm. Nhưng PLS thực hiện các phương trình "có cấu trúc" thông qua hiệp phương sai.
ReneBt

Câu trả lời:


8

Câu hỏi đầu tiên là sự khác biệt giữa "mô hình hóa đường dẫn PLS" và "hồi quy PLS" là gì?

Không, chúng là từ đồng nghĩa.

Để làm cho nó tổng quát hơn, mô hình phương trình cấu trúc (SEM), mô hình đường dẫn và hồi quy là gì? Theo hiểu biết của tôi, hồi quy tập trung nhiều hơn vào dự đoán trong khi SEM tập trung vào mối quan hệ giữa phản ứng và dự đoán và mô hình hóa đường dẫn là trường hợp đặc biệt của SEM?

SEM là một hình thức hồi quy. Hồi quy là bất kỳ phương thức nào tương quan với các biến độc lập và phụ thuộc và bao gồm các phương thức sử dụng nhiều biến được xử lý như các thực thể riêng biệt. SEM đặc biệt sử dụng các mối quan hệ toán học giữa các biến để ràng buộc mô hình cuối cùng, trong trường hợp PLS, đây là hiệp phương sai. Hiểu biết của tôi là mô hình hóa đường dẫn là một miền - (không phải của tôi, tôi là một nhà quang phổ như bạn) thuật ngữ cụ thể.

Câu hỏi thứ hai của tôi là PLS đáng tin cậy như thế nào? Gần đây, nó đã chịu nhiều chỉ trích như được nhấn mạnh trong Rönkkö et al. 2016 và Rönkkö et al. 2015

Một phản bác tuyệt vời được tìm thấy trong Henseler et al. Niềm tin và thực tế chung 2013 về PLS . Một mối quan tâm chính cho Rönkkö et al. là PLS đã không thực hiện tuyệt vời trong một số tình huống giả định một yếu tố tiềm ẩn phổ biến. PLS trên thực tế được thiết kế để xử lý nhiều yếu tố tiềm ẩn, một tình huống phổ biến hơn nhiều trong thế giới thực.

Làm thế nào đáng tin cậy? Đối với quang phổ, nó là một công cụ tuyệt vời nhưng cũng có những hạn chế. Nó có nguy cơ quá mức vì nó có thể xây dựng các mô hình phức tạp thu hút sự đóng góp từ nhiều yếu tố cơ bản. Vì lý do này, nó cần phải được sử dụng cẩn thận và xác nhận bên ngoài thích hợp là điều cần thiết, nhưng sau đó những cảnh báo này áp dụng cho tất cả các công cụ xây dựng mô hình. Tôi làm việc chủ yếu trên các bộ dữ liệu trong thế giới thực trong 2 thập kỷ và tôi không gặp phải bất kỳ tập dữ liệu thử nghiệm nào chỉ có một yếu tố chung làm cơ sở cho biến phụ thuộc (không dựa trên dữ liệu cũng như lý thuyết khoa học).


1
+1 mặc dù tôi muốn câu trả lời này có nhiều chi tiết hơn về Ronkko et al. vs Henseler et al. bất đồng ý kiến. Tôi hoàn toàn không phải là một nhà quang phổ học nhưng tôi có một sự hiểu biết tương đối tốt về PLS như là một phương pháp chính quy cho hồi quy tuyến tính (đó là cách nó được trình bày trong The Elements of Statistics Learning của Hastie et al.). Tôi nghĩ nó được gọi là PLS1 trong hóa học. Ở đây "hiệu suất" liên quan đến lỗi tái cấu trúc, người ta có thể sử dụng xác thực chéo để chọn cường độ chính quy, v.v ... Đây là một cài đặt rất quen thuộc với bất kỳ ai gặp phải hồi quy sườn hoặc PCR hoặc bất cứ điều gì tương tự.
amip

[cont.] Tôi cũng biết về PLS2 với nhiều biến phụ thuộc, nhưng tôi không chắc mức độ thường xuyên sử dụng của nó. Đồng thời, từ việc cố gắng hiểu những gì Ronkko et al. có nghĩa là, dường như trọng tâm của "SEM" chỉ liên quan đến nhiều X với nhiều Y (có phải là PLS2 không?) và có lẽ nhiều hơn trong việc diễn giải mối quan hệ giữa X và Y thay vì dự đoán về Y như vậy. Tôi thậm chí không chắc ý nghĩa của "hiệu suất" là gì và tôi không biết họ thích sử dụng cái gì thay vì PLS khi họ chỉ trích PLS.
amip

Cảm ơn cả ReneBT và amip. Tôi đã đăng câu hỏi này lên Reddit tại đây và ai đó (soumya_ray) đã trả lời rằng hồi quy và SEM về cơ bản là khác nhau. Cô không giải thích về sự khác biệt kỹ thuật. Btw, câu trả lời của cô ấy chống lại những gì bạn nói (câu trả lời của bạn có ý nghĩa với tôi).
Ress

Btw, tôi thực hiện lựa chọn ban nhạc bằng PLS. Tôi xác nhận quan điểm của bạn về hiệu suất PLS, mặc dù nó có thể dẫn đến dự đoán tốt (cả về kiểm tra và hiệu chuẩn) nhưng mô hình có thể sai về cơ bản hoặc ít nhất là rất khó diễn giải vì nó chọn các yếu tố dự đoán là các biến quan trọng không liên quan đến biến phản ứng.
Ress

Một nhận xét thêm về các vấn đề chính được các tác giả nêu ra là "Thuật toán PLS do đó tạo ra các trọng số làm tăng mối tương quan giữa các vật liệu tổng hợp liền kề so với vật liệu tổng hợp có trọng số đơn vị được sử dụng làm điểm bắt đầu bằng cách sử dụng bất kỳ mối tương quan nào trong dữ liệu, nhưng điều này không không đảm bảo thành tích của bất kỳ tối ưu toàn cầu nào ". Là một mối quan tâm hợp lệ, tóm lại, ý nghĩa của nó là mô hình sẽ chỉ áp dụng cho các quần thể có cùng cấu trúc hiệp phương sai, điều này không làm cho PLS không hợp lệ, nhưng có nghĩa là người ta phải xây dựng và sử dụng mô hình một cách cẩn thận.
ReneBt
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.