Giả định mô hình của hồi quy bình phương nhỏ nhất một phần (PLS)


13

Tôi đang cố gắng tìm thông tin liên quan đến các giả định của hồi quy PLS (đơn ). Tôi đặc biệt quan tâm đến việc so sánh các giả định của PLS liên quan đến các hồi quy OLS. y

Tôi đã đọc / đọc lướt qua rất nhiều tài liệu về chủ đề PLS; các bài báo của Wold (Svante và Herman), Abdi và nhiều người khác nhưng không tìm thấy một nguồn thỏa đáng.

Wold et al. (2001) Hồi quy PLS: một công cụ cơ bản của hóa học không đề cập đến các giả định của PLS, nhưng nó chỉ đề cập rằng

  1. Xs không cần phải độc lập,
  2. hệ thống là một hàm của một vài biến tiềm ẩn tiềm ẩn,
  3. hệ thống sẽ thể hiện tính đồng nhất trong suốt quá trình phân tích và
  4. sai số đo trong là chấp nhận được. X

Không có đề cập đến bất kỳ yêu cầu nào của dữ liệu được quan sát hoặc phần dư của mô hình. Có ai biết một nguồn giải quyết bất kỳ điều này? Việc xem xét toán học cơ bản tương tự như PCA (với mục tiêu tối đa hóa hiệp phương sai giữa và ) là tính chuẩn tắc đa biến của một giả định? Các phần dư mô hình có cần thể hiện tính đồng nhất của phương sai không?X ( y , X )yX(y,X)

Tôi cũng tin rằng tôi đã đọc ở đâu đó rằng các quan sát không cần phải độc lập; điều này có nghĩa gì trong các nghiên cứu đo lường lặp đi lặp lại?


Các liên kết đến Wold. et al là không chính xác. Đây có phải là một trong những nó nên được? libpls.net/publication/PLS_basic_2001.pdf
emudrak

Một khách hàng đã có một bình luận của người đánh giá về một bài báo có nội dung gì đó "cho thấy bạn đã kiểm tra giả định tuyến tính". Bạn sẽ làm điều này như thế nào?
emudrak

Câu trả lời:


5

yX

Tổng quát hơn, "các giả định" là thứ mà chỉ có kết quả lý thuyết (định lý) có thể có.

yX

Hơn nữa, kết quả thực tế của hồi quy PLS phụ thuộc vào số lượng thành phần PLS được bao gồm trong mô hình, hoạt động như một tham số chính quy. Nói về bất kỳ giả định nào chỉ có ý nghĩa nếu quy trình chọn tham số này được chỉ định hoàn toàn (và thường thì không). Vì vậy, tôi không nghĩ rằng có bất kỳ kết quả tối ưu nào cho PLS, điều đó có nghĩa là hồi quy PLS không có giả định. Tôi nghĩ điều tương tự cũng đúng với bất kỳ phương pháp hồi quy bị phạt nào khác như hồi quy thành phần chính hoặc hồi quy sườn.

Cập nhật: Tôi đã mở rộng lập luận này trong câu trả lời của mình về các giả định của hồi quy sườn núi và cách kiểm tra chúng?

Tất nhiên, vẫn có thể có các quy tắc nói rằng khi hồi quy PLS thể hữu ích và khi nào thì không. Xin vui lòng xem câu trả lời của tôi được liên kết ở trên cho một số cuộc thảo luận; các học viên giàu kinh nghiệm của PLSR (tôi không phải là một trong số họ) chắc chắn có thể nói nhiều hơn về điều đó.


Điều gì về tính quy tắc và tính độc lập của lấy mẫu?
WCMC

3

Rõ ràng, PLS không đưa ra các giả định "cứng" về phân phối chung các biến của bạn. Điều này có nghĩa là bạn phải cẩn thận để chọn số liệu thống kê kiểm tra phù hợp (Tôi cho rằng sự thiếu phụ thuộc vào phân phối biến này phân loại PLS là một kỹ thuật không tham số). Gợi ý tôi tìm thấy cho các số liệu thống kê phù hợp là 1) sử dụng r bình phương cho các biến tiềm ẩn phụ thuộc và 2) phương pháp lấy mẫu lại để đánh giá tính ổn định của các ước tính.

Sự khác biệt chính giữa OLS / MLS và PLS là trước đây thường sử dụng ước lượng khả năng tối đa của các tham số dân số để dự đoán mối quan hệ giữa các biến, trong khi PLS ước tính giá trị của các biến cho dân số thực để dự đoán mối quan hệ giữa các nhóm biến (bằng cách liên kết các nhóm dự đoán / các biến trả lời với các biến tiềm ẩn).

Tôi cũng quan tâm đến việc xử lý các thử nghiệm được nhân rộng / lặp đi lặp lại, cụ thể là các thử nghiệm đa yếu tố, tuy nhiên tôi không chắc chắn cách tiếp cận điều này bằng PLS.

Sổ tay về các ô vuông nhỏ nhất: Các khái niệm, phương pháp và ứng dụng (trang 659, phần 28.4)

Wold, H. 2006. Đặc điểm kỹ thuật dự đoán. Bách khoa toàn thư về khoa học thống kê. 9.

http://www.rug.nl/staff/tkdijkstra/latentvariablesandindices.pdf (trang 4 & 5)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.