Tổng điểm đánh giá so với điểm yếu tố ước tính?


12

Tôi rất muốn nhận được đề xuất về thời điểm sử dụng " điểm yếu tố " so với tổng điểm đơn giản khi xây dựng thang đo. Tức là "Tinh chỉnh" hơn các phương pháp "không tinh chế" để ghi một yếu tố. Từ DiStefano et al. (2009; pdf ), nhấn mạnh thêm:

Có hai lớp chính của phương pháp tính điểm yếu tố: tinh chế và không tinh chế. Các phương pháp không tinh chế là các thủ tục tích lũy tương đối đơn giản để cung cấp thông tin về vị trí của các cá nhân trong phân phối nhân tố. Sự đơn giản cho vay một số tính năng hấp dẫn, đó là, các phương pháp không tinh chỉnh vừa dễ tính toán vừa dễ giải thích. Các phương pháp tính toán tinh chỉnh tạo ra các điểm yếu tố bằng cách sử dụng các phương pháp kỹ thuật và tinh vi hơn. Chúng chính xác và phức tạp hơn các phương pháp không tinh chế và cung cấp các ước tính là điểm số được tiêu chuẩn hóa.

Theo tôi, nếu mục tiêu là tạo ra một thang đo có thể được sử dụng trong các nghiên cứu và cài đặt, thì một tổng đơn giản hoặc điểm trung bình của tất cả các mục tỷ lệ có ý nghĩa. Nhưng hãy nói rằng mục tiêu là đánh giá hiệu quả điều trị của một chương trình và sự tương phản quan trọng nằm trong nhóm điều trị với nhóm đối chứng. Có bất kỳ lý do tại sao chúng ta có thể thích điểm yếu tố để tính tổng hoặc trung bình?

Để cụ thể về các lựa chọn thay thế, hãy lấy ví dụ đơn giản này:

library(lavaan)
library(devtools)

# read in data from gist ======================================================
# gist is at https://gist.github.com/ericpgreen/7091485
# this creates data frame mydata
  gist <- "https://gist.github.com/ericpgreen/7091485/raw/f4daec526bd69557874035b3c175b39cf6395408/simord.R"
  source_url(gist, sha1="da165a61f147592e6a25cf2f0dcaa85027605290")
  head(mydata)
# v1 v2 v3 v4 v5 v6 v7 v8 v9
# 1  3  4  3  4  3  3  4  4  3
# 2  2  1  2  2  4  3  2  1  3
# 3  1  3  4  4  4  2  1  2  2
# 4  1  2  1  2  1  2  1  3  2
# 5  3  3  4  4  1  1  2  4  1
# 6  2  2  2  2  2  2  1  1  1

# refined and non-refined factor scores =======================================
# http://pareonline.net/pdf/v14n20.pdf

# non-refined -----------------------------------------------------------------
  mydata$sumScore <- rowSums(mydata[, 1:9])
      mydata$avgScore <- rowSums(mydata[, 1:9])/9
  hist(mydata$avgScore)

# refined ---------------------------------------------------------------------
  model <- '
            tot =~ v1 + v2 + v3 + v4 + v5 + v6 + v7 + v8 + v9
           '
  fit <- sem(model, data = mydata, meanstructure = TRUE,
             missing = "pairwise", estimator = "WLSMV")
  factorScore <- predict(fit)
  hist(factorScore[,1])

Tôi đã xóa "các can thiệp" khỏi tiêu đề để làm cho câu hỏi nghe có vẻ tổng quát hơn và bởi vì các can thiệp có thể không có ý nghĩa cụ thể, duy nhất về sự khác biệt giữa hai loại tính toán xây dựng. Xin vui lòng, bạn có thể quay lại chỉnh sửa của tôi nếu bạn không đồng ý.
ttnphns

1
They are more exactSự nhấn mạnh được thêm vào này sẽ không làm chúng ta mất tập trung vào thực tế là ngay cả điểm yếu tố cũng không thể tránh khỏi ("không xác định").
ttnphns

Xem thêm câu hỏi tương tự này: stats.stackexchange.com/q/31967 / 3277 .
ttnphns

Tôi nghĩ rằng "các can thiệp" có liên quan như một trường hợp sử dụng đặc biệt, nhưng nó không cần phải có trong tiêu đề. Tôi đã nhấn mạnh vấn đề chính trong câu hỏi. Đối với việc nhấn mạnh vào "chính xác hơn", tôi tò mò muốn biết suy nghĩ về điểm này do quan sát bạn đưa ra về điểm số yếu tố không xác định. Cảm ơn các liên kết đến các câu hỏi khác.
Eric Green

"more exact". Trong số các yếu tố được tính toán tuyến tính, phương pháp hồi quy là "chính xác" nhất theo nghĩa "tương quan nhất với các giá trị yếu tố thực không xác định". Vì vậy, có, chính xác hơn (trong cách tiếp cận đại số tuyến tính), nhưng không hoàn toàn chính xác.
ttnphns

Câu trả lời:


6

Bản thân tôi đã vật lộn với ý tưởng này trong một số dự án hiện tại. Tôi nghĩ bạn cần phải tự hỏi những gì đang được ước tính ở đây. Nếu một mô hình một yếu tố phù hợp, thì điểm yếu tố ước tính yếu tố tiềm ẩn. Tổng thẳng hoặc giá trị trung bình của các biến số trong bảng kê khai của bạn ước tính một cái gì đó khác, trừ khi mọi quan sát đều tải bằng nhau về yếu tố và tính duy nhất cũng giống nhau. Và cái gì đó khác có lẽ không phải là một số lượng quan tâm lý thuyết lớn.

Vì vậy, nếu một mô hình một yếu tố phù hợp, có lẽ bạn nên sử dụng điểm yếu tố. Tôi đưa ra quan điểm của bạn về sự so sánh giữa các nghiên cứu, nhưng trong một nghiên cứu cụ thể, tôi nghĩ rằng điểm số có nhiều yếu tố sẽ xảy ra với họ.

Điều thú vị là khi mô hình một yếu tố không phù hợp, bởi vì mô hình hai yếu tố áp dụng (hoặc cao hơn) hoặc do cấu trúc hiệp phương sai phức tạp hơn mô hình nhân tố dự đoán. Đối với tôi, câu hỏi đặt ra là liệu tổng các biến có liên quan đến bất cứ thứ gì có thật không. Điều này đặc biệt đúng nếu dữ liệu có nhiều chiều. Trong thực tế, điều thường xảy ra là bạn có một loạt các biến liên quan (có thể là các mục trong một cuộc khảo sát), với một hoặc hai trong số chúng khác với các biến khác. Bạn có thể nói, "xuống địa ngục với điều này", và lấy trung bình của tất cả mọi thứ, bất kể nó có nghĩa gì. Hoặc bạn có thể đi với các điểm yếu tố. Nếu bạn phù hợp với mô hình một yếu tố, điều thường xảy ra, đó là phân tích nhân tố sẽ làm giảm các biến ít hữu ích hơn (hoặc ít nhất, các biến đó thực sự thuộc về điểm yếu tố thứ hai). Trong thực tế, nó phát hiện ra chúng thuộc về một chiều không gian khác và bỏ qua chúng.

Vì vậy, tôi tin rằng điểm yếu tố có thể sắp xếp dữ liệu để cung cấp một cái gì đó khác thường hơn so với bạn bắt đầu. Nhưng tôi không có tài liệu tham khảo cho việc này và tôi vẫn đang cố gắng tìm ra công việc của riêng mình nếu tôi thích phương pháp này. Đối với tôi, mối nguy hiểm lớn là quá mức khi bạn cày điểm số vào một mô hình khác có cùng dữ liệu. Điểm số đã là câu trả lời cho một câu hỏi tối ưu hóa, vậy đâu là phần còn lại của phân tích? Tôi ghét phải suy nghĩ.

Nhưng vào cuối ngày, một tổng hoặc tổng các biến thực sự có ý nghĩa nếu một cái gì đó giống như mô hình một yếu tố không áp dụng?

Rất nhiều trong số những câu hỏi này sẽ không xuất hiện nếu mọi người thiết kế quy mô tốt hơn để bắt đầu.


Tôi đánh giá cao ý kiến ​​của bạn, @Placidia. Bạn mang lại một số sự rõ ràng trong khi nhắc nhở chúng tôi về mớ hỗn độn lớn hơn! Tôi nghĩ rằng đây là một điểm thú vị để xem xét: "Nếu mô hình nhân tố phù hợp, thì điểm yếu tố ước tính hệ số tiềm ẩn. Tổng thẳng hoặc giá trị trung bình của các biến số biểu hiện của bạn ước tính một cái gì đó khác, trừ khi mọi quan sát đều tải bằng nhau về yếu tố và tính độc đáo cũng giống nhau. Và cái gì đó khác có lẽ không phải là một số lượng lớn lợi ích lý thuyết. "
Eric Green

+1 cho một câu trả lời rất chu đáo. Một vài suy nghĩ cần thêm: 1) về khả năng so sánh giữa các nghiên cứu, điều quan trọng là phải nhận ra rằng không giống như tải thành phần - có thể thay đổi khá nhiều để đáp ứng với các biến được bao gồm / loại trừ khỏi mô hình - tải nhân tố chung là ước tính tham số. Sau đó, họ nên sao chép (trong lỗi lấy mẫu) từ nghiên cứu này sang nghiên cứu khác, và do đó, các yếu tố cũng nên được điểm. 2) Nếu bạn lo lắng về việc sử dụng điểm yếu tố, bạn có thể xem xét các chỉ số về tính quyết định và mức độ tương quan điểm yếu tố của bạn phản ánh mối tương quan tiềm ẩn ...
jsakaluk

1
... như tôi nghĩ đây là một chiến lược được thảo luận trong DiStefanno et. al. giấy để đánh giá liệu điểm yếu tố có thể được "tin cậy" hay không. Và cuối cùng là 3) nếu mục tiêu của bạn, như Placidia mô tả, là phân tích thứ gì đó phần lớn là không có chiều hướng, bạn có thể xem xét một phương pháp phân tích hai yếu tố, theo tôi hiểu, trước tiên trích ra một yếu tố phổ biến mà mọi biến số đều tải, và sau đó là trực giao các yếu tố được trích xuất cho các tập hợp con của các biến, điều này phản ánh rõ ràng các yếu tố phân biệt quan trọng nhất, vượt ra ngoài chiều kích chung buộc tất cả các biến với nhau.
jsakaluk

Placidia, trong lần chỉnh sửa cuối cùng của câu trả lời của bạn, bạn liên tục tự giới hạn bản thân bằng biểu thức one-factor model. Tôi chỉ tự hỏi tại sao. Bạn đang nói rằng trong một yếu tố mô hình 2 yếu tố không estimate the latent factorcòn nữa? Tại sao vậy? Ngoài ra, làm thế nào để bạn xác định "mô hình một yếu tố" trong bối cảnh của một câu hỏi đang được phát triển (bối cảnh có khả năng của Q): là bảng câu hỏi là một yếu tố / thang đo hoặc mỗi mục được bao gồm đều được tính đúng theo một yếu tố /tỉ lệ? Xin vui lòng, bạn sẽ làm cho nó rõ ràng hơn?
ttnphns

Tôi muốn tránh sự hiểu lầm tiềm ẩn. Nếu bạn tin vào mô hình hai yếu tố, có lẽ sử dụng tổng số tóm tắt sẽ bị loại khỏi bàn. Bạn cần hai bản tóm tắt cho hai chiều trong dữ liệu. Tôi muốn làm rõ rằng câu trả lời của tôi là về việc lựa chọn giữa thống kê tóm tắt và điểm yếu tố của mô hình một yếu tố. Tôi cho rằng điểm số một yếu tố có thể hữu ích ngay cả khi mô hình sai. Đề xuất của @ jsakaluk về việc phù hợp với mô hình đa yếu tố và chọn yếu tố đầu tiên cũng có thể, và có thể tốt hơn trong một số trường hợp.
Placidia

4

Tóm tắt hoặc tính trung bình các vật phẩm được tải bởi yếu tố chung là một cách truyền thống để tính toán điểm số hội tụ (cấu trúc đại diện cho yếu tố tha). Nó là một phiên bản đơn giản nhất của "phương pháp thô" về điểm yếu tố điện toán ; điểm chính của phương pháp là sử dụng các hệ số tải làm trọng số điểm. Trong khi các phương pháp tinh chế để tính điểm sử dụng các hệ số điểm được ước tính đặc biệt (tính từ các lần tải) làm trọng số.

Câu trả lời này không phổ biến "đề xuất khi nào nên sử dụng điểm yếu tố [đã tinh chỉnh] so với tổng điểm của vật phẩm", đó là một miền rộng lớn, nhưng tập trung vào việc hiển thị một số hàm ý rõ ràng cụ thể bằng cách sử dụng một cách để tính toán cấu trúc so với cách khác đường.

Hãy xem xét một tình huống đơn giản với một số yếu tố và hai mục được tải bởi nó. Theo chú thích 1 ở đây giải thích cách tính điểm yếu tố hồi quy, hệ số điểm yếu tố b 1b 2 để tính điểm yếu tố của F đến từFb1b2F

,s1=b1r11+b2r12

,s2=b1r12+b2r22

trong đó s1 là mối tương quan giữa yếu tố và vật phẩm - hệ số tải; r 12 là mối tương quan giữa các mục. Cáchệ số b là những gì phân biệt điểm yếu tố với tổng đơn giản, không trọng số của điểm số vật phẩm. Vì, khi bạn chỉ tính tổng (hoặc trung bình), bạn cố tình đặt cả hai b s bằng nhau. Trong khi ở điểm yếu tố "tinh chế", b s nhận được từ các phương trình trên và thường không bằng nhau.s2r12bbb

Để đơn giản, và vì phân tích nhân tố thường được thực hiện trên các mối tương quan, chúng ta hãy lấy s làm tương quan, không phải hiệp phương sai. Sau đó r 11r 22 là đơn vị và có thể được bỏ qua. Sau đó,rr11r22

,b1=s2r12s1r1221

b2=s1r12s2r1221 ,

do đó b1b2=(r12+1)(s1s2)r1221.

Chúng tôi quan tâm đến sự bất bình đẳng tiềm năng này giữa các phụ thuộc vào sự bất bình đẳng giữa các tải s tương quan r 12bsr12 . Hàm được hiển thị bên dưới trên sơ đồ bề mặt và cả trên sơ đồ nhiệt.b1b2

enter image description here

enter image description here

Rõ ràng, vì các tải bằng nhau ( ) nên các hệ số b cũng bằng nhau, luôn luôn. Khi s 1 - s 2 phát triển,s1s2=0bs1s2 tăng trưởng để đáp ứng và phát triển càng nhanh thì r 12 càng lớnb1b2r12 .

b

Nhưng hãy xem xét hai tải trọng khác nhau, giả sử, s1=.70s2=.45.25

c. Nếu chúng tương quan mạnh, vật phẩm được tải yếu hơn là bản sao cơ sở của vật phẩm khác. Lý do nào để đếm chỉ số / triệu chứng yếu hơn đó trong sự hiện diện của chất thay thế mạnh hơn? Không có nhiều lý do. Và điểm yếu tố điều chỉnh cho điều đó (trong khi tổng kết đơn giản thì không). Lưu ý rằng trong bảng câu hỏi đa yếu tố, "mục được tải yếu hơn" thường là mục của một yếu tố khác, được tải cao hơn ở đó; trong khi ở yếu tố hiện tại, mặt hàng này bị hạn chế, như chúng ta thấy bây giờ, trong việc tính toán điểm yếu tố - và điều đó phục vụ nó đúng.

b. Nhưng nếu các mặt hàng, trong khi được tải như trước không bằng nhau, không tương quan mạnh mẽ, thì chúng là các chỉ số / triệu chứng khác nhau đối với chúng tôi. Và có thể được tính "hai lần", tức là chỉ cần tóm tắt. Trong trường hợp này, điểm yếu tố cố gắng tôn trọng vật phẩm yếu hơn trong phạm vi tải của nó vẫn cho phép, vì nó là hiện thân khác của yếu tố.

a. Hai mục cũng có thể được tính hai lần, tức là chỉ cần tính tổng, bất cứ khi nào chúng có mức tải tương tự, đủ cao, theo hệ số, bất kể mối tương quan giữa các mục này. (Điểm yếu tố tăng thêm trọng lượng cho cả hai mặt hàng khi chúng tương quan không quá chặt chẽ, tuy nhiên trọng lượng là bằng nhau.) Có vẻ như không hợp lý khi chúng ta thường chịu đựng hoặc thừa nhận các mặt hàng khá trùng lặp nếu tất cả chúng đều được tải mạnh. Nếu bạn không thích điều này (đôi khi bạn có thể muốn), bạn có thể tự do loại bỏ các bản sao khỏi yếu tố thủ công.

enter image description here

Vì vậy, trong việc tính toán các điểm yếu tố (được tinh chỉnh) (ít nhất là bằng phương pháp hồi quy), rõ ràng có những mưu đồ "hòa đồng / đẩy ra" giữa các biến cấu thành, ảnh hưởng của chúng đến điểm số . Các chỉ số mạnh tương đương cũng dung nạp lẫn nhau, vì các chỉ số mạnh tương đương không mạnh cũng không tương quan mạnh. "Tắt" xảy ra của một chỉ báo yếu hơn tương quan mạnh với các chỉ số mạnh hơn. Bổ sung / tính trung bình đơn giản không có mưu đồ "đẩy ra một bản sao yếu".

Hãy xem thêm này câu trả lời mà cảnh báo yếu tố về mặt lý thuyết là khá một "bản chất bên trong" hơn một bộ sưu tập tổng hoặc đống hiện tượng biểu hiện "của mình". Do đó, tổng kết một cách mù quáng các mục - không tải trọng cũng như tương quan của chúng trong tâm trí - có khả năng gây ra vấn đề. Mặt khác, yếu tố, như được ghi, có thể chỉ là một loại tổng của các mặt hàng của nó, và vì vậy mọi thứ là về một khái niệm tốt hơn về các trọng số trong tổng.


Chúng ta cũng lướt qua sự thiếu hụt của phương pháp tổng hợp hoặc tổng quát hơn và trừu tượng hơn .

ba

Hãy F i là một người trả lời tôi điểm yếu tố (ước tính giá trị) và F i là yếu tố giá trị thật của mình (trở nên xa lạ). Chúng tôi cũng biết rằng mỗi người trong số các mặt hàng X 1X 2 nạp bởi yếu tố chung (với tải trọng một 1một 2F^iiFiX1X2a1a2FUb s chúng ta có

F^i=b1X1i+b2X2i=b1(Fi+U1i)+b2(Fi+U2i)=(b1+b2)Fi+b1U1i+b2U2i

b1U1i+b2U2iF^iFiUF^Fbvar[b1U1i+b2U2i]F^FbaXF^F

abFF^

F^i=a1X1i+a2X2i= ... =(a1+a2)Fi+a1U1i+a2U2i

baaa


Cảm ơn, @ttnphns, vì đã trả lời hữu ích. Nó có ý nghĩa với tôi rằng các mặt hàng có tải trọng xấp xỉ bằng nhau chỉ có thể được tóm tắt (a). Thật không may, tôi không nghĩ rằng tôi đã từng gặp phải một tình huống trong công việc của mình, khi sử dụng thang đo hiện có được cho là không có chiều hướng, tôi thấy rằng các mặt hàng có tải trọng bằng nhau.
Eric Green

Vì vậy, tôi đặc biệt quan tâm đến lời giải thích của bạn về tình huống tải khác nhau và đề nghị kiểm tra mối tương quan giữa các mục. Tôi muốn biết liệu bạn có bất kỳ quy tắc nào cho các mối tương quan "mạnh" (c) / "không mạnh" (b) hoặc "đủ cao" trong (a) không.
Eric Green

1
Cuối cùng, tôi sẽ lưu ý rằng bối cảnh của câu hỏi này là một quy tắc kỷ luật áp đảo (ít nhất là trong tâm lý học) để sử dụng các thang đo "được xác thực" yêu cầu các khoản tiền đơn giản (trung bình) ngay cả khi quản lý thang đo cho dân số mới không theo quy tắc. Thông thường mục tiêu là so sánh mẫu chéo (ngay cả khi không chính đáng), điều này làm cho các khoản tiền đơn giản trở thành một cách tiếp cận phổ biến.
Eric Green

Nghiên cứu can thiệp là một trường hợp sử dụng thú vị trong tâm trí của tôi bởi vì sự so sánh lợi ích nằm trong mẫu. Đối với tôi, dường như chúng ta quan tâm nhiều hơn đến kích thước hiệu quả điều trị so với điểm số "thô" của các nhóm trên thước đo, đặc biệt là khi sử dụng thang đo bên ngoài dân số được sử dụng để phát triển / định mức thang đo. Nếu điểm số yếu tố "tốt hơn" trong một số tình huống, thì có vẻ đáng để bỏ qua cách tiếp cận đơn giản có lợi cho một ý nghĩa khái niệm hơn khi biết rằng cuối cùng chúng ta chỉ muốn xem xét kích thước hiệu quả điều trị.
Eric Green

1
(. tt) Use "validated" scaleskhông tự đòi hỏi khoản tiền nhất thiết phải đơn giản: nếu xác nhận là tốt (mẫu lớn đại diện, mối tương quan tốt, số lượng chính xác các yếu tố, đẹp phù hợp, vv) điểm số yếu tố tính toán (hệ số của họ) có thể được thực hiện như các bản quy phạm trọng lượng được sử dụng trong dân số mới. Về mặt này , tôi không thể thấy bất kỳ lợi thế nào trong số tiền đơn giản.
ttnphns
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.