Cách xử lý chính xác nhiều điểm dữ liệu cho mỗi đối tượng


10

Tôi hiện đang tranh luận với ai đó về cách xử lý chính xác dữ liệu với nhiều phép đo cho từng đối tượng. Trong trường hợp này, dữ liệu được thu thập cho từng đối tượng trong một thời gian ngắn cho các điều kiện khác nhau trong từng đối tượng. Tất cả các phép đo thu thập chính xác cùng một biến, chỉ là nhiều.

Một tùy chọn bây giờ là chỉ nhóm dữ liệu theo điều kiện và không quan tâm rằng nhiều điểm dữ liệu đến từ một chủ đề. Tuy nhiên, các điểm dữ liệu từ mỗi đối tượng có thể không hoàn toàn độc lập.

Cách khác là, trước tiên, lấy giá trị trung bình của tất cả các phép đo cho từng điều kiện từ mỗi đối tượng và sau đó so sánh các phương tiện. Tuy nhiên, điều này có thể sẽ ảnh hưởng đến tầm quan trọng, vì trong phân tích cuối cùng, nó không được tính đến, rằng phương tiện có ít lỗi hơn.

Làm thế nào bạn có thể phân tích chính xác dữ liệu đó? Đây có phải là cách nào đó được quan tâm trong SPSS? Về nguyên tắc, có thể tính toán tỷ lệ lỗi khi tính giá trị trung bình và hơn là xem xét điều này trong phân tích cuối cùng, nhưng tôi không đoán rằng SPSS bằng cách nào đó thực hiện phép tính này sau lưng tôi.


1
Đây có phải là một thiết kế biện pháp lặp đi lặp lại sao cho mỗi đối tượng chạy trong tất cả, hoặc nhiều điều kiện? Hoặc, nó chỉ là một nhóm độc lập, hoặc các biện pháp, thiết kế trong đó mỗi đối tượng ở trong một điều kiện?
Giăng

Trong thiết kế này mỗi đối tượng chạy trong mọi điều kiện. Tuy nhiên, có một số điểm dữ liệu, phải bị từ chối, vì các đối tượng thất bại trong nhiệm vụ trong tầm tay. Không chắc là một chủ đề sẽ thất bại ở tất cả các nhiệm vụ cho một điều kiện duy nhất (có khoảng 40 lần lặp lại cho mỗi điều kiện), vì vậy nhiều khả năng mỗi đối tượng sẽ có điểm dữ liệu cho tất cả các điều kiện.
LiKao

Câu trả lời:


9

Sẽ là vi phạm tính độc lập khi "nhóm dữ liệu theo điều kiện và không quan tâm rằng nhiều điểm dữ liệu đến từ một chủ đề". Vì vậy, đó là một không đi. Một cách tiếp cận là "lấy giá trị trung bình của tất cả các phép đo cho từng điều kiện từ mỗi đối tượng và sau đó so sánh các phương tiện". Bạn có thể làm theo cách đó, bạn sẽ không vi phạm tính độc lập, nhưng bạn đang mất một số thông tin trong tổng hợp có nghĩa là cấp độ chủ đề.

Trên mặt của nó, điều này nghe giống như một thiết kế hỗn hợp với các điều kiện giữa các đối tượng và nhiều khoảng thời gian được đo trong các đối tượng. Tuy nhiên, điều đó đặt ra câu hỏi, tại sao bạn thu thập dữ liệu tại nhiều thời điểm? Là tác động của thời gian, hay sự tiến triển của một biến theo thời gian dự kiến ​​sẽ khác nhau giữa các điều kiện? Nếu câu trả lời là có cho một trong những câu hỏi đó, sau đó đưa ra cấu trúc của dữ liệu, tôi sẽ mong đợi rằng điều bạn quan tâm là một ANOVA hỗn hợp. ANOVA hỗn hợp sẽ phân vùng phương sai chủ thể ra khỏi SSTotal "phía sau lưng" như ban đầu. Nhưng việc phân vùng đó có giúp bạn kiểm tra các điều kiện giữa các đối tượng hay không phụ thuộc vào một số yếu tố khác.

Dù sao, trong Phân tích SPSS / PASW 18 -> Mô hình tuyến tính tổng quát -> Các biện pháp lặp lại. Bạn sẽ có một hàng cho mỗi đối tượng và một cột cho mỗi điểm thời gian cũng như một hàng làm định danh điều kiện của chúng. Mã định danh điều kiện sẽ đi vào phần "giữa" và các biện pháp lặp lại sẽ được quan tâm khi bạn xác định hệ số đo lặp lại.


Ok, đây là những gì tôi đã nghĩ. Nhiều điểm dữ liệu cho mỗi điều kiện được thu thập vì hai lý do. Một là dữ liệu nên đáng tin cậy hơn theo cách này. Lý do khác là, một số điểm dữ liệu phải bị loại bỏ (các đối tượng không tuân theo hướng dẫn chính xác mọi lúc). Các điều kiện là hoàn toàn trong các đối tượng, vì vậy chúng tôi không có một mong muốn hỗn hợp trong trường hợp này cả. Thật không may, một biện pháp lặp đi lặp lại là không thể, vì chúng ta có khoảng 40 lần lặp lại cho mỗi điều kiện trong mỗi môn học. Tuy nhiên, số lượng lặp lại cao có nghĩa là, chúng tôi mất rất nhiều thông tin khi sử dụng trung bình.
LiKao

Sau đó, tôi đề nghị câu trả lời của John. Một mô hình hỗn hợp có khả năng thích hợp hơn. Điều đó có thể mô hình hóa cả giá trị trung bình và độ biến thiên trong từng đối tượng và tôn trọng lồng nhau. Một vấn đề với phân tích như vậy là mức độ tự do 'chính xác' không rõ ràng và do đó các ngưỡng cho ý nghĩa thống kê cũng không rõ ràng. Ngược lại với mã do John cung cấp, tôi khuyên bạn nên điều chỉnh độ dốc ngẫu nhiên cho hiệu ứng điều kiện của bạn (các đối tượng khác nhau hiển thị các hiệu ứng khác nhau). Tôi đã thấy một số mô phỏng đề xuất không làm như vậy có thể làm tăng tỷ lệ lỗi Loại I của bạn.
russellpierce

4

Thiết kế các biện pháp lặp đi lặp lại là cách truyền thống để xử lý việc này, như drknexus đề cập. Khi thực hiện loại phân tích đó, bạn phải tổng hợp thành một điểm / điều kiện / môn học. Nó nhạy cảm với vi phạm các giả định về tính hình cầu và các vấn đề khác. Tuy nhiên, kỹ thuật hiện đại hơn là sử dụng mô hình đa cấp hoặc hiệu ứng hỗn hợp tuyến tính. Sử dụng kỹ thuật này bạn không tổng hợp dữ liệu. Có một số phương pháp điều trị này có sẵn nhưng hiện tại tôi không biết hướng dẫn cơ bản tốt nhất. Baayen (2008) Chương 7 là tốt. Pinheiro & Bates (2000) rất hay nhưng từ âm thanh của mọi thứ hãy làm theo lời khuyên của họ trong phần giới thiệu và đọc các bit được đề xuất cho người mới bắt đầu.

Nếu bạn muốn nhận được kết quả kiểu ANOVA, giả sử tất cả dữ liệu của bạn ở định dạng dài (một dòng / điểm dữ liệu) và bạn có các cột biểu thị chủ đề, phản hồi (y) và biến điều kiện (x), bạn có thể thử nhìn vào một cái gì đó như thế này trong R (đảm bảo gói lme4 được cài đặt).

library(lme4)
dat <- read.table('myGreatData.txt', header = TRUE)
m <- lmer( y ~ x + (1|subject), data = dat)
summary(m)
anova(m)

Tất nhiên bạn có thể có nhiều cột biến điều kiện hơn, có thể tương tác. Sau đó, bạn có thể thay đổi lệnh lmer thành một cái gì đó như ...

m <- lmer( y ~ x1 * x2 + (1|subject), data = dat)

(BTW, tôi tin rằng việc không tổng hợp trong các biện pháp lặp đi lặp lại để tăng sức mạnh là một ngụy biện chính thức. Có ai còn nhớ tên không?)


Tôi nghĩ rằng sai lầm của việc không tổng hợp và sử dụng df từ số lượng phản hồi thay vì số lượng đối tượng là vi phạm độc lập. Ngoài ra, (tôi nghĩ) có thể nghĩ đến việc suy luận ở mức độ phản hồi của từng mục riêng lẻ cho một nhóm đối tượng cố định.
russellpierce
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.