Là một công cụ dự đoán với phương sai lớn hơn có tốt hơn không?


13

Tôi có một câu hỏi khái niệm "thống kê cơ bản". Là một sinh viên, tôi muốn biết liệu tôi có nghĩ về điều này hoàn toàn sai không và tại sao, nếu vậy:

Giả sử tôi đang cố gắng xem xét mối quan hệ giữa "các vấn đề quản lý tức giận" và nói ly hôn (có / không) trong hồi quy logistic và tôi có tùy chọn sử dụng hai điểm quản lý tức giận khác nhau - cả hai đều là 100.
Điểm 1 đến từ công cụ đánh giá câu hỏi 1 và sự lựa chọn khác của tôi; điểm 2 đến từ một bảng câu hỏi khác nhau. Theo giả thuyết, chúng ta có lý do để tin từ công việc trước đây rằng các vấn đề quản lý tức giận làm phát sinh ly hôn.
Nếu, trong mẫu 500 người của tôi, phương sai của điểm 1 cao hơn nhiều so với điểm 2, có lý do nào để tin rằng điểm 1 sẽ là điểm tốt hơn để sử dụng làm công cụ dự đoán ly hôn dựa trên phương sai của nó không?

Đối với tôi, điều này theo bản năng có vẻ đúng, nhưng nó là như vậy?


Câu hỏi thú vị, tôi tin rằng câu trả lời của Whub giải thích nó hoàn toàn tốt. Câu trả lời đầu tiên của tôi cho câu hỏi là: 'phương sai gia tăng không đòi hỏi thông tin phân biệt đối xử cao hơn'.
Zhubarb

Câu trả lời:


11

Một vài điểm nhanh:

  • Phương sai có thể được tăng hoặc giảm tùy ý bằng cách áp dụng một thang đo khác cho biến của bạn. Nhân một thang đo với một hằng số lớn hơn một sẽ làm tăng phương sai, nhưng không thay đổi khả năng dự đoán của biến.
  • Bạn có thể nhầm lẫn phương sai với độ tin cậy. Tất cả những thứ khác đều bằng nhau (và giả sử rằng có ít nhất một số dự đoán điểm thực), làm tăng độ tin cậy mà bạn đo được khi xây dựng sẽ tăng sức mạnh dự đoán của nó. Kiểm tra cuộc thảo luận này để điều chỉnh suy giảm .
  • Giả sử rằng cả hai thang đo được tạo thành từ hai mươi mục 5 điểm và do đó có tổng điểm nằm trong khoảng từ 20 đến 100, thì phiên bản có phương sai lớn hơn cũng sẽ đáng tin cậy hơn (ít nhất là về tính nhất quán nội bộ).
  • Độ tin cậy nhất quán nội bộ không phải là tiêu chuẩn duy nhất để đánh giá một bài kiểm tra tâm lý và nó không phải là yếu tố duy nhất phân biệt khả năng dự đoán của một thang đo so với thang đo khác đối với một cấu trúc nhất định.

9

Một ví dụ đơn giản giúp chúng ta xác định những gì là thiết yếu.

Hãy

Y= =C+γX1+ε

CγX1ε

X1= =αX2+β.

X1= =2X2-50X1α2X2

Y= =C+γ(αX2+β)= =(C+βγ)+(γα)X2+ε= =C'+γ'X2+ε.

Các tham số thay đổi và phương sai của biến độc lập thay đổi , nhưng khả năng dự đoán của mô hình vẫn không thay đổi .

X1X2YYXTôi

X1X2YYX1X2X2


1

Luôn kiểm tra các giả định cho kiểm tra thống kê bạn đang sử dụng!

Một trong những giả định của hồi quy logistic là tính độc lập của các lỗi có nghĩa là các trường hợp dữ liệu không nên liên quan. Ví dụ. bạn không thể đo lường cùng một người tại những thời điểm khác nhau mà tôi sợ bạn có thể đã thực hiện với các khảo sát kiểm soát cơn giận của mình.

Tôi cũng sẽ lo lắng rằng với 2 cuộc điều tra về sự tức giận, về cơ bản, bạn đang đo lường cùng một điều và phân tích của bạn có thể bị ảnh hưởng bởi tính đa hình.


1
Tôi nghĩ rằng N26 đang đề xuất một thử nghiệm suy nghĩ. Tức là, nếu khi thiết kế một nghiên cứu, bạn có một sự lựa chọn giữa hai thang đo, bạn nên chọn, prima facie, một nghiên cứu có phương sai lớn hơn. Ngoài ra, có hai yếu tố dự đoán đại diện cho cùng một cấu trúc, nhưng được đo khác nhau không vi phạm giả định về tính độc lập của các quan sát.
Jeromy Anglim
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.