Mã hóa giả cho độ tương phản: 0,1 so với 1, -1


8

Tôi đang tìm kiếm sự giúp đỡ của bạn trong việc tìm hiểu sự khác biệt giữa hai độ tương phản khác nhau cho các biến nhị phân.

Trên trang này: http://www.psychstat.missouristate.edu/multibook/mlt08.htm trong "Biến số dự đoán lưỡng phân", có hai cách để mã hóa các yếu tố dự đoán nhị phân: sử dụng độ tương phản 0,1 hoặc độ tương phản 1, -1 . Tôi hiểu được sự khác biệt ở đây (0,1 là mã hóa giả và 1, -1 thêm vào một nhóm và trừ đi nhóm khác) nhưng không hiểu nên sử dụng cái nào trong hồi quy của tôi.

Ví dụ: nếu tôi có hai yếu tố dự đoán nhị phân, giới tính (m / f) và vận động viên (y / n), tôi có thể sử dụng độ tương phản 0,1 trên cả hai hoặc 1, -1 trên cả hai. Điều gì sẽ là sự giải thích của một hiệu ứng chính hoặc một hiệu ứng tương tác khi sử dụng hai sự tương phản khác nhau? Có phụ thuộc vào việc các tế bào của tôi có kích thước khác nhau?

Câu trả lời:


13

"Biến số dự đoán lưỡng phân", có hai cách để mã hóa các yếu tố dự đoán nhị phân: sử dụng độ tương phản 0,1 hoặc độ tương phản 1, -1.

Điều này thực sự sai. Không có giới hạn về số lượng cách chúng có thể được mã hóa. Hai cái đó chỉ đơn thuần là phổ biến nhất (thực sự giữa chúng, gần như có mặt ở khắp nơi), và có lẽ là dễ đối phó nhất.

Tôi hiểu được sự khác biệt ở đây (0,1 là mã hóa giả và 1, -1 thêm vào một nhóm và trừ đi nhóm khác) nhưng không hiểu nên sử dụng cái nào trong hồi quy của tôi.

Cái nào thuận tiện hơn / thích hợp. Nếu bạn có một thử nghiệm được thiết kế với số lượng bằng nhau trong mỗi, có một số khía cạnh tốt đẹp cho cách tiếp cận thứ hai; nếu bạn không phải là người đầu tiên có thể dễ dàng hơn theo nhiều cách.

Ví dụ: nếu tôi có hai yếu tố dự đoán nhị phân, giới tính (m / f) và vận động viên (y / n), tôi có thể sử dụng độ tương phản 0,1 trên cả hai hoặc 1, -1 trên cả hai.

Điều gì sẽ là sự giải thích của một hiệu ứng chính hoặc một hiệu ứng tương tác khi sử dụng hai sự tương phản khác nhau?

a) (i) Xem xét hiệu ứng chính về giới (không có tương tác vì đơn giản) {m = 0, f = 1} - khi đó hệ số tương ứng với hình nộm đó sẽ đo sự khác biệt về trung bình giữa nữ và nam (và phần chặn sẽ là trung bình của con đực).

(ii) Với {m = -1, f = 1} hiệu ứng chính về giới là một nửa sự khác biệt về trung bình và mức chặn là trung bình của phương tiện (nếu thiết kế được cân bằng thì nó cũng là trung bình của tất cả dữ liệu) . Tương tự, tác động chính là sự khác biệt của mỗi nhóm có nghĩa là từ đánh chặn.

b) (i) xem xét sự tương tác giữa giới tính {m = 0, f = 1} và vận động viên {n = 0, y = 1}

Bây giờ đánh chặn đại diện cho giá trị trung bình của nam không phải vận động viên (0,0), tác dụng chính của giới là sự khác biệt giữa phương tiện của nữ không vận động viên và nam không vận động viên, hiệu ứng chính của vận động viên thể hiện sự khác biệt giữa trung bình của các vận động viên nam và những người không phải là vận động viên nam và sự tương tác là sự khác biệt của hai sự khác biệt - đó là sự khác biệt trung bình của vận động viên / không vận động viên đối với nữ trừ đi sự khác biệt giữa vận động viên / không vận động viên.

(ii) xem xét sự tương tác giữa giới tính {m = -1, f = -1} và vận động viên {n = -1, y = 1}

Bây giờ, phần chặn thể hiện giá trị trung bình của bốn phương tiện nhóm (và nếu thiết kế hoàn toàn cân bằng thì nó cũng sẽ là giá trị trung bình tổng thể). Việc đánh chặn là một phần tư so với trước đây.

Các tác động chính là trung bình của các hiệu ứng khác biệt - hiệu ứng giới tính là trung bình của sự khác biệt giữa nam và nữ trong các vận động viên và sự khác biệt giữa nam và nữ trong các vận động viên không phải là vận động viên. Tác động chính của vận động viên là trung bình của sự khác biệt giữa vận động viên / không vận động viên ở nữ giới và sự khác biệt về vận động viên / không vận động viên ở nam giới.

Có phụ thuộc vào việc các tế bào của tôi có kích thước khác nhau?

"Kích cỡ khác nhau" nghĩa là gì? Bạn có nghĩa là số lượng quan sát trong mỗi tế bào là khác nhau? .


1
Câu trả lời rất toàn diện. Tôi sẽ thêm rằng tôi thấy theo nghĩa đen không có lý do gì để mã tương phản với định dạng -1, 1 cho các cấp. Điều này không chỉ mang lại kích thước hiệu ứng không có giải thích trực tiếp (chẳng hạn như "sự khác biệt nhân đôi liên quan đến kết quả so sánh sự khác biệt đơn vị trong công cụ dự đoán"), mà còn thể hiện sự diễn giải của phần chặn là một đại lượng giả tưởng (đúng hơn là hơn kết quả mong đợi cho tất cả các biến bằng 0). Tôi sẽ ủng hộ luôn luôn sử dụng mã 0/1 cho các biến giả.
AdamO

1
@AdamO Tôi không đồng ý. 1) Nếu bạn lo ngại rằng các mã -1, + 1 không có cách hiểu "trực tiếp", thì chỉ cần sử dụng -.5, +. 5. 2) Như Glen_b đã lưu ý, việc chặn dưới các mã đó đại diện cho giá trị trung bình của nhóm có nghĩa là; hoàn toàn không rõ làm thế nào đây ít nhiều là "số lượng hư cấu" so với nhóm có nghĩa là chính họ (có thể có hoặc không bằng BẤT K of các quan sát nào trong bộ dữ liệu!). 3) Tương tác giữa các yếu tố được mã hóa giả hầu như luôn khiến các hiệu ứng đơn giản bị mất hiệu lực của bất kỳ diễn giải thú vị / có ý nghĩa nào; mã tương phản cung cấp một cách giải thích tự nhiên hơn nhiều ở đây
Jake Westfall

Cảm ơn tất cả. Thật vậy, tôi đã gặp khó khăn trong việc diễn giải các hiệu ứng chính khi có sự tương tác khi sử dụng mã hóa giả. Tôi nhận ra rằng hiệu ứng chính của giới chỉ dành cho những người không phải vận động viên (không phải bất kỳ loại hiệu ứng nào của giới tính trung bình đối với cả vận động viên và không phải vận động viên, đó là những gì tôi có được với sự tương phản). Dan
Dan

"Chặn theo các mã như vậy đại diện cho giá trị trung bình của nhóm": Giá trị trung bình của phương tiện không phải là giá trị trung bình biên, là tham số duy nhất tôi nghĩ chúng ta quan tâm. Chỉ dưới thiết kế cân bằng, chúng ta mới có thể có được điều đó, và giả định đó là không thực tế cho mục đích của chúng ta.
AdamO

@JakeWestfall Như bạn đã biết, việc giải thích đánh chặn là giá trị trung bình trong phản hồi khi tất cả các giá trị của biến hồi quy được đặt thành 0. Nếu giá trị này không có khả năng hoặc tệ hơn thậm chí là không thể, thì chặn đó trở thành một đại lượng giả tưởng. Ngay cả đối với các nhị phân 0/1, giả sử tôi chỉ ra hai biến hồi quy- (0: có thai, 1: không mang thai) (0: nam 1: nữ) cho FEV. Chặn trong mô hình là FEV trung bình ở nam giới mang thai. Bây giờ nếu tôi viết mã, -1: nam 1: nữ, việc chặn hoàn toàn không có cách giải thích nào ngoại trừ "mức trung bình của phản ứng trung bình ở nam và nữ".
AdamO
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.