Tôi đã tìm thấy nhiều bài viết hữu ích về các biến độc lập được tiêu chuẩn hóa và các biến độc lập tập trung trên stats.stackexchange.com, nhưng tôi vẫn hơi bối rối. Tôi đang yêu cầu bạn đánh giá về những gì tôi đã hiểu. Ngoài ra, nếu những điều sau đây không đúng, bạn có thể vui lòng sửa cho tôi không?
- Làm thế nào để chuẩn hóa. Các biến được tiêu chuẩn hóa có được bằng cách trừ giá trị trung bình của biến và bằng cách chia cho độ lệch chuẩn của cùng biến đó.
- Làm thế nào để trung tâm. Các biến độc lập trung tâm thu được chỉ bằng cách trừ đi giá trị trung bình của biến.
- Lý do chuẩn hóa. Bạn chuẩn hóa các biến để tạo thuận lợi cho việc giải thích các hệ số ước tính khi các biến trong hồi quy của bạn có các đơn vị đo lường khác nhau. Khi bạn muốn chuẩn hóa, bạn phải chuẩn hóa tất cả các biến trong hồi quy - ngụ ý rằng bạn sẽ không nhận được ước tính của hằng số (tức là B0 hoặc chặn).
- Lý do định tâm. Bạn trung tâm biến nếu bạn muốn đạt được một giải thích có ý nghĩa của hằng số ước tính. Trong trường hợp này, bạn có thể căn giữa số lượng biến bạn muốn; bạn không cần phải tập trung tất cả các biến độc lập trong mô hình.
- Biến độc lập, Y. (câu hỏi đơn giản) Bạn có bao giờ tập trung hoặc tiêu chuẩn hóa Y không?
- Sử dụng logarit tự nhiên. Nếu một hoặc nhiều biến của bạn không được phân phối bình thường, bạn có thể chuyển đổi chúng bằng cách sử dụng logarit tự nhiên. Chỉ sau khi chuyển đổi này, bạn có thể tiêu chuẩn hóa tất cả các biến hoặc tập trung vào các biến mà bạn cần căn giữa. Nói chung, bất kỳ sự biến đổi nào của một biến phải xảy ra trước khi chuẩn hóa hoặc định tâm (ở đây tôi nói về logarit tự nhiên, nhưng bạn có thể bình phương một biến hoặc chia một biến cho một biến khác, ví dụ: dân số / km2)
- Giải thích các hệ số biến chuẩn. "Việc tăng 1 độ lệch chuẩn trong X1 sẽ tăng (hoặc giảm) Y theo -number-."
- Giải thích các hệ số biến trung tâm. Các hệ số của các biến ngẫu nhiên: "Sự gia tăng X1 theo -number- từ giá trị trung bình của nó sẽ tăng (hoặc giảm) Y theo -number-." Hằng số: "Nó đại diện cho giá trị mong đợi của Y khi các biến không trung tâm bằng 0 và khi các biến trung tâm ở mức trung bình của chúng."
- Điều khoản tương tác. Việc giải thích hệ số của một thuật ngữ tương tác không nên có vấn đề, cho dù bạn đã chuẩn hóa các biến của mình hay căn giữa chúng (chỉ một biến của tương tác hoặc cả hai biến đó). Về cơ bản, cách hiểu là bạn thường đưa ra một thuật ngữ tương tác (ví dụ: bạn quan tâm đến hiệu ứng của X1 trên Y và X1 được tương tác với X2, tổng hiệu ứng của X1 được đưa ra bởi hệ số + hệ số tương tác của nó thuật ngữ khi X2 được cố định), chỉ cần nhớ bối cảnh hóa việc diễn giải theo điểm 7 hoặc 8, tùy thuộc vào loại chuyển đổi bạn đã thực hiện.
Bạn thường muốn có câu trả lời thực hiện thực tế hoặc câu trả lời cơ bản thống kê cơ bản?
—
ngày
Càng cụ thể càng tốt. Vì vậy, câu trả lời có chứa cả cách làm và kỹ thuật thống kê sẽ được đánh giá rất cao.
—
Fuca26