Tôi hy vọng ai đó có thể giúp làm rõ một điểm gây nhầm lẫn cho tôi. Nói rằng tôi muốn kiểm tra xem 2 bộ hệ số hồi quy có khác biệt đáng kể với nhau hay không, với thiết lập sau:
- , với 5 biến độc lập.
- 2 nhóm, với kích thước gần bằng nhau (mặc dù điều này có thể thay đổi)
- Hàng ngàn hồi quy tương tự sẽ được thực hiện đồng thời, do đó một số loại điều chỉnh giả thuyết phải được thực hiện.
Một cách tiếp cận được đề xuất với tôi là sử dụng Z-test:
Một đề xuất khác mà tôi đã thấy trên bảng này là giới thiệu một biến giả để nhóm và viết lại mô hình như sau:
, trong đó là biến nhóm, được mã hóa là 0, 1.
Câu hỏi của tôi là, hai cách tiếp cận này khác nhau như thế nào (ví dụ như các giả định khác nhau được thực hiện, tính linh hoạt)? Là cái này thích hợp hơn cái kia? Tôi nghi ngờ điều này là khá cơ bản, nhưng bất kỳ sự làm rõ nào sẽ được đánh giá rất cao.