Độ dốc trong hồi quy tuyến tính có thể được sử dụng làm biến độc lập hoặc phụ thuộc trong các mô hình hồi quy khác không?


8

Tôi có 100 bệnh nhân và mỗi bệnh nhân có 10 lần đo creatinine huyết thanh theo chiều dọc. Tốc độ lọc cầu thận ước tính (eGFR) được tính toán từ công thức MDRD bao gồm giới tính, tuổi tác và creatinine huyết thanh. eGFR là biến phụ thuộc và thời gian là biến độc lập trong hồi quy tuyến tính cho mỗi bệnh nhân.

  1. Thay vào đó, có nên sử dụng hồi quy tuyến tính vi phạm giả định "X độc lập" và mô hình hỗn hợp tuyến tính không?
  2. Có thể ước tính độ dốc eGFR (được ước tính với độ không đảm bảo thay vì số đo) từ mỗi bệnh nhân (theo hồi quy tuyến tính cho từng bệnh nhân hoặc trong các mô hình hỗn hợp ngẫu nhiên [cách ước tính độ dốc cho từng bệnh nhân trong các mô hình hỗn hợp?]) biến độc lập hay phụ thuộc trong các mô hình hồi quy khác?

Cảm ơn bạn.


Nếu X (biến độc lập) là biến đo, thì đó là "biến ngẫu nhiên" thay vì "giá trị cố định". Theo Wikipedia ( en.wikipedia.org/wiki/Random_variable ): "Trong xác suất và thống kê, một biến ngẫu nhiên hoặc biến ngẫu nhiên, đại khái là một biến có giá trị kết quả từ phép đo trên một loại quy trình ngẫu nhiên." Tôi có đúng không?

Vui lòng không sử dụng trả lời để đặt câu hỏi. Bạn có thể tiếp tục cuộc trò chuyện này trong các bình luận. Một lựa chọn khác là đăng lại câu hỏi này dưới dạng câu hỏi và liên kết lại tại đây.
whuber

Câu trả lời:


5

Trong thực tế, bạn đang đề xuất sử dụng hồi quy tuyến tính như một thủ tục toán học để cô đọng một quan sát 10 biến thành một biến duy nhất (độ dốc). Như vậy, đây chỉ là một ví dụ khác về các quy trình tương tự như (giả sử) sử dụng trung bình các phép đo lặp lại làm biến hồi quy hoặc bao gồm các điểm thành phần chính trong hồi quy.

Nhận xét cụ thể theo.

(1) Hồi quy tuyến tính không yêu cầu X (các biến độc lập) phải "độc lập". Thật vậy, trong công thức tiêu chuẩn, khái niệm độc lập thậm chí không áp dụng vì X là giá trị cố định, không phải là sự nhận ra một biến ngẫu nhiên.

(2) Có, bạn có thể sử dụng độ dốc làm biến phụ thuộc . Nó sẽ giúp thiết lập rằng họ có thể hành xử giống như biến phụ thuộc trong hồi quy tuyến tính. Đối với bình phương tối thiểu bình thường, điều này có nghĩa là

a. Độ dốc có thể phụ thuộc vào một số thuộc tính của bệnh nhân.

b. Sự phụ thuộc là xấp xỉ tuyến tính, ít nhất là đối với phạm vi các thuộc tính bệnh nhân được quan sát.

c. Bất kỳ sự thay đổi nào giữa độ dốc quan sát và độ dốc giả định có thể được coi là ngẫu nhiên.

d. Biến thể ngẫu nhiên này là (i) độc lập từ bệnh nhân này sang bệnh nhân khác và (ii) có sự phân phối xấp xỉ từ bệnh nhân này sang bệnh nhân khác.

e. Như trước đây, các biến độc lập không được xem là ngẫu nhiên mà là cố định và được đo mà không có lỗi đáng kể.

Nếu tất cả các điều kiện xấp xỉ giữ, bạn sẽ ổn thôi. Vi phạm (d) hoặc (e) có thể được chữa khỏi bằng cách sử dụng khái quát hóa bình phương tối thiểu thông thường.

(2 '). Bởi vì các độ dốc sẽ thể hiện độ không đảm bảo (như được đo trong hồi quy được sử dụng để ước tính các độ dốc), chúng có thể không phải là ứng cử viên tốt cho các biến độc lập trừ khi bạn coi chúng là ngẫu nhiên trong mô hình hỗn hợp hoặc đang sử dụng mô hình biến-lỗi.

Bạn cũng có thể đối phó với tình huống này bằng mô hình Bayes phân cấp .


Tôi xin lỗi vì đã hiểu sai về "X độc lập". Ý tôi là "điều kiện Y độc lập trên X". Cụ thể, phần dư phải độc lập. Giả định này bị vi phạm trong các quan sát dọc. Tham khảo: Mô hình hóa dữ liệu theo chiều dọc, II: mô hình hồi quy chuẩn và phần mở rộng. Phương pháp Mol Biol. 2009; 473: 61-94.
Jinn-Yuh Guh

Bạn có thể tìm hiểu thêm về 'khái quát hóa các ô vuông nhỏ nhất' được đề cập ở trên từ Lewis và Linzer 2005
liên hợp chiến binh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.