Có hợp lệ để bao gồm một số đo cơ sở là biến kiểm soát khi kiểm tra tác động của một biến độc lập đối với điểm thay đổi không?


38

Tôi đang cố gắng chạy hồi quy OLS:

  • DV: Thay đổi cân nặng trong một năm (cân nặng ban đầu - cân nặng cuối)

  • IV: Có hay không bạn tập thể dục.

Tuy nhiên, có vẻ hợp lý rằng những người nặng hơn sẽ giảm cân trên mỗi đơn vị tập thể dục hơn những người gầy hơn. Vì vậy, tôi muốn bao gồm một biến điều khiển:

  • CV: Trọng lượng ban đầu.

Tuy nhiên, bây giờ trọng lượng ban đầu được sử dụng CẢ HAI để tính biến phụ thuộc VÀ làm biến điều khiển.

Cái này có ổn không Điều này có vi phạm một giả định của OLS không?


4
Là điều trị được chỉ định ngẫu nhiên?
Andy W

1
Lưu ý rằng gần đây cũng có một câu hỏi tương tự khác, stats.stackexchange.com/q/15104/1036 . Câu trả lời cho câu hỏi đó có thể áp dụng cho câu hỏi này (trên thực tế, tôi sẽ nói rằng chúng là những câu hỏi trùng lặp).
Andy W

3
@Andy Thật ra, hai câu hỏi đủ khác nhau để tôi đưa ra một câu trả lời khác cho câu hỏi này so với câu hỏi kia. Charlie đã đưa ra một phân tích tốt đẹp ở đây.
whuber

3
Lưu ý rằng việc sử dụng điểm số chênh lệch thường liên quan đến việc giảm độ tin cậy đáng kể, mặc dù điều này còn gây tranh cãi
Behacad

Câu trả lời:


25

Để trả lời câu hỏi theo nghĩa đen của bạn, "Có hợp lệ khi đưa số đo cơ sở làm biến kiểm soát khi kiểm tra tác động của biến độc lập đối với điểm thay đổi không?", Câu trả lời là không . Câu trả lời là không, bởi vì bằng cách xây dựng , điểm số cơ sở tương quan với thuật ngữ lỗi khi điểm thay đổi được sử dụng làm biến phụ thuộc, do đó ảnh hưởng ước tính của đường cơ sở lên điểm thay đổi là không thể giải thích được.

Sử dụng

  • Y1 là trọng lượng ban đầu
  • Y2 là trọng lượng cuối
  • Δ Y = Y 2 - Y 1ΔY là sự thay đổi về trọng lượng (nghĩa là )ΔY=Y2Y1
  • T như một điều trị được chỉ định ngẫu nhiên , và
  • X là các yếu tố ngoại sinh khác ảnh hưởng đến cân nặng (ví dụ: các biến kiểm soát khác có liên quan đến kết quả nhưng không được điều trị bằng cách chỉ định ngẫu nhiên)

Một cái sau đó có một mô hình hồi quy trên và ; T XΔYTX

ΔY=β1T+β2X+e

Mà theo định nghĩa là tương đương với;

Y2Y1=β1T+β2X+e

Bây giờ, nếu bạn bao gồm đường cơ sở dưới dạng hiệp phương sai, người ta sẽ thấy một vấn đề, trong đó bạn có thuật ngữ ở cả hai mặt của phương trình. Điều này cho thấy không thể giải thích được, bởi vì nó vốn có tương quan với thuật ngữ lỗi.β 3 Y 1Y1β3Y1

Y2Y1=β1T+β2X+β3Y1+eY2=β1T+β2X+β3Y1+(e+Y1)

Bây giờ, một phần của sự nhầm lẫn trong các câu trả lời khác nhau dường như xuất phát từ thực tế là các mô hình khác nhau sẽ mang lại kết quả giống hệt nhau cho hiệu quả điều trị , trong công thức trên của tôi. Vì vậy, nếu người ta so sánh hiệu quả điều trị cho mô hình bằng cách sử dụng điểm thay đổi là biến phụ thuộc với mô hình bằng cách sử dụng "cấp độ" (với mỗi mô hình bao gồm đường cơ sở là đồng biến), thì cách giải thích về hiệu quả điều trị sẽ là tương tự. Trong hai mô hình theo sau sẽ giống nhau và các suy luận cũng dựa trên chúng (Bruce Weaver có một số mã SPSS được đăng cũng thể hiện sự tương đương).Y 1 β 1 Tβ1TY1β1T

Change Score Model:Y2Y1=β1T+β2X+β3Y1+eLevels Model:Y2=β1T+β2X+β3Y1+e

Vì vậy, một số người sẽ tranh luận (như Felix có trong chủ đề này, và như Bruce Weaver đã thực hiện một số cuộc thảo luận về nhóm google SPSS) vì các mô hình dẫn đến hiệu quả điều trị ước tính như nhau, nên bạn chọn loại nào không quan trọng. Tôi không đồng ý, vì không thể diễn giải đường cơ sở trong mô hình điểm thay đổi, nên bạn không bao giờ nên bao gồm đường cơ sở dưới dạng hiệp phương sai (bất kể hiệu quả điều trị ước tính có giống nhau hay không). Vì vậy, điều này đưa ra một câu hỏi khác, điểm trong việc sử dụng điểm thay đổi là biến phụ thuộc là gì? Như Felix cũng đã lưu ý, mô hình sử dụng điểm thay đổi làm biến phụ thuộc không bao gồm đường cơ sở dưới dạng hiệp phương sai khác với mô hình sử dụng các mức. Để làm rõ, các mô hình tiếp theo sẽ cho hiệu quả điều trị khác nhau (đặc biệt trong trường hợp điều trị có tương quan với đường cơ sở);

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

Điều này đã được ghi nhận trong văn học trước đó là "Nghịch lý của Chúa". Vậy mô hình nào là đúng? Vâng, trong trường hợp thử nghiệm ngẫu nhiên, tôi sẽ nói mô hình Levels là thích hợp hơn (mặc dù nếu bạn đã thực hiện ngẫu nhiên công việc tốt, hiệu quả điều trị trung bình sẽ rất gần giữa các mô hình). Những lý do khác đã lưu ý lý do tại sao mô hình cấp độ được ưa thích hơn, câu trả lời của Charlie nêu rõ ở chỗ bạn có thể ước tính hiệu ứng tương tác với đường cơ sở trong mô hình cấp độ (nhưng bạn không thể trong mô hình điểm thay đổi). Whuber trong câu trả lời này cho một câu hỏi rất giống nhau cho thấy cách điểm số thay đổi tạo ra mối tương quan giữa các phương pháp điều trị khác nhau.

Trong các tình huống trong đó việc điều trị không được chỉ định ngẫu nhiên, mô hình sử dụng điểm thay đổi làm biến phụ thuộc sẽ được xem xét nhiều hơn. Lợi ích chính của mô hình điểm thay đổi là bất kỳ lúc nào các dự đoán bất biến về kết quả đều được kiểm soát. Vì vậy, trong công thức trên, không đổi trong suốt thời gian (ví dụ: có khuynh hướng di truyền ở một trọng lượng nhất định) và có tương quan với việc một cá nhân chọn tập thể dục (và không quan sát được). Trong trường hợp đó, mô hình điểm thay đổi là thích hợp hơn. Ngoài ra trong các trường hợp lựa chọn vào điều trị có tương quan với giá trị cơ bản, mô hình điểm thay đổi có thể thích hợp hơn. Paul Allison trong bài báo của mình,X XXXXThay đổi điểm số như các biến phụ thuộc trong phân tích hồi quy , đưa ra các ví dụ tương tự (và phần lớn ảnh hưởng đến quan điểm của tôi về chủ đề này, vì vậy tôi rất khuyến nghị nên đọc nó).

Điều này không có nghĩa là điểm số thay đổi luôn được ưu tiên trong các cài đặt không ngẫu nhiên. Trong trường hợp bạn mong đợi đường cơ sở có ảnh hưởng nhân quả thực tế đến trọng lượng bài, bạn nên sử dụng mô hình cấp độ. Trong trường hợp mà bạn mong đợi đường cơ sở có tác dụng nhân quả và việc lựa chọn điều trị có tương quan với đường cơ sở, hiệu quả điều trị bị nhầm lẫn với hiệu quả cơ bản.

Tôi đã bỏ qua lưu ý của Charlie rằng logarit của trọng số có thể được sử dụng làm biến phụ thuộc. Mặc dù tôi không nghi ngờ rằng đó có thể là một khả năng, nhưng nó không phải là thứ tự cho câu hỏi ban đầu. Một câu hỏi khác đã thảo luận khi thích hợp để sử dụng logarit của biến (và những câu hỏi vẫn được áp dụng trong trường hợp này). Có lẽ có tài liệu trước về chủ đề này sẽ giúp hướng dẫn bạn về việc sử dụng trọng lượng đăng nhập có phù hợp không.


Trích dẫn

Allison, Paul D. 1990. Thay đổi điểm số dưới dạng các biến phụ thuộc trong phân tích hồi quy . Phương pháp xã hội học 20: 93-114. Phiên bản PDF công khai .


3
Trong phương trình nếu, như thông lệ tiêu chuẩn, chúng tôi giả sử tất cả các biến số không phải là biến ngẫu nhiên, thì không tương quan với . Do đó, tôi nghĩ rằng chỉ có một vấn đề nếu bạn xem là ngẫu nhiên, trong trường hợp đó (chỉ là ý kiến ​​của tôi), bạn nên lập mô hình nhưng không có như là một đồng biến. Về mặt này mà không thiếu dữ liệu, tôi đã được thông báo rằng phương pháp này tương đương với là một hiệp phương thức cố định (tôi sẽ thử và tìm một số tài liệu tham khảo cho việc này). Y2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)Y1Y1
dandar

1
@dandar, câu nói đó không có ý nghĩa với tôi. Lưu ý rằng là giá trị tiền xử lý của kết quả , nó không phải là biến được thao tác trong một thử nghiệm. Bạn có nói rằng nếu tôi có giá trị cơ bản của , thì tôi sẽ tiến hành một thử nghiệm và sau đó đo , tôi nên mô hình hóa cả và như là một chức năng của can thiệp thử nghiệm? Y1Y1Y2Y1Y2
Andy W

1
Mô hình mà tôi đang nói thực sự ngụ ý là một chức năng của điều trị, nhưng chỉ theo quan điểm rằng mặc dù ngẫu nhiên sẽ luôn có sự khác biệt nhỏ giữa nhóm điều trị và nhóm kiểm soát đối với phương tiện cơ bản của họ. Do đó, sẽ nắm bắt được sự khác biệt này cũng như hiệu quả điều trị. Tài liệu tham khảo cho điều này là ("Phân tích dữ liệu theo chiều dọc của các phản hồi liên tục và rời rạc cho các thiết kế trước khi đăng" của Zeger và Liang, 2000). Y1β1
dandar

1
Một cuộc thảo luận rõ ràng về bài báo này có thể được tìm thấy trong (Đường cơ sở nên là một biến số đồng biến hoặc phụ thuộc trong các phân tích về sự thay đổi so với đường cơ sở trong các thử nghiệm lâm sàng? Nhưng bởi Liu, Mogg, Mallick và Mehrotra 2009). Họ đề cập đến mô hình này như một mô hình vô điều kiện (nghĩa là nó không dựa trên phản ứng cơ bản). Trong bài báo Liu (2009), họ thảo luận về các kết quả chính của bài báo Zeger (2000). Đây là đầu tiên mà không có dữ liệu thiếu các ước lượng điểm của từ mô hình vô điều kiện cũng giống như những người từ cách tiếp cận có điều kiện của ANCOVA sử dụng sau cơ sởB1
dandar

1
đo lường như một phản ứng và điều chỉnh theo giá trị cơ sở cố định và thứ hai là phương sai ước tính điểm từ mô hình ANCOVA luôn lớn hơn hoặc bằng giá trị từ điều kiện vô điều kiện. Nó chỉ ra sự khác biệt phương sai này thường sẽ nhỏ do ngẫu nhiên đảm bảo đáp ứng trung bình cơ sở giữa các nhóm là nhỏ. Các tác giả kết luận mô hình vô điều kiện là phù hợp để mô hình hóa đường cơ sở như một biến ngẫu nhiên, nhưng ANCOVA là phù hợp khi xem nó là cố định.
dandar

21

Câu trả lời của Andy dường như là quan điểm của nhà kinh tế về mọi thứ. Nó được chấp nhận thực hành trong các thử nghiệm lâm sàng hầu như luôn luôn điều chỉnh cho phiên bản cơ sở của biến phản ứng, để tăng sức mạnh đáng kể. Vì chúng tôi dựa trên các biến cơ sở nên không có "thuật ngữ lỗi" để chúng bị nhầm lẫn với thuật ngữ lỗi tổng thể. Vấn đề duy nhất là nếu các lỗi đo lường trong hiệp phương sai cơ sở bị nhầm lẫn với một X khác, làm sai lệch hiệu ứng của các X khác. Phương pháp ưa thích tổng thể là điều chỉnh đường cơ sở và mô hình hóa biến trả lời, không tính toán thay đổi. Một lý do cho điều này là sự thay đổi phụ thuộc rất nhiều vào việc biến đổi Y thành chính xác và sự thay đổi đó không áp dụng cho các mô hình hồi quy nói chung. Ví dụ, nếu Y là thứ tự, sự khác biệt giữa hai biến số thứ tự không còn là thứ tự.


1
Tôi không hoàn toàn hiểu câu trả lời này. Bạn có ý nghĩa gì với "điều chỉnh cho đường cơ sở"? Lấy sự khác biệt, hay kiểm soát nó?
Henrik

3
Bằng cách 'điều chỉnh cho đường cơ sở', tôi có nghĩa là bao gồm đường cơ sở dưới dạng hiệp phương sai. Việc sử dụng điểm thay đổi cũng rất phổ biến nhưng bạn không thể sử dụng chúng mà không điều chỉnh đường cơ sở dưới dạng đồng biến (do đó tại sao phải bận tâm với điểm thay đổi?).
Frank Harrell

6
Trên thực tế không có gì bạn nói ở đây (hoặc phản hồi lại những bình luận của Felix) mâu thuẫn trực tiếp với những gì tôi nói. Sử dụng điểm số thay đổi không 'điều chỉnh cho đường cơ sở', nó sẽ kiểm soát mọi biến số bất biến bất kỳ lúc nào (hoặc nếu lựa chọn vào điều trị có tương quan cao với đường cơ sở). Nếu đường cơ sở là không thể bỏ qua (nghĩa là nó có ảnh hưởng trực tiếp đến kết quả hoặc nó có tương tác với điều trị) thì điểm số thay đổi sẽ không giải quyết được vấn đề.
Andy W

2
@Frank Harrell Cảm ơn bạn đã tham gia cuộc thảo luận này và làm rõ điều này. (+1)
Henrik

8

Chúng tôi có thể thay đổi lý do của @ ocram một chút để có started

E[w1w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

Vì vậy, nếu đây là mô hình phù hợp , nói rằng sự khác biệt phụ thuộc vào trọng số ngụ ý rằng giá trị cuối phụ thuộc vào giá trị ban đầu với một hệ số có thể là bất cứ điều gì. Chạy hồi quy chênh lệch trên và hoặc trọng số cuối trên cùng một biến sẽ cho bạn cùng hệ số trên mọi thứ trừ . Nhưng, nếu mô hình này không chính xác, các hồi quy này cũng sẽ cho các kết quả khác nhau trên các hệ số khác.xw0w0

Lưu ý rằng thiết lập này ngụ ý rằng trọng lượng ban đầu dự đoán sự khác biệt về trọng lượng, không phải tác động của điều trị . Điều này sẽ yêu cầu một thuật ngữ tương tác, có lẽ

E[w1w0X,w0]=β0+(xw0)β+w0γ.

Một cách tiếp cận khác là tính toán ở đây, là tốc độ tăng trưởng của trọng lượng. Đây có thể là kết quả của bạn. Các hệ số của bạn trên sẽ cho bạn biết các yếu tố dự đoán này có liên quan như thế nào đến sự thay đổi tỷ lệ cân nặng. Điều này "kiểm soát" trọng lượng ban đầu bằng cách nói rằng, ví dụ, chế độ tập thể dục giảm 10% trọng lượng (hệ số 0,1 nhân với 100%) cho người giảm cân nặng 130 pound, trong khi chương trình giảm trọng lượng của một người tham gia 200 pound 20 pound. Trong trường hợp này, bạn có thể không cần bao gồm trọng lượng ban đầu (hoặc nhật ký của nó) ở phía bên tay phải.rx

log(w1)log(w0)r;
rx

Một thuật ngữ tương tác có thể vẫn cần thiết nếu bạn tin rằng tác động của chương trình phụ thuộc vào trọng lượng bắt đầu. Nếu bạn sử dụng trong thuật ngữ tương tác, thì chương trình sẽ được liên kết với thay đổi về tốc độ tăng trưởng của trọng lượng. Mỗi pound nặng hơn khi một người bắt đầu chương trình sẽ dẫn đến sự gia tăng về sự thay đổi tốc độ tăng trưởng (đây là đạo hàm một phần của giá trị dự kiến ​​đối với cả điều trị và cân nặng khởi đầu).w 0 β 1 β 1w0w0β1β1

Nếu bạn sử dụng trong thuật ngữ tương tác, tác động của chương trình sẽ tăng thêm cho mỗi pound nặng hơn mà người tham gia đã bắt đầu chương trình.beta 1 / w 0log(w0)β1/w0

Như bạn có thể thấy, các phần chéo về các thuật ngữ tương tác có thể trở nên hơi khó diễn giải, nhưng chúng có thể nắm bắt được một tác động mà bạn quan tâm.


Xin chào Charlie, tôi thấy lợi thế của việc sử dụng thay đổi tỷ lệ, tuy nhiên tại sao bạn lại tìm thấy sự khác biệt trong các biến được ghi lại thay vì chỉ chia w1 trên w0.
ChrisStata

Tôi thích ý tưởng thay đổi tỷ lệ. Tuy nhiên, câu hỏi vẫn còn nếu tương tác dự kiến ​​theo tỷ lệ theo nghĩa đen hay không. Nếu không, bạn vẫn sẽ cần bao gồm trọng lượng ban đầu dưới dạng hiệp phương sai. Hoặc bạn có chắc chắn rằng việc giảm 10% trọng lượng của bạn cho một người 100 hay 200 pounds là khó khăn không?
Henrik

@ChrisStata, bạn cũng có thể làm điều đó. Tôi là một nhà kinh tế và chúng tôi rất thích nhật ký của chúng tôi (và cả sự khác biệt nữa). Nếu bạn có một chuỗi thời gian (nghĩa là nhiều quan sát) cho mỗi người (tạo một tập dữ liệu bảng), tôi có thể lập luận rằng cách của tôi tốt hơn, nhưng điều đó không liên quan ở đây. Henrik, bạn nói đúng; Tôi đã thêm một chút về điều đó vào câu trả lời của tôi.
Charlie

8

EDIT: Lập luận của Andy W đã thuyết phục tôi bỏ Mô hình C. Tôi đã thêm một khả năng khác: Phân tích sự thay đổi với Mô hình Hệ số Ngẫu nhiên (còn gọi là Mô hình Đa cấp hoặc Mô hình Hiệu ứng Hỗn hợp

Đã có rất nhiều tranh luận khoa học về việc sử dụng điểm số chênh lệch. Các văn bản yêu thích của tôi là Rogosa (1982, [1]) và Fitzmaurice, Laird, & Ware (2004, [2])

Nói chung, bạn có ba khả năng phân tích dữ liệu của mình:

  • A) Chỉ lấy điểm chênh lệch giữa các cá nhân (điểm thay đổi)
  • B) Coi phép đo bài là DV và kiểm soát nó cho đường cơ sở
  • C) Lấy điểm số chênh lệch làm DV và kiểm soát nó cho đường cơ sở (đó là mô hình bạn đề xuất). Do lập luận của Andy W, tôi đã bỏ phương án này
  • D) Sử dụng phương pháp mô hình đa cấp / hiệu ứng hỗn hợp, trong đó đường hồi quy được mô hình hóa cho mỗi người tham gia và người tham gia được coi là đơn vị cấp 2.

Mô hình A và B có thể tạo ra kết quả rất khác nhau nếu đường cơ sở tương quan với điểm thay đổi (ví dụ: người nặng hơn giảm cân nhiều hơn) và / hoặc chỉ định điều trị có tương quan với đường cơ sở.

Nếu bạn muốn biết thêm về những vấn đề này, hãy xem các tài liệu được trích dẫn, hoặc ở đâyđây .

Cũng đã có một nghiên cứu mô phỏng gần đây [3] trong đó so sánh thực nghiệm các điều kiện theo đó A hoặc B thích hợp hơn.

Đối với các thiết kế hoàn toàn cân bằng không có giá trị thiếu, Model D phải tương đương với Mô hình A. Tuy nhiên, nó cung cấp cho bạn thêm thông tin về sự biến đổi giữa người với người, nó dễ dàng được mở rộng đến nhiều điểm đo hơn và nó có các đặc tính tốt khi có dữ liệu không cân bằng và / hoặc thiếu giá trị.

Như một điểm mấu chốt: Trong trường hợp của bạn, tôi sẽ phân tích các biện pháp hậu kiểm soát đối với đường cơ sở (Mô hình B).

[1] Rogosa, D., Brandt, D., & Zimowski, M. (1982). Một cách tiếp cận đường cong tăng trưởng để đo lường sự thay đổi. Bản tin tâm lý, 92, 726-748.

[2] Fitzmaurice, GM, Laird, NM, & Ware, JH (2004). Áp dụng phân tích theo chiều dọc. Hoboken, NJ: Wiley.

[3] Thú cưng, Y., & Schatschneider, C., 2011. Một nghiên cứu mô phỏng về hiệu suất của sự khác biệt đơn giản và hiệp phương sai Điểm điều chỉnh trong thiết kế thí nghiệm ngẫu nhiên. Tạp chí đo lường giáo dục, 48, 31-43.


Tôi đã đánh giá thấp câu trả lời này và bạn có thể thấy câu trả lời của tôi về lý do tại sao tôi tin rằng điểm số thay đổi với đường cơ sở là một đồng biến không nên được thực hiện. Tóm lại, mặc dù Mô hình B và C trong công thức của bạn tạo ra hiệu quả điều trị tương đương, điều đó không có nghĩa là Mô hình C được ưa thích hơn. Trên thực tế, hiệu ứng cơ bản trong Mô hình C là không thể giải thích được, vì vậy tôi cho rằng không nên sử dụng nó.
Andy W

@AndyW: Lập luận của bạn đã thuyết phục tôi; Mặc dù ước tính phù hợp nhất về hiệu quả điều trị là giống nhau ở cả hai mô hình, Mô hình B nên được ưu tiên hơn Mô hình C. Tôi đã điều chỉnh câu trả lời của mình cho phù hợp. Nhưng bạn nói gì với Laird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330.?, Ai cho thấy sự tương đương của B và C?
Felix S

Tôi không nghĩ bất cứ điều gì tôi nói mâu thuẫn với bài báo Laird. Về cơ bản tất cả những lời tán dương của tôi là (theo ký hiệu của Laird) là không thể giải thích được, vậy tại sao lại báo cáo nó (sự tương đương không có trong câu hỏi). Laird đưa ra những nhận xét khác về cách hiệu ứng đồng biến cơ sở có thể được hiểu là một giả thuyết về việc nếu các nhóm điều trị riêng lẻ không thay đổi (mặc dù vẫn còn quan trọng về nó). Vui lòng phản bác quan điểm của tôi với các tình huống trong đó là hữu ích (chắc chắn là không hữu ích theo cách thông thường mà chúng tôi giải thích các hệ số hồi quy). ˉ bb¯b¯
Andy W

Một điểm cho mô hình D. Tôi tự hỏi tại sao không chỉ xem xét mô hình D. Đó là điểm nhất quán (giá trị cơ bản là biến ngẫu nhiên và không bị ép buộc với biến phụ thuộc), nó đơn giản, rất linh hoạt (tương tác có thể được thêm vào) và cung cấp độ lệch chuẩn của dân số.
giordano

3

Xem Josh Angrist về chính xác câu hỏi này: http : // www . Ultralyharmlesseconometrics.com/2009/10/adding-lagged-deperee-vars-to-differenced-models/ . Anh ta đi xuống chủ yếu chống lại việc bao gồm DV bị trễ trong mô hình của bạn. Không có gì trong câu trả lời của anh ta không có trong các câu trả lời ở trên, nhưng một câu trả lời ngắn gọn hơn cho câu hỏi của bạn có thể giúp ích.


3

Glymour et al. (2005) đã giải quyết bằng cách sử dụng điều chỉnh cơ sở khi phân tích điểm thay đổi. Nếu thay đổi trạng thái sức khỏe đi trước đánh giá cơ sở hoặc có lỗi đo lường lớn trong biến phụ thuộc, họ thấy rằng có thể phát sinh sai lệch nếu mô hình hồi quy sử dụng điểm thay đổi vì biến phụ thuộc bao gồm biến số đường cơ sở. Câu trả lời của Frank Harrell "Vấn đề duy nhất sẽ là nếu các lỗi đo lường trong hiệp phương sai cơ sở bị nhầm lẫn với một chữ X khác, làm sai lệch hiệu ứng của X khác." có thể phản ánh sự thiên vị giống như địa chỉ Glymour.

Glymour (2005) "Khi nào điều chỉnh cơ bản là hữu ích trong phân tích thay đổi? Một ví dụ về giáo dục và thay đổi nhận thức. Tạp chí dịch tễ học Hoa Kỳ 162: 267-278


1

Ocram không đúng. Sự khác biệt về trọng lượng không tính đến trọng lượng ban đầu. Cụ thể, trọng lượng nội bộ là loại được lấy ra bằng cách trừ đi trọng lượng cuối cùng từ nó.

Do đó, tôi sẽ lập luận rằng nó không vi phạm bất kỳ giả định nào nếu bạn kiểm soát trọng lượng ban đầu.

(Logic tương tự được áp dụng nếu bạn lấy chênh lệch của BMI và BMI ban đầu.)


Cập nhật
Sau khi nhà phê bình của Andy W cho phép tôi chính thức hơn về lý do tại sao tôi đúng và Ocram sai (ít nhất là từ quan điểm của tôi).

aw
iw=awew=aw+Δw

Δw=iwew=awaw+Δw=Δw

aw

Nếu bạn muốn đưa nó vào tài khoản, bạn cần kết hợp nó vào mô hình của mình một cách riêng biệt (như một tham số thông thường và / hoặc như một thuật ngữ tương tác).

ΔBMJew=awpropΔw


Khi tôi nói rằng sự khác biệt có tính trọng lượng ban đầu, đây là những gì tôi thực sự có nghĩa. Bây giờ, cụ thể, bạn sẽ viết gì? trọng lượng cuối cùng - trọng lượng ban đầu = ...?
ocram

Như tôi đã viết, lập luận của bạn có vẻ sai đối với tôi. Tôi sẽ lập luận rằng trên thực tế, trọng lượng cuối sẽ tính trọng lượng ban đầu nhiều hơn vì nó nằm trên cùng một "thang đo", trong khi đó độ chênh lệch được "thay đổi tỷ lệ" (vì trọng lượng cuối cùng, do đó một số giá trị tuyệt đối được trừ đi khỏi giá trị absoulte .
Henrik

(-1) Điều này không đúng. Nói chung, bạn không nên bao gồm cùng một biến ở cả phía bên phải và bên trái của phương trình (vì nó dẫn đến biến độc lập có tương quan với thuật ngữ lỗi). Vì vậy, nếu bạn sử dụng các khác biệt cho biến phụ thuộc, bạn không nên bao gồm đường cơ sở dưới dạng hiệp phương sai.
Andy W

@Andy W: Tôi biết rằng đối số của bạn là chính xác. Nhưng lập luận của tôi là bạn loại một phần giá trị tuyệt đối (bằng cách trừ đi giá trị cuối te với đường cơ sở) do đó loại bỏ mối tương quan này. Do đó, việc thêm nó dưới dạng hiệp phương sai không tạo ra loại tương quan lỗi giả.
Henrik

@Henrik, hãy xem câu trả lời của tôi cho câu hỏi này, và tại sao tôi vẫn tin rằng tình cảm này là sai lầm.
Andy W

0

Quan sát rằng

end weightinitial weightY=β0+βTx

tương đương với

end weight=initial weight+β0+βTx

Nói cách khác, sử dụng thay đổi trọng lượng (thay vì chính trọng lượng cuối cùng) vì DV đã chiếm trọng lượng ban đầu.


1
Nhưng tôi đoán có thể có một sự tương tác giữa trọng lượng ban đầu và giảm cân được đào tạo. Giả sử một người trưởng thành có chiều cao 1,90m và khối lượng cơ thể 70kg và một người trưởng thành có chiều cao 1,60m và khối lượng cơ thể 90kg tham gia vào các bài tập huấn luyện tương tự. Tôi cá rằng cái sau sẽ giảm cân hơn. Trên một suy nghĩ thứ hai: có thể chỉ số khối cơ thể là một CV tốt hơn so với chỉ trọng lượng.
xmjx

1
@xmjx: Nếu bạn nghĩ rằng trọng lượng ban đầu sẽ tác động đến trọng lượng cuối cùng - và bạn có thể đúng - thì bạn nên giới thiệu nó như một phần bù trong mô hình khi nó được thực hiện ở đây ...
ocram

3
Không đúng nói chung. Nếu độ dốc của trọng lượng cơ sở không bằng 1.0 thì phân tích thay đổi sẽ không tương đương với phân tích trọng lượng cuối cùng trừ khi trọng lượng ban đầu ở cả hai mô hình và bạn đang sử dụng hồi quy thông thường. Nếu trọng lượng cơ sở ở hai vị trí thì mô hình thực sự khó giải thích hơn, vì vậy lý do cho việc kiên trì với phương pháp này là không rõ ràng.
Frank Harrell
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.