So sánh hai mô hình hồi quy tuyến tính


12

Tôi muốn so sánh hai mô hình hồi quy tuyến tính biểu thị tốc độ suy giảm của mRNA theo thời gian trong hai điều kiện khác nhau. Dữ liệu cho mỗi mô hình được thu thập độc lập.

Đây là bộ dữ liệu.

Nhật ký thời gian (giờ) (Nhật ký điều trị) (nhật ký B)
0 2.02 1.97
0 2.04 2.06
0 1,93 1,96
2 2.02 1.91
2 2,00 1,95
2 2.07 1.82
4 1,96 1,97
4 2.02 1.99
4 2.02 1.99
6 1,94 1,90
6 1.94 1.97
6 1.86 1.88
8 1,93 1,97
8 2,12 1,99
8 2.06 1.93
12 1.71 1.70
12 1.96 1.73
12 1.71 1.76
24 1.70 1.46
24 1.83 1.41
24 1.62 1.42

Đây là những mô hình của tôi:

Exp1.A.lm<-lm(Exp1$Time~Exp1$(Treatment A))
Exp1.B.lm<-lm(Exp1$Time~Exp1$(Treatment B))
Gọi:
lm (công thức = Exp1 $ Thời gian ~ Exp1 $ (Điều trị A))

Cư dân:
    Tối thiểu 1Q Trung bình tối đa 3Q 
-6,8950 -1,2322 0,2862 1,2494 5,2494 

Hệ số:
                   Ước tính Std. Lỗi t giá trị Pr (> | t |)    
(Đánh chặn) 74,68 6,27 11,91 2,94e-10 ***
Exp1 $ (Điều trị A) -36,14 3,38 -10,69 1,77e-09 ***
---
Dấu hiệu. mã: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1

Lỗi tiêu chuẩn còn lại: 2,97 trên 19 độ tự do
Nhiều bình phương R: 0,8575, bình phương R điều chỉnh: 0,85 
Thống kê F: 114.3 trên 1 và 19 DF, giá trị p: 1.772e-09

Gọi:
lm (công thức = Exp1 $ Thời gian ~ Exp1 $ (Điều trị B))

Cư dân:
   Tối thiểu 1Q Trung bình tối đa 3Q 
-7.861 -3.278 -1.444 3.222 11.972 

Hệ số:
                      Ước tính Std. Lỗi t giá trị Pr (> | t |)    
(Đánh chặn) 88.281 16.114 5.478 2.76e-05 ***
Exp1 $ (Điều trị B) -41.668 8.343 -4.994 8.05e-05 ***
---
Dấu hiệu. mã: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 '' 1

Lỗi tiêu chuẩn còn lại: 5.173 trên 19 độ tự do
Nhiều bình phương R: 0,5676, bình phương R điều chỉnh: 0,5449 
Thống kê F: 24,94 trên 1 và 19 DF, giá trị p: 8,052e-05

Để so sánh hai mô hình này, tôi đã sử dụng mã sau đây.

anova(Exp1.A.lm,Exp1.B.lm)
Phân tích bảng phương sai

Mô hình 1: Exp1 $ Time ~ Exp1 $ Exp1 $ (Điều trị A)
Mô hình 2: Exp1 $ Time ~ Exp1 $ Exp1 $ (Điều trị B)
  Res.Df RSS Df Tổng của Sq F Pr (> F)
1 19 167.60                      
2 19 508,48 0 -3,88,88

Câu hỏi của tôi là tại sao phân tích ANOVA không hiển thị số liệu thống kê F và p.val. Tôi xin lỗi nếu đây là một câu hỏi ngây thơ.

Dựa trên các độ dốc khác nhau, tốc độ xuống cấp là khác nhau trong hai mô hình này, nhưng tôi muốn biết sự khác biệt này có ý nghĩa thống kê như thế nào. Tôi hy vọng rằng điều này có ý nghĩa.


2
Bạn có thể nhận thấy rằng bảng ANOVA liệt kê các mức độ tự do liên quan đến phân tích là 0 ; bạn có cùng số lượng biến trong cả hai mô hình, đó là lý do không có giá trị F hoặc p nào có thể được tính toán.
gung - Phục hồi Monica

5
Tôi sẽ không bận tâm so sánh các mô hình này cho đến khi kiểm tra mức độ phù hợp của chúng. Tôi nghĩ rằng bạn sẽ tìm thấy trong phần thứ hai rằng cả đáp ứng và logarit của nó đều không phải là các hàm tuyến tính của thời gian. Điều này gọi (nghiêm túc) vào câu hỏi bất kỳ so sánh các ước tính độ dốc.
whuber

Câu trả lời:


11

Nếu bạn thiết lập dữ liệu trong một cột dài với A và B là một cột mới, thì bạn có thể chạy mô hình hồi quy của mình dưới dạng GLM với biến thời gian liên tục và biến "thử nghiệm" danh nghĩa (A, B). Đầu ra của ANOVA sẽ cung cấp cho bạn tầm quan trọng của sự khác biệt giữa các tham số. "đánh chặn" là đánh chặn chung và yếu tố "thử nghiệm" sẽ phản ánh sự khác biệt giữa các lần chặn (thực tế là phương tiện tổng thể) giữa các thử nghiệm. Yếu tố "Thời gian" sẽ là độ dốc chung và sự tương tác là sự khác biệt giữa các thử nghiệm đối với xuống dốc.

Tôi phải thừa nhận tôi gian lận (?) Và chạy các mô hình riêng biệt trước để có được hai bộ tham số và lỗi của chúng và sau đó chạy mô hình kết hợp để có được sự khác biệt giữa các phương pháp điều trị (trong trường hợp của bạn là A và B) ...


3
Đây là một cách tiếp cận thông minh. Khi bạn "gian lận", bạn có kiểm tra xem các phương sai lỗi có xấp xỉ như nhau trong mỗi mô hình không? Và nếu chúng xuất hiện khác nhau đáng kể, điều đó ảnh hưởng đến các khuyến nghị của bạn như thế nào?
whuber

GLM là một cách tiếp cận tốt và để khám phá dữ liệu, việc khớp các mô hình riêng biệt là một cách tốt để đánh giá phương sai lỗi giữa các thử nghiệm. Nếu một người thực sự lo ngại, họ có thể mở rộng mô hình GLM để bao gồm các phương sai lỗi cụ thể của nhóm thay vì giả định ngầm định về phương sai lỗi chung cho tất cả dữ liệu thử nghiệm.
prince_of_pears

Một điều nữa xuất hiện là liệu OP có quan tâm đến việc giao dịch hay không, liệu tỷ lệ xuống cấp giữa các thí nghiệm chỉ đơn giản là khác nhau (bỏ qua tỷ lệ tuyệt đối), hoặc liệu các tỷ lệ này cũng có ý nghĩa thống kê (hoặc thực tế) khác với 0 hay không. Số tiền đầu tiên để kiểm tra giả thuyết rằng hệ số tương tác giữa điều trị và thời gian bằng không. Thứ hai là thực hiện hai thử nghiệm riêng biệt (hoặc một thử nghiệm giả thuyết chung) rằng mỗi tỷ lệ khác 0. Tôi có thể quan tâm hơn đến việc thử nghiệm cái thứ hai trước cái thứ nhất.
prince_of_pears

5

Phân tích ANOVA không hiển thị số liệu thống kê F và giá trị p vì giá trị của cả hai mô hình có cùng mức độ tự do (ví dụ 19) và nếu bạn lấy chênh lệch thì nó sẽ bằng không! Cần có ít nhất một mức độ tự do sau khi bạn lấy chênh lệch để thực hiện bài kiểm tra F.


Tôi không chắc chắn nếu tôi hiểu câu trả lời của bạn. Có một lý do mà các mức độ tự do còn lại là bằng nhau? Bất kỳ đề nghị về một phương pháp thay thế để so sánh các sườn dốc?
Rooz

n=21(TreatmentA)orExp1dfT=n1=20dfT=dferror+dfregressorsdferror=19

Có nhiều cách để so sánh chúng ngoài F-test. Cách đơn giản nhất là sử dụng nhiều bình phương R và bình phương R điều chỉnh như bạn có trong các bản tóm tắt. Mô hình có bình phương R bình phương hoặc bình phương R điều chỉnh tốt hơn. Ở đây, mô hình tốt hơn dường như là mô hình có Exp1 $ (Điều trị A). Nhưng hãy nhớ rằng, bạn nên kiểm tra phần dư của mô hình của bạn để kiểm tra mức độ đầy đủ của mô hình được trang bị. Cá nhân tôi không khuyên bạn chỉ nên dựa vào tiêu chí bình phương R và bạn cũng nên kiểm tra các giả định khác trong mô hình tuyến tính. Đặc biệt là xem phần còn lại có tự động tương thích hay không.
Stat
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.