Sự khác biệt giữa mô hình tuyến tính và hồi quy tuyến tính


8

Tôi quan tâm đến sự khác biệt giữa hồi quy tuyến tính và mô hình tuyến tính. Theo hiểu biết của tôi, hồi quy tuyến tính là một phần của một nhóm mô hình tuyến tính lớn hơn nhưng cả hai thuật ngữ thường được sử dụng làm từ đồng nghĩa. Bây giờ, nó đã được đề xuất với tôi, rằng tôi có thể thay thế phân tích hồi quy bằng mô hình tuyến tính để bỏ qua các giả định cần phải đáp ứng khi thực hiện hồi quy tuyến tính. Nếu bạn có bất kỳ gợi ý đọc về chủ đề này, họ rất hoan nghênh.

Tôi muốn bạn giúp tôi tìm hiểu xem những gì tôi làm

  • là hồi quy tuyến tính, và nên được xử lý như nó
  • có thể được thay thế bằng một "mô hình tuyến tính"
  • phương pháp của tôi là đồng nghĩa với một "mô hình tuyến tính"

Vì vậy, đây là những gì tôi đã làm ngắn gọn. Mục đích của phân tích là vẽ một đường thẳng trong một âm mưu phân tán. Cả độ dốc và điểm giao nhau của đường thẳng với trục x sẽ được sử dụng để phân tích tập dữ liệu. Biến kết cục là tỷ lệ (nồng độ mỗi lần) của một nguyên tố hóa học và yếu tố dự đoán là tỷ lệ của hai nồng độ (vì vậy không có đơn vị nào). Tôi đo tốc độ trong các môi trường khác nhau (độ sâu), phải được so sánh trong một ô. Chỉ một trong những độ sâu không phù hợp với giả định hồi quy.

  1. Tôi đã sử dụng hàm lm trong R để tính phương trình tuyến tính.
  2. Tôi đã kiểm tra phần dư của đối tượng lm.
  3. Tôi thấy rằng phần dư không được phân phối bình thường cũng không có phương sai bằng nhau.
  4. Tôi đã hình dung rằng sự biến đổi log của biến thiên kết quả (tỷ lệ) sẽ khắc phục phương sai, nhưng phần dư vẫn không được phân phối bình thường.
  5. Tôi đã quyết định sử dụng một phương thức mạnh mẽ để phương trình sẽ ít bị sai lệch bởi các ngoại lệ, mà tôi không thể loại trừ khỏi phân tích (hàm lmrob, gói mạnh mẽ).
  6. Tôi không vẽ đường thẳng vì chuyển đổi log. Có một dữ liệu khác trong cốt truyện không cần phải chuyển đổi nhật ký, nhưng phải tương đương với dữ liệu gây rắc rối. Bạn cũng không thể mở rộng cốt truyện bằng một quy mô khác, bởi vì cốt truyện gốc là một phần của thiết kế nhiều cốt truyện, đã khá rộng rãi.

Có lẽ với mục đích của tôi, các giả định hồi quy không được quan tâm? Ngay bây giờ, tôi khá bế tắc về những việc cần làm, vì vậy cảm ơn bạn đã giúp đỡ!


2
Một câu hỏi liên quan ở đây .
Richard Hardy

Bạn có thể nói thêm một chút về vấn đề của bạn trong tay: bản chất của dữ liệu (đặc biệt, là bất kỳ tích cực nào); việc chuyển đổi nhật ký đã được thực hiện trên các yếu tố dự đoán hay biến kết quả; tại sao bạn không thể "vẽ đường thẳng vì chuyển đổi log".
EdM

@Richard Hardy: Cảm ơn bạn đã bình luận, nhưng tôi vẫn không chắc chắn về những gì phải làm trong trường hợp của tôi.
Syrafina 17/03/2016

@EdM: Tôi đã cố gắng cụ thể hơn một chút và chỉnh sửa câu hỏi của mình. Tôi đã không thêm vào nhiều chi tiết bởi vì tôi nghĩ vấn đề của tôi là vấn đề chung hơn. Hy vọng rằng, chỉnh sửa là một trợ giúp cho ý kiến ​​về câu hỏi.
Syrafina 17/03/2016

@Syrafina, tôi không biết câu trả lời cho câu hỏi của bạn; Nhận xét của tôi chỉ vào một chủ đề hơi liên quan, đó là nó.
Richard Hardy

Câu trả lời:


2

Cách đơn giản nhất để giải quyết vấn đề tức thời của bạn, với hầu hết dữ liệu của bạn phù hợp với hồi quy tuyến tính đơn giản ngoại trừ dữ liệu từ một độ sâu, là tách riêng vấn đề của mô hình khỏi hiển thị kết quả mô hình. Đối với một độ sâu yêu cầu chuyển đổi các biến, chuyển đổi ngược lại hồi quy phù hợp với thang đo ban đầu trước khi vẽ đồ thị. Đối với một độ sâu đó, bạn sẽ có một đường cong chứ không phải là các đường thẳng đặc trưng cho các độ sâu khác, nhưng bạn vẫn nên có một x-chặn hữu ích và độ dốc của đường cong gần đó sẽ là sự khởi đầu để so sánh độ dốc giữa các độ sâu.

Tuy nhiên, bạn nên xem xét tại sao độ sâu đặc biệt này dường như có các tính chất khác nhau như vậy từ các độ sâu khác. Đây có phải là một cực trị của các giá trị độ sâu, có lẽ vượt ra ngoài một số loại ranh giới (liên quan đến nhiệt độ, pha trộn, v.v.) so với các độ sâu khác không? Hoặc có thể chỉ là các phép đo ở độ sâu cụ thể đó có một số lỗi hệ thống, trong trường hợp nào bạn không nên xem xét chúng? Các vấn đề khoa học và kỹ thuật như vậy quan trọng hơn nhiều so với các chi tiết của phương pháp thống kê.

Đối với các vấn đề rộng hơn được nêu trong câu hỏi của bạn, các giả định về các mô hình tuyến tính được thảo luận rộng rãi trên trang web này, ví dụ ở đây . Độ tuyến tính của kết quả liên quan đến các biến dự đoán là rất quan trọng, nhưng các giả định khác như phân phối lỗi thông thường chủ yếu ảnh hưởng đến khả năng diễn giải giá trị p . Nếu có tính tuyến tính đối với các biến dự đoán, hồi quy vẫn sẽ đưa ra ước tính hữu ích về mối quan hệ cơ bản. Các mô hình tuyến tính tổng quát cung cấp một cách để xử lý các lỗi là một hàm của giá trị dự đoán, như bạn dường như có cho một độ sâu đáng lo ngại đó.

Lưu ý rằng thiết kế thử nghiệm của bạn, nếu đó là nghiên cứu quan sát dựa trên nồng độ hóa chất được đo ở các độ sâu khác nhau, đã vi phạm một trong các giả định của hồi quy tuyến tính tiêu chuẩn, vì có lẽ có lỗi trong các giá trị của các biến dự đoán. Những gì bạn thực sự có trong trường hợp đó là một mô hình lỗi-biến . Trong thực tế, sự khác biệt đó thường bị bỏ qua, nhưng các mô hình hồi quy của bạn (và của hầu hết các nhà khoa học tham gia vào nghiên cứu quan sát thay vì kiểm soát) đã vi phạm các giả định hồi quy tuyến tính nghiêm ngặt.

Cuối cùng, mặc dù tôi đánh giá cao rằng bạn đã thực hiện nhiều phân tích dữ liệu, hãy xem xét liệu bạn có thực sự nên sử dụng tỷ lệ tập trung khôngnhư các biến dự đoán. Các tỷ số nổi tiếng là rắc rối, đặc biệt là nếu mẫu số có thể gần bằng 0. Hầu như mọi thứ có thể được thực hiện với tỷ lệ như các yếu tố dự đoán đều có thể được thực hiện với các phép biến đổi log của biến tử số và mẫu số. Theo tôi hiểu tình hình của bạn, bạn có một biến kết cục duy nhất (tỷ lệ sản xuất một số hóa chất) và nhiều nồng độ đo được của các hóa chất khác; Sau đó, bạn đã kiểm tra các tỷ lệ khác nhau của các hóa chất khác như là các yếu tố dự đoán cho biến kết quả. Thay vào đó, nếu bạn hình thành mô hình hồi quy kết hợp sử dụng nồng độ log của tất cả các hóa chất khác làm công cụ dự đoán kết quả, bạn có thể kết thúc bằng một mô hình hữu ích hơn, có thể hiển thị các tương tác bất ngờ giữa các hóa chất và vẫn có thể được hiểu theo thuật ngữ tỷ lệ nếu bạn muốn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.