Làm thế nào để mô tả hoặc trực quan hóa một mô hình hồi quy tuyến tính đa


21

Tôi đang cố gắng điều chỉnh mô hình hồi quy tuyến tính đa biến với dữ liệu của mình với một vài tham số đầu vào, giả sử 3.

(tôi)F(x)= =Mộtx1+Bx2+Cx3+dhoặc là(ii)F(x)= =(Một B C)T(x1 x2 x3)+d

Làm thế nào để tôi giải thích và hình dung mô hình này? Tôi có thể nghĩ về các tùy chọn sau:

  1. Đề cập phương trình hồi quy như được mô tả trong (hệ số, hằng số) cùng với độ lệch chuẩn và sau đó là một biểu đồ lỗi dư để hiển thị độ chính xác của mô hình này. (tôi)

  2. Lô cặp của các biến độc lập và phụ thuộc, như thế này:

    nhập mô tả hình ảnh ở đây

  3. Khi các hệ số đã được biết, các điểm dữ liệu được sử dụng để thu được phương trình có thể được cô đọng lại với các giá trị thực của chúng không. Nghĩa là, dữ liệu huấn luyện có các giá trị mới, ở dạng x thay vì x 1 , x 2 , x 3 , Hoài trong đó mỗi biến độc lập được nhân với hệ số tương ứng của nó. Sau đó, phiên bản đơn giản hóa này có thể được hiển thị trực quan dưới dạng hồi quy đơn giản như sau:(tôi)xx1x2x3Giáo dục

    nhập mô tả hình ảnh ở đây

Tôi bối rối về điều này mặc dù đi qua các tài liệu thích hợp về chủ đề này. Ai đó có thể vui lòng giải thích cho tôi cách "giải thích" mô hình hồi quy tuyến tính đa biến và cách hiển thị trực quan không.


2
Mục đích của tài liệu của bạn là gì và khán giả là ai? Tôi bắt đầu từ việc nhận các bài viết tương tự và tìm kiếm một số ví dụ về cách chúng được thực hiện trong lĩnh vực của riêng bạn. Tôi quen thuộc hơn với văn học y sinh và hầu hết thời gian, chúng tôi chỉ sử dụng một bảng. Minh họa thường thấy hơn khi các tác giả cố gắng giải thích một tương tác.
Penguin_Knight

@Penguin_Knight, đây là trong lĩnh vực khoa học máy tính, tuy nhiên tôi nghĩ đây là một tên chung chứ không giới hạn trong một miền cụ thể. Hãy sửa lại cho tôi nếu tôi sai.
kris

Hmm ... mặc dù câu hỏi. Tôi muốn nói rằng phần chung duy nhất, đối với tôi, là không hiển thị nhiều hơn bạn nên và đảm bảo các thành phần được nhấn mạnh thực sự được nhấn mạnh. Ngay cả trong lĩnh vực của tôi, tôi đã thấy cả ba lựa chọn. 1) lập bảng kết quả là phổ biến nhất, tiếp theo là 3), nhưng chủ yếu là hình thức vẽ kết quả dự đoán, và sau đó là 2). Nhưng đối với 2), tôi sẽ sử dụng những gì @gregory_britten đề xuất: sử dụng X được điều chỉnh thay vì từng X.
Penguin_Knight

sử dụng biểu đồ phân phối .... nhìn vào phân phối của các giá trị được trang bị từ mô hình và so sánh nó với phân phối của các giá trị thực tế.
owais qureshi

Tôi biết điều này là từ nhiều năm trước, nhưng nếu bạn xem lại ở đây, bạn có thể đăng dữ liệu không? Sau đó, mọi người sẽ có một cái gì đó để làm việc để hiển thị các khả năng khác nhau.
gung - Phục hồi Monica

Câu trả lời:


21

XΔY/ΔSd(X). Theo cách này, khoảng cách các hệ số từ 0 xếp hạng 'tầm quan trọng' tương đối của chúng và CI của chúng cho độ chính xác. Tôi nghĩ rằng nó tổng hợp các mối quan hệ khá tốt và cung cấp nhiều thông tin hơn các hệ số và giá trị trên thang đo số tự nhiên và thường khác nhau. Một ví dụ dưới đây:

nhập mô tả hình ảnh ở đây

EDIT: Một khả năng khác là sử dụng 'biểu đồ biến được thêm vào' (nghĩa là biểu đồ hồi quy từng phần). Điều này đưa ra một viễn cảnh khác ở chỗ nó cho thấy mối quan hệ hai biến giữa XYXtôiY~X1+X2+X3XtôiYavPlots()carlm

nhập mô tả hình ảnh ở đây


Cảm ơn @gregory_britten về thông tin này. Vấn đề tôi có trong tay có 8 biến độc lập. Bạn có nghĩ rằng 'các ô biến được thêm vào' sẽ hợp lý cho số lượng lớn các biến đầu vào không?
kris

Theo ý tưởng của cốt truyện đầu tiên, nếu làm việc trong R, tôi khuyên bạn nên xem gói RMS làm cho tất cả điều này trở nên dễ dàng. Điều tốt đẹp là người ta có thể yêu cầu thay đổi bước có ý nghĩa trong hiệp phương sai, do đó tránh được việc phải chuẩn hóa.
Thomas Speidel

@suzanne Có chắc chắn. Biểu đồ biến được thêm vào cung cấp cho bạn các phối cảnh hai chiều cho bất kỳ số lượng biến nào. Nó có thể được đặc biệt tiết lộ trong kích thước cao hơn. Người ta thường tìm thấy các mẫu tiết lộ trong phần dư không rõ ràng trong Y.
gregory_britten

Tôi hoàn toàn không hiểu ký hiệu X1 | X2 & X3 trong ngữ cảnh này. Tôi biết cách nó được sử dụng liên quan đến xác suất, nhưng tôi hoàn toàn không thể hiểu nó đang nói gì ở đây
Casebash

1
@Casebash Đó là hồi quy một phần trên X1, cho X2 và X3 nằm trong mô hình
gregory_britten

1

Vì tất cả đều phải làm với việc giải thích những người đóng góp cho bệnh xơ gan, bạn đã thử thực hiện một biểu đồ bong bóng / vòng tròn và sử dụng màu sắc để chỉ ra các hồi quy và bán kính vòng tròn khác nhau để chỉ ra tác động tương đối đối với bệnh xơ gan?

Tôi đang đề cập ở đây một loại biểu đồ Google trông như thế này:nhập mô tả hình ảnh ở đây

Và trên một lưu ý không liên quan, trừ khi tôi đọc sai âm mưu của bạn, tôi nghĩ rằng bạn có một số hồi quy dư thừa trong đó. Rượu đã là một loại rượu, vì vậy nếu hai loại này là các hồi quy riêng biệt thì sẽ không có ý nghĩa gì trong việc giữ cả hai, nếu mục tiêu của bạn là giải thích tỷ lệ mắc bệnh xơ gan.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.