Điều này làm mờ xung quanh dòng có ý nghĩa gì trong biểu đồ này?


8

Tôi đã chơi xung quanh với ggplot2 bằng cách sử dụng các lệnh sau để khớp một dòng với dữ liệu của tôi:

ggplot(data=datNorm, aes(x=Num, y=Val)) + geom_point() + 
stat_summary(fun.data = "mean_cl_boot", geom="errorbar", colour="red", width=0.8) + 
stat_sum_single(median) + 
stat_sum_single(mean, colour="blue") + 
geom_smooth(level = 0.95, aes(group=1), method="lm")

Các chấm màu đỏ là giá trị trung bình, màu xanh là phương tiện và các đường màu đỏ dọc hiển thị các thanh lỗi. Bước cuối cùng, tôi đã sử dụng geom_smoothđể điều chỉnh một dòng bằng cách sử dụng làm mịn tuyến tính nên tôi đã sử dụng method="lm". Cùng với dòng, một bóng mờ xỉn cũng được tạo ra xung quanh dòng. Trong khi tôi tìm ra cách loại bỏ nó khỏi tài liệu, tùy chọn tôi sử dụng để tắt nó là:

se: display confidence interval around smooth? 

Ai đó có thể vui lòng cho tôi biết những gì tôi phải hiểu từ bóng râm xung quanh? Cụ thể, tôi đang cố gắng hiểu làm thế nào để giải thích nó. Nó có thể là một số tốt phù hợp cho dòng có lẽ nhưng bất kỳ thông tin bổ sung có thể rất hữu ích cho tôi. Bất kỳ đề xuất?

nhập mô tả hình ảnh ở đây

Câu trả lời:


6

Tôi nghi ngờ nó có nghĩa là rất ít trong con số thực tế của bạn; bạn đã vẽ một hình thức của biểu đồ / biểu đồ. Nhưng vì chúng ta không có dữ liệu hoặc ví dụ có thể lặp lại, tôi sẽ chỉ mô tả những gì các dòng / vùng này nói chung.

Nói chung, dòng là mô hình tuyến tính được trang bị mô tả mối quan hệ Dải bóng mờ là khoảng tin cậy 95% trên các giá trị được trang bị (đường thẳng ). Khoảng tin cậy này chứa dòng thực, dân số, hồi quy với xác suất 0,95. Hay nói cách khác, có 95% tin tưởng rằng đường hồi quy thực sự nằm trong vùng bóng mờ. Nó cho chúng ta thấy sự không chắc chắn vốn có trong ước tính của chúng ta về mối quan hệ thực sự giữa phản ứng của bạn và biến dự đoán.

vmộttôi^= =β0+β1Nbạnm

Cảm ơn bạn đã phản hồi và thời gian của bạn. Tôi sẽ dành một chút thời gian để hiểu nhận xét đầu tiên của bạn về lý do tại sao nó có ý nghĩa nhỏ trong biểu đồ của tôi. Thay vì vẽ một biểu đồ thanh với giá trị trung bình, tôi đã vẽ một biểu đồ dải để có cái nhìn thoáng qua về việc có bao nhiêu điểm được sử dụng. Nhưng hãy sửa tôi nếu tôi nhầm. Câu hỏi cuối cùng của tôi sẽ là nếu có mối quan hệ giữa khoảng tin cậy 95% này và khoảng tin cậy 95% được hiển thị bởi các thanh lỗi. Cụ thể, nó có nghĩa gì đối với dòng được trang bị ở trên hoặc dưới các thanh lỗi? Hay chúng hoàn toàn độc lập và nên được giải thích riêng?
Truyền thuyết

Nếu phương sai x là phân loại, có thể không có ý nghĩa gì khi coi nó là 1 bậc tự do, thuật ngữ tuyến tính, đó là cách nó đã được xử lý trong tính toán của dòng được trang bị. Ngoài ra, dữ liệu của bạn không xuất hiện để thể hiện giả định phương sai không đổi cho phần dư của mô hình. Các biểu đồ không phải là vấn đề, đó là liệu hồi quy của các dữ liệu này có ý nghĩa hay không. Dòng được trang bị sẽ gần với (hoặc thậm chí có thể, ai đó có thể sửa cho tôi) một dòng phù hợp nhất thông qua các phương tiện nhóm.
Gavin Simpson

Cảm ơn bạn rất nhiều vì cái nhìn sâu sắc của bạn. Tôi sẽ đọc thêm về giả định phương sai không đổi cho phần dư.
Truyền thuyết

2
Hừm. Tôi không hoàn toàn chắc chắn lời giải thích của bạn là chính xác - mặc định là rút ra khoảng tin cậy theo điểm 95% . Tôi không nghĩ điều đó hoàn toàn giống với việc có 95% khả năng đường hồi quy thực sự nằm trong vùng bóng mờ.
hadley

@hadley tát đầu có, đó sẽ là khoảng tin cậy đồng thời. Sẽ nâng cấp.
Gavin Simpson
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.