'Bagplot', hay 'bivariate boxplot' là gì?


11

Tôi đã tìm thấy một bài báo giới thiệu phiên bản đa chiều (bivariate here) của boxplot - một bagplot. Bagplot chính xác là gì? Tôi có thể thấy một loạt các đa giác lồng nhau dựa trên các đỉnh, một trong những đa giác đó được khai báo là một bagplot. Ý tưởng xây dựng đa giác lồng nhau là gì? Mà đa giác là bagplot (trung tâm hoặc giữ số điểm trung bình)? Các cạnh của bagplot có một số thuộc tính hữu ích (như phân chia cụ thể tập hợp điểm) không?


3
Có một bài viết của Rousseeuw, Pits và Tukey trong American Statistician giải thích những điều này. Tôi, vì một số lý do, gặp khó khăn khi dán liên kết, nhưng Googling "bagplot" và "Tukey" sẽ tìm thấy nó
Peter Flom - Rebstate Monica

1
Chỉ tìm thấy nó cho giá thái quá. Vẫn đang tìm kiếm.
mbaitoff

1
Nếu bạn có quyền truy cập vào bất kỳ thư viện phong nha, họ nên có nó. American Statistician được đăng ký khá rộng rãi. Ngoài ra còn có một cái gì đó trên quora, nhưng tôi đã không nhìn vào nó.
Peter Flom - Phục hồi Monica

2
Rousseeuw và Ruts có một bài viết trực tuyến khác ngoài bài viết của American Statistician ở định dạng bài viết miễn phí.
Andy W

@AndyW, Hỏi bạn với tư cách là một đồng nghiệp SPSS: bạn nghĩ làm thế nào để có thể làm điều đó thông qua GPL bằng cách nào đó? Bạn sẽ phát minh ra mã cho chúng tôi SPSSers?
ttnphns

Câu trả lời:


13

Dưới đây là một ví dụ có ghi chú:

Đây là bài viết The Bagplot: A Bivariate Boxplotcủa Peter J. Rousseeuw, Ida Ruts & John W. Tukey từ The American Statistician: http://venus.unive.it/romanaz/ada2/bagplot.pdf

Từ bản tóm tắt của bài viết đó:

Trung bình độ sâu của người Hồi giáo là vị trí sâu nhất, và nó được bao quanh bởi một túi túi vua có chứa các quan sát n / 2 với độ sâu lớn nhất. Phóng đại chiếc túi theo hệ số 3 mang lại hàng rào trên sàn gỗ (không được vẽ). Các quan sát giữa túi và hàng rào được đánh dấu bằng một vòng màu xám nhạt, trong khi các quan sát bên ngoài hàng rào được gắn cờ là các ngoại lệ. Bagplot trực quan hóa vị trí, sự lây lan, mối tương quan, độ lệch và đuôi của dữ liệu.

Dưới đây là một minh họa về các phần chính:

nhập mô tả hình ảnh ở đây

Thảo luận thêm có thể được tìm thấy sau đây:

Từ các tài liệu trợ giúp của aplpackgói (dành cho Rngười dùng):

Một bagplot là một khái quát bivariate của boxplot nổi tiếng. Nó đã được đề xuất bởi Rousseeuw, Ruts và Tukey. Trong trường hợp bivariate, hộp của boxplot thay đổi thành vỏ lồi, túi bagplot. Trong túi là 50 phần trăm của tất cả các điểm. Hàng rào ngăn cách các điểm trong hàng rào với các điểm bên ngoài. Nó được tính bằng cách tăng túi. Vòng lặp được định nghĩa là đa giác lồi chứa tất cả các điểm bên trong hàng rào. Nếu tất cả các điểm nằm trên một đường thẳng, bạn sẽ có được một boxplot cổ điển. bagplot () vẽ đồ thị bagplot rất giống với mô tả trong Rousseeuw et al. Lưu ý: Trung bình hai chiều là gần đúng. Có những khó khăn đã biết với các tập dữ liệu nhỏ (Nhưng tôi nghĩ sẽ không khôn ngoan khi thực hiện tóm tắt (đồ họa) ví dụ 10 điểm.)

Trong trường hợp mọi người muốn vẽ đồ thị nhiều túi (chồng lên nhau), sẽ thuận tiện nếu các ô được bán trong suốt. Vì lý do này, cờ trong suốt đã được thêm vào lệnh bagplot. Nếu độ trong suốt == TRUE, lớp alpha được đặt thành '99' (hex). Điều này làm cho các bagplots xuất hiện bán trong suốt, nhưng CHỈ nếu thiết bị đầu ra là PDF và được mở bằng: pdf (file = "filename.pdf", version = "1.4"). Vì lý do này, mặc định là minh bạch == FALSE. Tính năng này cũng như các đối số để chỉ định các màu khác nhau đã được đề xuất bởi Wouter Meuleman.

Và một ví dụ:

library(aplpack)
attach(mtcars)
bagplot(wt, mpg, xlab="Car Weight", 
        ylab="Miles Per Gallon",
        main="Bagplot Example", 
        transparency = TRUE, 
        show.whiskers = FALSE, 
        # note that data a 'fence' separates inliers from outliers, 
        # and a 'loop' indicates the points outside the bag but 
        # inside the fence. In the 'bag' are 50 percent of all 
        # points
        show.loophull = TRUE, # draw 'loop'?
        show.baghull = TRUE)  # draw 'bag'?

nhập mô tả hình ảnh ở đây

Câu hỏi liên quan:


4
Cập nhật: ai đó đã tạo một ggplot2 geom cho việc này: gist.github.com/benmarwick/00772ccea2dd0b0f1745 . Có lẽ một người dùng dám nghĩ dám làm có thể biến điều này thành một gói?
Shadowtalker
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.