Hiển thị trung bình thay vì trung vị trong boxplot [đã đóng]


15

Khi vẽ một boxplot với python matplotblib, các dòng ở giữa cốt truyện là trung tuyến của phân phối.

Có khả năng thay vào đó có dòng ở mức trung bình. Hoặc để vẽ nó bên cạnh nó theo một phong cách khác.

Ngoài ra, vì thông thường dòng này là trung vị, liệu nó có thực sự gây nhầm lẫn cho độc giả của tôi nếu tôi biến nó thành mức trung bình (tất nhiên tôi sẽ thêm một ghi chú về dòng giữa là gì)?

Câu trả lời:


25

Mã này làm cho các ô vuông sau đó đặt một vòng tròn đánh dấu giá trị trung bình cho mỗi hộp. Bạn có thể sử dụng một ký hiệu khác bằng cách chỉ định đối số đánh dấu trong lệnh gọi đến scatter.

import numpy as np
import pylab

# 3 boxes
data = [[np.random.rand(100)] for i in range(3)]
pylab.boxplot(data)

# mark the mean    
means = [np.mean(x) for x in data]
pylab.scatter([1, 2, 3], means)

văn bản thay thế


3
Xem stackoverflow.com/questions/2492947/ cho các giải pháp sử dụng R
James

1
@James: Tôi không cố gắng trở thành một kẻ ngốc và độc thân với bạn nhưng nhận xét của bạn đặt ra một câu hỏi từ tôi. Tại sao bất cứ khi nào bất cứ ai trên diễn đàn này hỏi rõ ràng làm thế nào để làm một cái gì đó bằng ngôn ngữ không phải R (vì R là mặc định trên thực tế ), ai đó luôn phải đề xuất sử dụng R? Tôi không tìm thấy nhiều chuyện. Các lập trình viên của SAS thường không bình luận về "Làm thế nào để tôi làm X trong R?" câu hỏi với "Đây là cách thực hiện trong SAS ...". Tôi biết mọi người yêu R (và tôi cũng vậy), nhưng ...
Josh Hemann

20

Để trả lời câu hỏi thứ hai của bạn: Có, tôi nghĩ sẽ khó hiểu khi đặt dòng ở mức trung bình thay vì trung bình. Các quy tắc chính xác kiểm soát độ dài của 'râu ria' (nếu có) và cách xử lý các ngoại lệ khác nhau, nhưng mọi người đều sử dụng hộp của Tukey như hiển thị các tứ phân vị trung bình và thấp hơn và cao hơn. Đối với các bản phân phối có độ lệch cao, giá trị trung bình có thể nằm ngoài hộp, trông sẽ rất kỳ quặc. Cách sử dụng phổ biến là trung vị đi với phạm vi liên dải, trong khi giá trị trung bình đi với độ lệch chuẩn (hoặc sai số chuẩn của giá trị trung bình nếu bạn quan tâm đến suy luận thay vì mô tả dữ liệu). Nếu bạn muốn hiển thị trung bình một cách trực quan, tôi sẽ sử dụng một biểu tượng khác để hiển thị nó để tránh nhầm lẫn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.