Vẽ đồ thị mẫu nhỏ


13

Tôi có một bộ dữ liệu nhỏ gồm 14 lần riêng biệt để hoàn thành một nhiệm vụ. Tuy nhiên tôi gặp khó khăn khi tìm một biểu đồ thích hợp để sử dụng để vẽ biểu đồ dữ liệu. Nếu mẫu lớn hơn tôi sẽ sử dụng biểu đồ hình hộp hoặc biểu đồ nhưng tôi không chắc liệu nó có phù hợp để sử dụng trong trường hợp này không khi mẫu quá nhỏ.

Cập nhật: Thời gian là 5,2,3,9,5,6,4,2,3,8,4,1,6,0,5,6,4,4,4,5,4,9,4,5,4,9,4,2


4
Không có nhịp đập nào cho thấy dữ liệu thực mà bạn quan tâm như một ví dụ cụ thể để khuyến khích mọi người đăng các giải pháp khác nhau. Trước tôi đề nghị chấm hoặc dải và các ô lượng tử với hộp được phủ.
Nick Cox

Câu trả lời:


16

Tôi nghĩ nguyên tắc chính yếu ở đây là bạn có thể và nên thể hiện tất cả các giá trị riêng lẻ. Ngay cả khi chi tiết rõ ràng không thú vị hoặc hữu ích, không có lý do gì để không hiển thị nó, hoặc bắt buộc người đọc phải giải mã (nói) một biểu đồ trong đó các thanh có thể chỉ đại diện cho một hoặc hai giá trị.

Tôi cung cấp ở đây một hỗn hợp nhỏ. Trên cùng bên trái là một ô chấm hoặc dải (ít nhất hai mươi tên khác đã được sử dụng cho cùng một ý tưởng) được trình bày theo chiều ngang và trên cùng bên phải cùng một ý tưởng được trình bày theo chiều dọc. Trường hợp có cùng giá trị được khớp bằng cách xếp chồng.

Ở phía dưới là một ô hộp lượng tử, theo nghĩa của Parzen, trong đó tỷ lệ ngang ngầm là xác suất tích lũy (vị trí âm mưu, trong một thuật ngữ chung) và hộp tứ phân vị thông thường có thể được rút ra sao cho (về nguyên tắc) các giá trị nằm trong hộp, như luôn được quảng cáo và một nửa giá trị bên ngoài. Đường ngang thêm ở đây đại diện cho giá trị trung bình. Một số người thêm phương tiện vào ô sơ đồ như một biểu tượng điểm thêm hoặc điểm đánh dấu; Tôi thấy rằng có thể xung đột với việc hiển thị dữ liệu và tôi thích một dòng thêm. Nếu đường trung bình và đường trung bình xuất hiện trùng khớp, bạn sẽ cần phải nghĩ phải làm gì. Hầu như luôn luôn là trung bình và trung bình là khác nhau rõ ràng.

Có thể cho rằng đó là tiêu chuẩn để làm cho các đơn vị đo lường rõ ràng trên biểu đồ, nhưng tôi không thấy chúng là gì.

nhập mô tả hình ảnh ở đây

(Tôi cố tình đẩy thêm một điểm ở đây, đó là đồ thị có thể rất nhỏ nhưng vẫn có nhiều thông tin. Trong thực tế, tôi sẽ không làm cho chúng khá nhỏ như vậy.)

BIÊN TẬP:

Các tham chiếu chéo được thêm vào các ô hộp lượng tử theo nghĩa rộng của Parzen (các tham chiếu tiếp theo trong phần hai bên dưới; các cách sử dụng khác của "các ô hộp lượng tử" tồn tại)

Làm cách nào để đo sự khác biệt giữa dữ liệu không tham số với nhiều số không?

Làm thế nào để sử dụng các ô vuông để tìm điểm mà các giá trị có nhiều khả năng đến từ các điều kiện khác nhau?

Làm thế nào để hình dung độc lập hai bài kiểm tra mẫu?

Làm cách nào để có được thử nghiệm nào hoạt động tốt hơn bằng cách sử dụng Thử nghiệm Mann-Whitney U?

Shera, DM 1991. Một số sử dụng các lô định lượng để tăng cường trình bày dữ liệu. Khoa học máy tính và thống kê 23: 50-53.

Militký, J. và M. Meloun. 1993. Một số công cụ hỗ trợ đồ họa để phân tích dữ liệu thăm dò đơn biến. Phân tích Chimica Acta 277: 215-221.

Meloun, M. và J. Militký. 1994. Xử lý dữ liệu với sự trợ giúp của máy tính trong hóa học phân tích. I. Phân tích thăm dò dữ liệu đơn biến. Giấy tờ hóa học 48: 151-157.

EDIT 2:

Điểm chính của các chủ đề này không chỉ là trả lời câu hỏi ngay lập tức, mà là chạm vào những câu hỏi gần giống nhau có thể khiến người khác quan tâm.

Một số thiết kế đồ thị khác trong các câu trả lời khác ở đây hiển thị số nhận dạng, được dán nhãn nông nghiệp 1 ... 14 trong trường hợp không có chi tiết khác. Giả sử rằng những cái này và các định danh khác được sử dụng để giải thích, một thiết kế đơn giản để hiển thị chúng là biểu đồ dấu chấm (Cleveland). Đây là hai trong số một số khả năng, trong đó thứ tự định danh được tôn trọng theo nghĩa đen (bên trái) và trong đó các giá trị được sắp xếp (bên phải). Có rất nhiều chỗ cho nhãn dài hơn nếu cần.

Một lợi thế của thiết kế này so với biểu đồ thanh là trục phản hồi hoặc trục kết quả có thể bắt đầu ở giá trị không bằng 0 nếu đó có vẻ là một lựa chọn tốt hơn.

Xoay các biểu đồ sao cho trục phản ứng thẳng đứng cũng có thể được tưởng tượng dễ dàng.

nhập mô tả hình ảnh ở đây


(+1) Đôi khi tôi đã nhìn thấy ô chấm hoặc dải, đặc biệt là nếu được định hướng theo chiều dọc, với các điểm "xếp chồng" được căn giữa thay vì căn lề trái (nghĩa là nếu có ba điểm được xếp chồng lên nhau thì điểm giữa sẽ phù hợp với điểm chưa khai phá). Điều này mang lại một dòng đối xứng rất thẩm mỹ nhưng tôi không chắc nó thực sự có lợi như thế nào. Có lẽ nó làm cho nó dễ dàng hơn để đặt một hộp. Cái này có tên riêng không, bạn có biết không? Và đã có lời khuyên nào để tránh / chấp nhận nó chưa?
Cá bạc

1
Ngoài ra, có bất kỳ cơ hội nào bạn có thể đưa ra một tài liệu tham khảo cho Parzen không? Tôi đã luôn thích những mảnh đất này nhưng chưa bao giờ thực sự đọc một tài liệu tham khảo thích hợp cho chúng.
Cá bạc

Các biến thể @Silverfish Centered (trung tâm) chắc chắn là phổ biến và thường được thảo luận. Các vấn đề nhỏ dường như là một mong muốn đối xứng, như bạn đề cập, so với một thiết kế để giống với phong cách biểu đồ, mà tôi có xu hướng thích một chút, nhưng đó là vấn đề của hương vị và hoàn cảnh. Tôi đã thêm các tài liệu tham khảo chéo và lần lượt sẽ chào đón những người khác.
Nick Cox

3

@Nick Cox đã đưa ra một số ví dụ hay, hai tùy chọn khác mà tôi sử dụng thường xuyên là cốt truyện hình hộp với các điểm bị che khuất hoặc bị xáo trộn đôi chút,

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

Với mã R

times<-c(5.2,3.9,5.6,4.2,3.8,4.1,6.0,5.6,4.4,4.5,4.9,4.5,4.9,4.2)
boxplot(times)
points(rep(1,length(times)),times,cex = 3, pch = 'x')

boxplot(times)
points(jitter(rep(1,length(times)),amount = 0.1),times,cex = 3, pch = 'x')

EDIT: Bạn cũng có thể sử dụng một âm mưu violin nếu bạn muốn

ggplot(data.frame(times), aes(x = rep(0,length(times)), y = times)) + geom_violin() + geom_jitter()

nhập mô tả hình ảnh ở đây


1
Cám ơn rất nhiều vì câu trả lời. Tôi đã miễn cưỡng sử dụng các ô hộp trong các phân tích của mình ban đầu do kích thước của mẫu. Nhưng sau khi xem các sách giáo khoa khác nhau, có vẻ như cỡ mẫu của tôi là đủ.
Eamonn

1

Câu hỏi của bạn làm tôi nhớ đến kỹ thuật được mô tả trong bài đăng trên blog này . Đó là về hình dung của các sự kiện rời rạc.

Thủ thuật cốt lõi là cốt truyện the time before an eventx the time after an event.

Dữ liệu của bạn được trực quan hóa [1]

Điều này có thể là tình cờ, nhưng đến khu vực giữa trên không chứa dữ liệu. Vì vậy, có một số cấu trúc có thể nhìn thấy.


Mã nhanh và bẩn R.

data <- c(5.2,3.9,5.6,4.2,3.8,4.1,6.0,5.6,4.4,4.5,4.9,4.5,4.9,4.2)
x=data[1:12]
y=data[2:13]
plot(x,y, col="white", xlab="Time before an event", ylab="Time after an event"  )
for (i in 1:12) {
    text(x[i],y[i], i)
}

OP nói 14 lần riêng biệt. Tôi đọc nó như ngụ ý rằng đây không phải là một bộ. Nếu họ là một loạt, ý tưởng của bạn chắc chắn là thích hợp.
Nick Cox

Bạn có thể đúng. Tuy nhiên, ngay cả khi chúng không phải là một chuỗi, biểu đồ sẽ hiển thị các phụ thuộc giữa các lần. Rõ ràng các nhãn trục là sai sau đó.
Harald Thomson

2
Chỉ OP mới có thể làm rõ chính xác dữ liệu là gì, nhưng tôi không nghĩ biểu đồ này sẽ thắng. Nếu dữ liệu là thời gian riêng biệt, thì biểu đồ là vô nghĩa trừ khi có ý nghĩa đối với thứ tự mà các giá trị được đưa ra.
Nick Cox

fyi textcó các đối số vector - text(x, y, 1:12)nên làm việc.
MichaelChirico

1

Một ý tưởng khác, vì bạn đang sử dụng thời gian.

Một âm mưu đường đua - một barplot có tọa độ cực - cho hiệu ứng tương tự như đồng hồ bấm giờ:

đường đua

Lý tưởng nhất là các nhãn quan sát sẽ được đặt trên các thanh hoặc ít nhất là ở đầu kia. Ngay bây giờ người xem có thêm căng thẳng để theo dõi xem quan sát nào (lên / xuống) khi thực hiện bất kỳ so sánh.


2
Tôi phải coi đó là một người lập dị, thực sự là một kỹ thuật đồ thị hoàn toàn đồi trụy. Mắt nhìn thấy không phải chiều dài của cung, mà là một khu vực được giải mã như vậy, nhưng não phải can thiệp và gạch dưới rằng chỉ có góc xoay là thông tin. Thậm chí rất khó để xem chính xác giá trị nào nhỏ hơn, bằng hoặc lớn hơn giá trị khác, tức là trong bất kỳ kiểu biểu đồ có thể chấp nhận nào.
Nick Cox

Điểm cộng duy nhất tôi có thể thấy cho thiết kế này, trừ khi việc chấm điểm dành cho thiết kế khác thường, đó là các định danh # 1 đến # 14 ngay lập tức trong thiết kế này. Tôi đã chọn điểm này trong một chỉnh sửa cho câu trả lời của riêng tôi.
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.