Đầu tiên một nhận xét chung về chế độ:
Bạn không nên sử dụng phương pháp đó để có được chế độ (ít nhất là thông thường) dữ liệu được phân phối liên tục; bạn không thể có bất kỳ giá trị lặp lại nào (trừ khi bạn có các mẫu thực sự lớn, đó sẽ là một phép lạ nhỏ, và thậm chí sau đó các vấn đề số khác nhau có thể khiến nó hoạt động theo những cách hơi bất ngờ), và nói chung bạn sẽ chỉ nhận được giá trị tối thiểu đó đường. Nó sẽ là một cách để tìm một trong các chế độ toàn cầu trong dữ liệu rời rạc hoặc phân loại, nhưng tôi có lẽ sẽ không làm theo cách đó ngay cả sau đó. Dưới đây là một số cách tiếp cận khác để có chế độ cho dữ liệu rời rạc hoặc phân loại:
x = rpois(30,12.3)
tail(sort(table(x)),1) #1: category and count; if multimodal this only gives one
w=table(x); w[max(w)==w] #2: category and count; this can find more than one mode
which.max(table(x)) #3: category and *position in table*; only finds one mode
Nếu bạn chỉ muốn giá trị chứ không phải số lượng hoặc vị trí, names()
sẽ lấy nó từ những
Để xác định các chế độ (có thể có nhiều hơn một chế độ cục bộ) cho dữ liệu liên tục theo kiểu cơ bản, bạn có thể bin dữ liệu (như với biểu đồ) hoặc bạn có thể làm mịn nó ( density
ví dụ sử dụng ) và cố gắng tìm một hoặc nhiều chế độ theo cách đó
Ít thùng biểu đồ sẽ làm cho ước tính của bạn về chế độ ít bị nhiễu hơn, nhưng vị trí sẽ không được ghim xuống tốt hơn chiều rộng thùng (tức là bạn chỉ nhận được một khoảng). Nhiều thùng hơn có thể cho phép độ chính xác cao hơn trong thùng, nhưng tiếng ồn có thể khiến nó nhảy xung quanh nhiều thùng như vậy; một thay đổi nhỏ về nguồn gốc bin hoặc chiều rộng thùng có thể tạo ra những thay đổi tương đối lớn trong chế độ. (Có sự đánh đổi sai lệch thiên vị giống nhau trên tất cả các số liệu thống kê.)
Lưu ý rằng summary
sẽ cung cấp cho bạn một số thống kê cơ bản.
[Bạn nên sử dụng sd(x)
hơn là sqrt(var(x))
; rõ ràng hơn cho một điều]
-
Đối với q.2 có; bạn chắc chắn có thể hiển thị trung bình và trung bình của dữ liệu trên màn hình như biểu đồ hoặc biểu đồ hình hộp. Xem ở đây để biết một số ví dụ và mã mà bạn sẽ có thể khái quát cho bất kỳ trường hợp nào bạn cần.