Câu hỏi đã được trả lời trong phần khẳng định, nhưng chúng ta hãy tiếp cận vấn đề này từ quan điểm xây dựng - làm thế nào để chúng ta tạo ra một tập hợp dữ liệu thực hiện điều này?
Đầu tiên, lưu ý rằng chúng tôi luôn có thể làm cho cả ba thước đo vị trí lớn hơn phạm vi. Đơn giản chỉ cần xây dựng một tập dữ liệu sơ bộ có trung bình> chế độ> trung bình và tính toán phạm vi. Bây giờ, thêm (trung bình phạm vi) + (đối với một số dương nhỏ ) vào tất cả các giá trị dữ liệu để có được tập dữ liệu cuối cùng, trong đó ba thước đo vị trí sẽ vượt quá phạm vi.ϵϵ
Vì vậy, bây giờ chúng tôi đã giảm vấn đề xuống một trong việc tìm một tập dữ liệu có nghĩa là trung bình> chế độ>.
Hãy tưởng tượng chúng ta đã có một số dữ liệu với chế độ và trung vị phù hợp. Để làm cho giá trị trung bình nhỏ hơn giá trị trung bình và chế độ, bạn chỉ cần đặt một giá trị đủ xa bên dưới phần lớn dữ liệu mà giá trị trung bình được kéo xuống; chúng ta có thể đặt một giá trị thứ hai ngay phía trên phần lớn dữ liệu để giữ trung vị ở vị trí cũ mà không thay đổi chế độ. Vì vậy, bây giờ chúng ta có thể sửa đổi một tập dữ liệu hiện có chỉ đơn giản là có chế độ trung bình> và có được một tập hợp có ý nghĩa ở nơi chúng ta muốn.
Vì vậy, hãy để chúng tôi tạo một với chế độ trung bình>. Chúng ta có thể làm điều này bằng cách lặp lại một giá trị (nếu đó là giá trị duy nhất xảy ra hai lần, đó là chế độ mẫu) và sau đó thêm đủ các giá trị khác để làm cho giá trị trung bình lớn hơn. Đây là một ví dụ:
21, 21, 22, 23, 24
Trung vị là 22 nhưng chế độ là 21.
Bây giờ, hãy thêm hai điểm như được mô tả trước đây, theo cách như vậy để tạo ra giá trị trung bình 20 mà không thay đổi trung vị hoặc chế độ. Điểm hiện tại tổng bằng 111, vì vậy chúng ta cần hai điểm cộng với 140-111 = 29, và một trong số chúng chỉ lớn hơn 24. Hãy tạo ra 25. Sau đó, điểm nhỏ hơn là 29-25 = 4.
Vì vậy, bây giờ tập dữ liệu của chúng tôi là:
4, 21, 21, 22, 23, 24, 25
Nó có nghĩa là 20, chế độ 21 và trung vị 22.
Bây giờ hãy sửa mối quan hệ của những người có phạm vi. Phạm vi là gì? Đó là 25-4 = 21, hiện tại lớn hơn giá trị trung bình. Chúng ta chỉ cần thêm một cái gì đó vào mỗi giá trị dữ liệu để làm cho giá trị trung bình lớn hơn 21, khiến cho phạm vi không bị thay đổi. Thêm 2 sẽ đủ. (Lưu ý rằng phạm vi trung bình + 1 = 2, vì vậy chúng tôi có thể thấy rằng chúng tôi đã lấy )ϵ=1
Vì vậy, tập dữ liệu cuối cùng của chúng tôi là
6, 23, 23, 24, 25, 26, 27
Phạm vi vẫn là 21, trung bình là 22, chế độ là 23, trung vị là 24
Vì vậy, cách tiếp cận từng bước này khá dễ sử dụng. Tóm tắt:
Tạo một tập dữ liệu nhỏ với chế độ trung bình> bằng cách lặp lại giá trị nhỏ nhất và phân biệt tất cả các giá trị lớn hơn (dễ sử dụng nhất là các giá trị được sắp xếp). Có 5 điểm là thuận tiện (vì nó cho phép bạn chỉ định trung vị bằng cách di chuyển giá trị trung bình) nhưng 4 là khả thi nếu cần.
Lấy giá trị trung bình bên dưới trung vị bằng cách thêm hai điểm không làm thay đổi trung vị hoặc chế độ (nghĩa là hai giá trị riêng biệt / đơn lẻ sẽ không làm phiền chế độ và đặt chúng ở một trong hai phía dữ liệu trước đó sẽ bảo toàn trung vị; ngay phía trên tất cả các dữ liệu hiện tại và sau đó tính toán nhỏ nhất để giá trị trung bình tổng thể xuất hiện ngay bên dưới chế độ. Điều này đưa chúng ta đến 7 điểm dữ liệu.
Tính toán phạm vi. Thêm một hằng số (phạm vi - trung bình + ) cho tất cả các giá trị dữ liệu, đảm bảo rằng giá trị trung bình vượt quá phạm vi. Đây là bộ dữ liệu cuối cùng.ϵ
Kiểm tra các tính toán trong R:
x <- c(6, 23, 23, 24, 25, 26, 27)
data.frame(
range=diff(range(x)),
mean=mean(x),
mode=max(as.numeric(names(table(x))[table(x)==max(table(x))])),
median=median(x)
)
range mean mode median
1 21 22 23 24
(lưu ý rằng nếu chúng ta bằng cách nào đó tình cờ tạo ra nhiều hơn một chế độ, phép tính này sẽ cố gắng tìm ra chế độ lớn nhất trong số chúng)