Trung bình> Chế độ> Trung bình> Phạm vi


8

Câu hỏi của tôi là: Có một tập hợp dữ liệu cho phép trung vị lớn hơn chế độ, chế độ lớn hơn giá trị trung bình và giá trị trung bình lớn hơn phạm vi không? Nếu vậy, có một mẫu, hoặc một đặc tính cụ thể của bộ dữ liệu để cho phép tình huống này (độ lệch của một số loại có thể ...)?

PS tôi đã sửa lỗi đánh máy của tôi. Một số câu trả lời đã được đưa ra liên quan đến tình huống ngược lại


6
Tiêu đề của bạn có dấu hiệu, nhưng văn bản nói "nhỏ hơn" trong mỗi trường hợp. Câu trả lời sẽ giống nhau, nhưng tốt nhất là làm cho câu hỏi của bạn nhất quán. >
Nick Cox

5
Không có nhiều ý nghĩa cho các tiêu chí như vậy. Đó là bởi vì (a) bằng cách tập trung một xác suất nhỏ trong một dải rất hẹp, bạn có thể tạo một chế độ ở bất kỳ giá trị nào mà không thay đổi đáng kể giá trị trung bình hoặc trung vị; (b) bằng cách đặt một xác suất nhỏ vào một giá trị cực đoan, bạn có thể đặt giá trị trung bình ở bất kỳ đâu trong phạm vi mà không thay đổi đáng kể chế độ hoặc trung vị; và (c) bằng cách bao gồm các giá trị cực lớn hoặc nhỏ với xác suất rất nhỏ, bạn có thể làm cho phạm vi lớn như bạn muốn mà không cần thay đổi đáng kể bất kỳ thuộc tính nào khác.
whuber

5
Nó cũng không có ý nghĩa bao gồm phạm vi, thước đo độ rộng của phân phối, với ba thước đo của xu hướng trung tâm.
prince_of_pears

@Giuseppe Biondi-Zoccai Chỉnh sửa của bạn nhằm mục đích hữu ích, nhưng chúng tôi thường không chỉnh sửa câu hỏi bất cứ khi nào có thể OP bị nhầm lẫn về điểm kỹ thuật, thậm chí sử dụng ký hiệu đơn giản.
Nick Cox

@prince_of_pears Phạm vi thứ nguyên có cùng đơn vị với các thực thể khác, do đó, so sánh có ý nghĩa toán học . Tôi đồng ý rằng tôi không thể thấy mục đích thống kê đối với những so sánh như vậy, nhưng đó là một vấn đề khác và có thể là một phần của câu hỏi mà OP cần làm rõ. Hãy xem xét rằng có rất nhiều bối cảnh trong đó so sánh SD và có nghĩa là có ý nghĩa và sau đó không phải là thông lệ để phản đối rằng người ta đo chiều rộng và vị trí khác.
Nick Cox

Câu trả lời:


8

Câu hỏi đã được trả lời trong phần khẳng định, nhưng chúng ta hãy tiếp cận vấn đề này từ quan điểm xây dựng - làm thế nào để chúng ta tạo ra một tập hợp dữ liệu thực hiện điều này?

Đầu tiên, lưu ý rằng chúng tôi luôn có thể làm cho cả ba thước đo vị trí lớn hơn phạm vi. Đơn giản chỉ cần xây dựng một tập dữ liệu sơ bộ có trung bình> chế độ> trung bình và tính toán phạm vi. Bây giờ, thêm (trung bình phạm vi) + (đối với một số dương nhỏ ) vào tất cả các giá trị dữ liệu để có được tập dữ liệu cuối cùng, trong đó ba thước đo vị trí sẽ vượt quá phạm vi.ϵϵ

Vì vậy, bây giờ chúng tôi đã giảm vấn đề xuống một trong việc tìm một tập dữ liệu có nghĩa là trung bình> chế độ>.

Hãy tưởng tượng chúng ta đã có một số dữ liệu với chế độ và trung vị phù hợp. Để làm cho giá trị trung bình nhỏ hơn giá trị trung bình và chế độ, bạn chỉ cần đặt một giá trị đủ xa bên dưới phần lớn dữ liệu mà giá trị trung bình được kéo xuống; chúng ta có thể đặt một giá trị thứ hai ngay phía trên phần lớn dữ liệu để giữ trung vị ở vị trí cũ mà không thay đổi chế độ. Vì vậy, bây giờ chúng ta có thể sửa đổi một tập dữ liệu hiện có chỉ đơn giản là có chế độ trung bình> và có được một tập hợp có ý nghĩa ở nơi chúng ta muốn.

Vì vậy, hãy để chúng tôi tạo một với chế độ trung bình>. Chúng ta có thể làm điều này bằng cách lặp lại một giá trị (nếu đó là giá trị duy nhất xảy ra hai lần, đó là chế độ mẫu) và sau đó thêm đủ các giá trị khác để làm cho giá trị trung bình lớn hơn. Đây là một ví dụ:

 21, 21, 22, 23, 24

Trung vị là 22 nhưng chế độ là 21.

Bây giờ, hãy thêm hai điểm như được mô tả trước đây, theo cách như vậy để tạo ra giá trị trung bình 20 mà không thay đổi trung vị hoặc chế độ. Điểm hiện tại tổng bằng 111, vì vậy chúng ta cần hai điểm cộng với 140-111 = 29, và một trong số chúng chỉ lớn hơn 24. Hãy tạo ra 25. Sau đó, điểm nhỏ hơn là 29-25 = 4.

Vì vậy, bây giờ tập dữ liệu của chúng tôi là:

4, 21, 21, 22, 23, 24, 25

Nó có nghĩa là 20, chế độ 21 và trung vị 22.

Bây giờ hãy sửa mối quan hệ của những người có phạm vi. Phạm vi là gì? Đó là 25-4 = 21, hiện tại lớn hơn giá trị trung bình. Chúng ta chỉ cần thêm một cái gì đó vào mỗi giá trị dữ liệu để làm cho giá trị trung bình lớn hơn 21, khiến cho phạm vi không bị thay đổi. Thêm 2 sẽ đủ. (Lưu ý rằng phạm vi trung bình + 1 = 2, vì vậy chúng tôi có thể thấy rằng chúng tôi đã lấy )ϵ=1

Vì vậy, tập dữ liệu cuối cùng của chúng tôi là

6, 23, 23, 24, 25, 26, 27

Phạm vi vẫn là 21, trung bình là 22, chế độ là 23, trung vị là 24

Vì vậy, cách tiếp cận từng bước này khá dễ sử dụng. Tóm tắt:

  1. Tạo một tập dữ liệu nhỏ với chế độ trung bình> bằng cách lặp lại giá trị nhỏ nhất và phân biệt tất cả các giá trị lớn hơn (dễ sử dụng nhất là các giá trị được sắp xếp). Có 5 điểm là thuận tiện (vì nó cho phép bạn chỉ định trung vị bằng cách di chuyển giá trị trung bình) nhưng 4 là khả thi nếu cần.

  2. Lấy giá trị trung bình bên dưới trung vị bằng cách thêm hai điểm không làm thay đổi trung vị hoặc chế độ (nghĩa là hai giá trị riêng biệt / đơn lẻ sẽ không làm phiền chế độ và đặt chúng ở một trong hai phía dữ liệu trước đó sẽ bảo toàn trung vị; ngay phía trên tất cả các dữ liệu hiện tại và sau đó tính toán nhỏ nhất để giá trị trung bình tổng thể xuất hiện ngay bên dưới chế độ. Điều này đưa chúng ta đến 7 điểm dữ liệu.

  3. Tính toán phạm vi. Thêm một hằng số (phạm vi - trung bình + ) cho tất cả các giá trị dữ liệu, đảm bảo rằng giá trị trung bình vượt quá phạm vi. Đây là bộ dữ liệu cuối cùng.ϵ


Kiểm tra các tính toán trong R:

x <- c(6, 23, 23, 24, 25, 26, 27)
data.frame(
     range=diff(range(x)),
     mean=mean(x),
     mode=max(as.numeric(names(table(x))[table(x)==max(table(x))])),
     median=median(x)
   )

  range mean mode median
1    21   22   23     24

(lưu ý rằng nếu chúng ta bằng cách nào đó tình cờ tạo ra nhiều hơn một chế độ, phép tính này sẽ cố gắng tìm ra chế độ lớn nhất trong số chúng)


Cảm ơn bạn, lời giải thích này là hoàn toàn tuyệt vời. Có một đặc điểm lý thuyết của một loạt các số như vậy? Ý tôi là, người ta biết rằng nếu chế độ trung bình> trung bình> thì phân phối bị lệch. Mặt khác, nếu có nghĩa là chế độ <trung vị <thì nó bị lệch. Có một đặc điểm phân phối trong ràng buộc này?
BlueSigma

1. Nếu bạn xác định độ lệch về mối quan hệ giữa trung bình và trung bình (như hệ số Pearson thứ hai độ lệch , trung bình-độ lệch) hoặc trong điều khoản của một mối quan hệ giữa chế độ và trung bình (như hệ số Pearson đầu tiên độ lệch; chế độ-độ lệch) sau đó một phân phối với chế độ trung bình> trung bình> bị lệch dương. Mặt khác, nó không nhất thiết phải như vậy - ví dụ nếu tôi xác định độ lệch theo thời điểm trung tâm thứ ba của một biến được tiêu chuẩn hóa ( độ lệch ) ... ctd
Glen_b -Reinstate Monica

ctd ... hoặc xét về độ lệch tứ phân thì không nhất thiết là trường hợp có nghĩa là> trung vị> chế độ ngụ ý độ lệch dương. 2. Tôi không chắc chắn 100% những gì bạn đang hỏi ... đặc điểm có liên quan của bộ số là số liệu thống kê bạn đã đề cập theo thứ tự mong muốn, theo cách xây dựng. Thống kê xuất phát từ sự khác biệt trong các thống kê đó (như độ lệch trung bình hoặc độ lệch chế độ) sẽ là dấu hiệu ngụ ý, nhưng đó là hậu quả của việc đáp ứng các điều kiện. Bên ngoài mà tôi không chắc chắn những gì bạn tìm kiếm ở đây.
Glen_b -Reinstate Monica

10

Vâng, không khó để đưa ra một bộ như vậy.

S = {0, 1, 2, 3, 4, 4, 1000}

Trung vị = 3, Chế độ = 4, Trung bình = 144,85, Phạm vi = 1000

Dữ liệu thuộc loại này sẽ lệch sang phải, vì giá trị trung bình của bạn cao hơn trung bình, ngụ ý rằng trung bình, các giá trị trên trung vị nằm xa hơn các giá trị bên dưới.


2
Xin lưu ý rằng câu hỏi đã được làm rõ để có sự bất bình đẳng theo cách khác - nhưng điều đó dễ dàng được sửa chữa với một sự điều chỉnh nhỏ của các giá trị: {1000, 1996, 1996, 1997, 1998, 1999, 2000}: median 1997, mode = Năm 1996, trung bình = 1855,14, phạm vi = 1000
RM

Về mặt khái niệm tôi nghĩ tốt hơn là nghĩ về điều này về mặt phân phối xác suất. Giá trị trung bình trung bình và chế độ là các giá trị số cho biến ngẫu nhiên. Phạm vi là độ dài của tập hợp các giá trị có thể. Nó không thể so sánh với các tham số khác. Đối với phân phối bình thường, giá trị trung bình, trung vị và chế độ đều bằng nhau. Có một vấn đề về định nghĩa về chế độ. Nếu chỉ có một đỉnh trong mật độ thì không có sự mơ hồ. Nhưng nếu bạn có nhiều hơn một đỉnh thì một số xác định chế độ là đỉnh cao nhất trong khi những người khác nói rằng tất cả các đỉnh là chế độ;
Michael R. Chernick

Trong trường hợp phân phối đồng đều, không có chế độ vì. Không có đỉnh. Đối với các phân phối không đối xứng đối xứng với hữu hạn có nghĩa là trung bình bằng với chế độ. Đối với các phân phối lệch, thỏa mãn các điều kiện về giá trị trung bình và trung bình và chế độ cho tất cả tồn tại và là duy nhất, bất kỳ thứ tự nào cũng có thể nhưng tất cả chúng không thể bằng nhau.
Michael R. Chernick

@Michael Chernick Không phải vậy. 0, 0, 1, 1, 1, 1, 3 có giá trị trung bình, trung vị và chế độ giống hệt nhau tại 1 nhưng nó không đối xứng. Nếu điều này được cho là giả định, nhị thức rõ ràng là bị lệch và có nghĩa là, trung vị và chế độ giống hệt nhau ở 1, và có trường hợp khác như vậy. (10k)0.1k0.910k,k=0,,10
Nick Cox

Trên các bản phân phối thống nhất, tôi đồng ý rằng không có chế độ hữu ích nhưng cũng có thể lập luận rằng mọi giá trị có thể là một chế độ.
Nick Cox

4

Bất kể thứ tự là gì, câu trả lời là có. Các tập dữ liệu là tập hợp con của các bản phân phối, có đuôi bên trái nặng hơn đuôi bên phải thường sẽ có chế độ nhỏ hơn trung vị và trung bình nhỏ hơn giá trị trung bình và trung bình nhỏ hơn phạm vi. Một bản phân phối beta với chế độ lớn hơn 1/2 sẽ có thuộc tính đó. Nếu muốn có chế độ ở bất kỳ vị trí cụ thể nào, người ta có thể thực hiện phân phối hỗn hợp bằng cách thêm một tỷ lệ nhỏ độ lệch chuẩn (nhỏ) nhưng phân phối cao, ví dụ: Dirac , bất cứ nơi nào người ta muốn đặt chế độ đó.δ


1
Mặc dù đối với các phân phối không theo phương thức theo một nghĩa cụ thể, có ý nghĩa giữa chế độ và trung vị có thể được coi là phổ biến hơn với các biến ngẫu nhiên rời rạc hơn với các biến ngẫu nhiên liên tục: xem Paul T. von Hippel, Mean, Median và Skew: Sửa sách giáo khoa Quy tắc , Tạp chí Giáo dục Thống kê Tập 13, Số 2 (2005) hoặc suy nghĩ của tôi . Quy tắc sách giáo khoa, quá tự tin về một tuyên bố của Karl Pearson, là có trung vị giữa chế độ và ý nghĩa
Henry

Điểm tốt (+1) và chế độ có thể ở bất cứ đâu.
Carl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.