Giải thích về phạm vi liên vùng là gì?


9

Tôi có đo hàng ngày của nitơ dioxide trong một năm (365 ngày) và tứ phân vị (IQR) là 24 microgram mỗi mét khối. "24" có nghĩa là gì trong bối cảnh này, ngoài định nghĩa về IQR, sự khác biệt giữa phân vị thứ 25 và 75 là gì? Làm thế nào bạn sẽ giải thích con số này cho một nhà báo, ví dụ?

Cảm ơn


trung bình hoặc trung bình là gì?
mpiktas

Câu trả lời:


18

Từ định nghĩa, điều này xác định phạm vi phù thủy giữ 75-25 = 50 phần trăm của tất cả các giá trị đo được.

: (trung vị-24/2, trung vị + 24/2). Median nên được viết ở đâu đó gần IQR này.
Tất nhiên, trên đây là sai, có vẻ như tôi vẫn còn ngủ khi viết bài này; xin lỗi về sự nhầm lẫn. Đúng là IQR là chiều rộng của một phạm vi chứa 50% dữ liệu, nhưng nó không tập trung ở vị trí trung bình - người ta cần biết cả Q1 và Q3 để bản địa hóa phạm vi này.

Nói chung IQR có thể được xem như là một số không ((khi chúng ta không cho rằng phân phối là Gaussian) tương đương với độ lệch chuẩn - cả hai đều đo lường sự lan truyền của dữ liệu. (Tương đương không bằng nhau, đối với SD, (mean- , mean + ) giữ 68,2% dữ liệu được phân phối hoàn toàn bình thường).σσσ

EDIT: Ví dụ, đây là cách nó trông trên dữ liệu bình thường; các dòng màu đỏ hiển thị , phạm vi được hiển thị bởi ô trên ô biểu đồ cho thấy IQR, biểu đồ hiển thị chính dữ liệu: bạn có thể thấy cả hai hiển thị trải đều khá tốt; phạm vi giữ 68,3% dữ liệu (như mong đợi). Bây giờ đối với dữ liệu không bình thường , chênh lệch SD được mở rộng do đuôi dài không đối xứng và giữ 90,5% dữ liệu! (IQR giữ 50% trong cả hai trường hợp theo định nghĩa)± 1 σ ± 1 σ±1σvăn bản thay thế
±1σ
văn bản thay thế
±1σ


13

Đây là một câu hỏi đơn giản yêu cầu một câu trả lời đơn giản. Dưới đây là danh sách các tuyên bố, bắt đầu với những điều cơ bản nhất và tiến hành với những bằng cấp chính xác hơn.

IQR là sự lây lan của nửa giữa của dữ liệu.

Không đưa ra các giả định về cách phân phối dữ liệu , IQR định lượng số lượng theo đó các giá trị riêng lẻ thường thay đổi.

IQR liên quan đến "độ lệch chuẩn" nổi tiếng (SD): khi dữ liệu đi theo "đường cong hình chuông", IQR lớn hơn SD khoảng 35%. (Tương đương, SD là khoảng 3/4 của IQR.)

Theo nguyên tắc thông thường, các giá trị dữ liệu lệch khỏi giá trị trung bình hơn hai lần IQR xứng đáng được chú ý. Chúng được gọi là "ngoại lệ." Các giá trị dữ liệu lệch khỏi giá trị trung bình hơn 3,5 lần IQR thường được xem xét kỹ lưỡng. Chúng đôi khi được gọi là "xa hơn."


6

Phạm vi liên vùng là một khoảng , không phải là vô hướng. Bạn phải luôn báo cáo cả hai số, không chỉ là sự khác biệt giữa chúng. Sau đó, bạn có thể giải thích điều đó bằng cách nói rằng một nửa số đọc mẫu nằm giữa hai giá trị này, một phần tư nhỏ hơn phần tư dưới và cao hơn một phần tư so với phần tư trên.


4
@onestop Điều này nhắc tôi nghĩ liệu IQR nên là một khoảng hay vô hướng. Từ Wikipedia, nó được định nghĩa là vô hướng và phù hợp với những gì tôi đã học được.
dùng2742

2
Tôi đã luôn biết rằng IQR là sự khác biệt giữa phần tư thứ 3 và thứ nhất, do đó là một vô hướng.
nico

2
Mặc dù IQR có thể được định nghĩa là vô hướng, nhưng nếu nó được báo cáo là một khoảng thì nó mang nhiều thông tin hơn. Ví dụ [-1,1] và [499,501] sẽ có cùng phạm vi, nhưng hàm ý thì khác nhau.
mpiktas

1
(IMHO) IQR là một vô hướng: nó là chiều dài của một khoảng. Rõ ràng, vì luôn luôn có thể chuyển từ cái thứ hai (nằm trong tập con của R ^ 2) sang cái thứ nhất (nằm trong R +) nhưng không phải là ngược lại, cái sau có nhiều thông tin hơn cái trước.
thủy tinh

1
Tôi dự đoán điều này sẽ gây tranh cãi và nhận ra rằng đó không phải là định nghĩa thông thường , nhưng tôi nghĩ nó là một định nghĩa hữu ích hơn. Theo kinh nghiệm của tôi về các tài liệu y khoa, việc báo cáo cả hai bộ tứ là IQR phổ biến hơn là sự khác biệt giữa chúng và tôi rất vui vì điều đó.
vào

1

Nói một cách đơn giản, tôi sẽ nói với một nhà báo rằng tôi có thể tuyên bố mức độ nitơ dioxide hàng ngày là chắc chắn, sau khi loại bỏ các giá trị cao nhất và các giá trị thấp nhất, rằng trong mỗi một nửa số ngày trong năm đó, giá trị quan sát được là không vượt quá khoảng cách IQR / 2 từ mức khai báo.

Ví dụ: nếu phần tư thứ nhất và phần tư thứ ba của bạn là 100 và 124, bạn có thể nói rằng mức hàng ngày là 112 (trung bình là 100 và 124) và đảm bảo với người đối thoại của bạn rằng trong một nửa số ngày bạn mắc lỗi không lớn hơn 12 .


Bạn có thể giải thích sự khác biệt mà bạn đang thực hiện giữa mức độ "quan sát" và "khai báo" không? (Tôi cũng nghi ngờ một nhà báo tốt sẽ bị làm phiền bởi những ngụ ý rằng bạn đang "vứt bỏ" giá trị và sẽ theo dõi với một số câu hỏi khó :-).)
whuber

@whuber: Tôi thêm một ví dụ cho câu trả lời của tôi. Về các câu hỏi khó, tôi cho rằng chúng phát sinh ngay cả khi bạn trả lời đề cập đến phân phối bình thường (như các câu trả lời khác cho câu hỏi này), hoặc một số khái niệm khác. Có thể đơn giản hơn để giải thích một ý nghĩa được phân tích 50%? Nếu đúng như vậy, thì hãy nói rằng IQR là chiều dài của phạm vi quan sát của nó
thủy tinh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.