Khi nào chúng ta sẽ sử dụng tantiles và medial, chứ không phải là quantile và median?


14

Tôi không thể tìm thấy các định nghĩa cho một tantile hoặc medial trên Wikipedia hoặc Wolfram Mathworld, nhưng lời giải thích sau đây được đưa ra trong Bílková, D. và Mala, I. (2012), " Áp dụng phương pháp L-khoảnh khắc khi mô hình hóa phân phối thu nhập ở Cộng hòa Séc ", Tạp chí Thống kê Áo , 41 (2), 125 Tiếng132.

Giá trị trung gian là giá trị của một tantile 50% (mẫu) giống như trung vị mẫu bằng với giá trị của một lượng tử mẫu 50% . Các mẫu tantiles cũng như các lượng tử mẫu được dựa trên một mẫu được đặt hàng. Trước hết, tổng hợp các quan sát trong mẫu được sắp xếp được đánh giá. Sau đó, với phần trăm p , 0<p<100 , một tantile được định nghĩa là giá trị của biến được phân tích, chia tất cả các quan sát trong mẫu được sắp xếp thành hai phần: tổng các quan sát nhỏ hơn hoặc bằng nhau là tổng số quan sát và tổng số quan sát lớn hơn đại diện cho phần dưp % ( 100 - p ) %p%p%(100p)% tổng số tiền này.

Khi nào thì có ý nghĩa khi sử dụng chúng làm thước đo vị trí, thay vì trung bình thông thường hơn hoặc các lượng tử khác? Một tình huống có thể, thu nhập hộ gia đình, được đưa ra trong bài báo đó:

Có thể xuất phát từ định nghĩa này rằng trung gian có thể được sử dụng như một đặc điểm hợp lý của mức thu nhập, vì các hộ gia đình có thu nhập thấp hơn hoặc bằng trung bình nhận được một nửa tổng thu nhập trong mẫu, những người có thu nhập cao hơn hơn trung gian nhận nửa kia.

Trong trường hợp này, thu nhập hộ gia đình trung bình được tìm thấy là 117.497 (tức là một nửa số hộ kiếm được nhiều hơn số này và một nửa kiếm được ở trên), so với thu nhập hộ gia đình trung bình là 133.930 (hộ gia đình có thu nhập trên con số này nhận được một nửa Tổng thu nhập). Lưu ý rằng so sánh này không nhất thiết phản ánh sự sai lệch của thu nhập hộ gia đình, hoặc thậm chí là không đồng đều: ngay cả khi thu nhập hộ gia đình được phân phối đồng đều, trung gian vẫn sẽ nằm trên mức trung bình. Theo như tôi hiểu định nghĩa, trung gian sẽ chỉ bằng trung bình nếu tất cả các hộ gia đình nhận được cùng một thu nhập.

Vì vậy, có bất kỳ lý do cụ thể để thích trung gian trong trường hợp này, hoặc ít nhất là sử dụng nó như là một biện pháp bổ sung? Chính xác thì sự so sánh giữa trung bình và trung gian cho chúng ta điều gì? Dường như không phải là trung gian có thể so sánh trực tiếp với các biện pháp khác của xu hướng trung tâm vì những lý do tôi vừa lưu ý. Có bất kỳ tình huống nào khác mà trung gian / tantiles được sử dụng rộng rãi hoặc được xem là thông tin đặc biệt không? Các ví dụ thực tế về nơi chúng được sử dụng, với các tài liệu nghiên cứu mẫu, sẽ rất được hoan nghênh, và một ý tưởng trực quan về bối cảnh rộng lớn hơn mà chúng có thể chứng minh hữu ích sẽ còn tốt hơn nữa.

Nó phải yêu cầu tổng và tổng phụ phải có ý nghĩa - thứ gì đó có vẻ phù hợp với tiền và cách "chiếc bánh" được phân phối - nhưng ngay cả hành động bổ sung cũng chỉ có ý nghĩa đối với một số lượng nhất định. Đối với các thuộc tính chuyên sâu thay vì rộng rãi , chẳng hạn như mật độ hoặc nhiệt độ, bất kỳ loại tổng nào sẽ không có ý nghĩa vật lý. Đối với tôi, dường như một tài sản rộng rãi là cần thiết nhưng không đủ để các tantiles trở nên hữu ích, vì tôi có thể tưởng tượng một nhà phân tích vận chuyển quan tâm đến trọng lượng hàng hóa vận chuyển là bao nhiêu để 50% tổng số hàng hóa (tính theo trọng lượng) mang theo trọng lượng nặng hơn hoặc cao hơn, nhưng tôi không thể tưởng tượng được một nhà sinh thái học quan tâm đến độ dài của newt như thế nào mà 50% tổng chiều dài của tất cả các loài mới được đóng góp bởi những con mồi có độ dài đó trở lên.


3
@NickCox Theo như tôi hiểu, trung vị đưa ra một giá trị giới hạn trong đó nói đại khái (tôi hoàn toàn bỏ qua vấn đề quan hệ) một nửa số hộ nhận được nhiều hơn số bị cắt và một nửa số hộ nhận được ít hơn nó. Trung gian đưa ra một mức cắt giảm khác nhau, sao cho tổng thu nhập của các hộ gia đình nhận được nhiều hơn mức cắt giảm chiếm 50% tổng thu nhập, trong khi tổng thu nhập của các hộ gia đình nhận được ít hơn mức cắt giảm chiếm 50% tổng thu nhập.
Cá bạc

2
Một mẹo vặt: Tôi trở nên tò mò tò mò từ điều này sau khi nhận xét của @ttnphns về một câu hỏi trước đây của tôi ; có nghĩa là (số học, hình học, hài hòa, cung cấp năng lượng, hàm mũ, tổ hợp, v.v.) là "trung bình phân tích". Trung vị, lượng tử, tantiles là "trung bình vị trí".
Cá bạc

4
Cảm ơn; Tôi đọc sai điều này, và đánh giá cao sự điều chỉnh. Tôi đã sắp xếp lại từ "tổng các quan sát" thành "tổng các giá trị", vì "tổng các quan sát" quá gần với "số lượng quan sát" đối với tôi. Hoặc có lẽ tôi đang tìm kiếm một cái cớ .... Nên có một kết nối với các đường cong Lorenz. Các biện pháp có vẻ chỉ hữu ích nếu biến liên quan là phụ gia hoặc rộng rãi. Ngài David Cox thường nhấn mạnh tầm quan trọng của việc các biến có mở rộng hay không. Do đó, thật hợp lý khi xem xét tổng thu nhập, tổng lượng mưa, nhưng không phải là tổng thu nhập gỗ hoặc tổng nhiệt độ.
Nick Cox

2
@NickCox Tôi nghĩ rằng tính mở rộng là một điểm tuyệt vời (và cách viết lại được đề xuất của bạn cũng sẽ là một sự cải thiện), mặc dù đối với tôi, một tài sản rộng rãi là cần thiết nhưng không đủ để các tantiles có ích. Có vẻ như chúng ta có thể quan tâm, ví dụ như trọng lượng của hàng hóa được vận chuyển là bao nhiêu để 50% tất cả hàng hóa (tính theo trọng lượng) được mang theo trọng lượng đó hoặc cao hơn; nhưng tôi không thể tưởng tượng được việc quan tâm đến độ dài của newt là bao nhiêu sao cho 50% tổng chiều dài của tất cả các newts được đóng góp bởi các newts có độ dài đó trở lên.
Cá bạc

1
Tôi đồng ý trong thực tế, nhưng tôi không nghĩ rằng nguyên tắc bị ảnh hưởng. Câu trả lời cho "Nhưng điều đó sẽ không thú vị hoặc hữu ích" không nhất thiết phải luôn luôn hiển thị nguyên tắc toán học hoặc thống kê; đó cũng là phạm vi cho "Đừng làm điều đó sau đó!".
Nick Cox

Câu trả lời:


3

Đây thực sự là một bình luận, nhưng quá dài cho một bình luận. Nó đang cố gắng làm rõ định nghĩa của "tantile" (trong trường hợp p=0.5 tương tự như trung vị). Đặt X là một biến ngẫu nhiên hoàn toàn liên tục (đơn giản) với hàm mật độ f(x) . Chúng tôi cho rằng kỳ vọng μ=EX không tồn tại, đó là không thể thiếu μ=xf(x)dx hội tụ. Xác định, Tương tự với hàm phân phối tích lũy, một "chức năng kỳ vọng tích lũy" (Tôi chưa bao giờ thấy một khái niệm như vậy, nó có một cái tên chính thức?) Bởi

G(t)=txf(x)dx
đó "tantile" là nghiệmt của phương trìnhG(t)=μ/2 .

Giải thích này có đúng không? Đây có phải là những gì đã được dự định?

Để trở lại câu hỏi ban đầu, trong bối cảnh phân phối thu nhập, tantile là giá trị thu nhập sao cho một nửa tổng thu nhập dành cho những người có thu nhập trên và một nửa tổng thu nhập dành cho những người có thu nhập dưới mức đó.

EDIT

Các đại lượng này (hàm G(t) ở trên) có liên quan đến các biện pháp rủi ro khác nhau được sử dụng trong một số tài liệu tài chính, chẳng hạn như "thiếu hụt dự kiến".

Hãy xem bài báo AJ Ostaszewski & MB Gietzmann: "Tạo giá trị với lựa chọn tiết lộ của thuốc nhuộm: Bảo vệ rủi ro tối ưu với chiến lược tiết lộ trên đuôi" (có thể năm 2006), đặc biệt là vào khoảng trang 15, nơi họ định nghĩa một cái gì đó mà họ gọi là "Hemi- có nghĩa là "có liên quan đến G(t) ở trên", cũng là "sự thiếu hụt dự kiến ​​liên quan đến t và còn được gọi là $ một phần thời gian thấp hơn đầu tiên". Sẽ rất thú vị khi xem xét các kết nối này ...

Một thuật ngữ khác được sử dụng cho ý tưởng này là "kỳ vọng một phần". Xem ví dụ /math/1080530/the-partial-recectation-mathbbex-xk-for-an-alpha-urdy-distribution-r và sử dụng google!

Ngoài ra, cuốn sách Kotz & Kleiber: "Phân phối kích thước thống kê trong khoa học kinh tế và tính toán" cung cấp thông tin liên quan, trên trang 22 họ định nghĩa (Ở đây X>0 )

Fk(x)=1EXk0xtkf(t)dt
mà là "k phân phối th-khoảnh khắc", lưu ý rằngG(t)=μF1(t) nên về cơ bản là phân phối đầu tiên-lát. Họ đề cập đến Champernowne (1974), người gọiF1 là "đường cong thu nhập" và biểu thị cdfF cơ bảnbằngF0 . Về mặt phân phối khoảnh khắc đầu tiên, đường cong Lorenz có thể được cho là
{(u,L(u))}={(u,v):u=F(x),v=F1(x);x0}


1
Cảm ơn vì sự bổ sung - Tôi sẽ phải đọc một số thông tin về ngoại hình của nó!
Cá bạc
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.