Ví dụ thực tế của các bản phân phối với độ lệch âm


20

Lấy cảm hứng từ " các ví dụ thực tế về phân phối chung ", tôi tự hỏi những ví dụ sư phạm mà mọi người sử dụng để chứng minh sự sai lệch tiêu cực là gì? Có rất nhiều ví dụ "kinh điển" về phân phối đối xứng hoặc bình thường được sử dụng trong giảng dạy - ngay cả khi những ví dụ như chiều cao và cân nặng không tồn tại sự giám sát sinh học chặt chẽ hơn! Huyết áp có thể gần bình thường hơn. Tôi thích các lỗi đo lường thiên văn - về lợi ích lịch sử, chúng theo trực giác không có khả năng nằm theo một hướng hơn hướng khác, với các lỗi nhỏ có nhiều khả năng hơn lớn.

Các ví dụ sư phạm phổ biến cho sự sai lệch tích cực bao gồm thu nhập của mọi người; mileage trên xe đã qua sử dụng để bán; lần phản ứng trong một thí nghiệm tâm lý học; giá nhà; số lượng yêu cầu bồi thường tai nạn của một khách hàng bảo hiểm; số trẻ em trong một gia đình. Tính hợp lý vật lý của chúng thường bắt nguồn từ việc bị ràng buộc bên dưới (thường bằng 0), với các giá trị thấp là hợp lý, thậm chí phổ biến, nhưng rất lớn (đôi khi các đơn đặt hàng có cường độ cao hơn) được biết đến.

Đối với những sai lệch tiêu cực, tôi thấy khó đưa ra những ví dụ rõ ràng và sinh động mà khán giả nhỏ tuổi hơn (học sinh trung học) có thể nắm bắt bằng trực giác, có lẽ vì ít phân phối thực tế hơn có giới hạn trên rõ ràng. Một ví dụ tồi tệ tôi được dạy ở trường là "số ngón tay". Hầu hết dân gian có mười, nhưng một số mất một hoặc nhiều tai nạn. Kết quả cuối cùng là "99% số người có số ngón tay cao hơn mức trung bình"! Polydactyly làm phức tạp vấn đề, vì mười không phải là một giới hạn trên nghiêm ngặt; vì cả hai ngón tay bị mất và thừa là những sự kiện hiếm gặp, có thể không rõ ràng đối với học sinh có ảnh hưởng chiếm ưu thế.

Tôi thường sử dụng phân phối nhị thức với cao . Nhưng sinh viên thường thấy "số lượng thành phần thỏa đáng trong một lô bị lệch" ít trực quan hơn thực tế bổ sung rằng "số lượng thành phần bị lỗi trong một lô bị lệch dương". (Sách giáo khoa có chủ đề công nghiệp; tôi thích trứng nứt và nguyên vẹn trong hộp mười hai.) Có lẽ học sinh cảm thấy rằng "thành công" nên hiếm.p

Một lựa chọn khác là chỉ ra rằng nếu bị lệch dương thì bị lệch, nhưng đặt điều này trong bối cảnh thực tế ("giá nhà âm bị lệch") dường như bị thất bại về mặt sư phạm. Mặc dù có những lợi ích trong việc dạy các tác động của biến đổi dữ liệu, nhưng có vẻ khôn ngoan khi đưa ra một ví dụ cụ thể trước tiên. Tôi thích cái không có vẻ giả tạo, trong đó độ lệch âm khá rõ ràng và kinh nghiệm sống của sinh viên sẽ cho họ nhận thức về hình dạng của phân phối.XX


4
Không rõ ràng rằng phủ định một biến sẽ là một "thất bại sư phạm", bởi vì có tùy chọn thêm một hằng số mà không thay đổi hình dạng của phân phối. Ví dụ, nhiều phân phối sai lệch liên quan đến tỷ lệ và tỷ lệ bổ sung thường tự nhiên và dễ hiểu như tỷ lệ ban đầu. Ngay cả với giá nhà các giá trị trong đó là giá nhà tối đa trong khu vực có thể được quan tâm và không khó hiểu. Cũng xem xét sử dụng các bản ghi và biến đổi công suất âm để tạo độ lệch âm. X1XXCXC
whuber

2
Tôi đồng ý rằng trong trường hợp giá nhà sẽ có một chút giả định. Nhưng sẽ không: đó sẽ là "số tiền bạn có thể mua mỗi đô la." Tôi nghi ngờ rằng trong bất kỳ khu vực đồng nhất hợp lý, điều này sẽ có một độ lệch tiêu cực mạnh. Những ví dụ như vậy có thể dạy cho bài học sâu sắc hơn rằng độ lệch là một chức năng của cách chúng ta thể hiện dữ liệu. CX1/X
whuber

3
@whuber Nó sẽ không bị chiếm đoạt chút nào. Giá tiềm năng tối đa và tối thiểu trong một thị trường phát sinh một cách tự nhiên khi những người phản ánh những đánh giá khác nhau của những người tham gia thị trường. Trong số những người mua, có thể hình dung một người sẽ trả giá tối đa cho một ngôi nhà nhất định. Và trong số những người bán có một người có thể chấp nhận mức giá tối thiểu. Nhưng thông tin này không công khai và do đó giá giao dịch được quan sát thực tế bị ảnh hưởng bởi sự tồn tại của thông tin không đầy đủ. (LIÊN TỤC)
Alecos Papadopoulos

1
LIÊN TỤC ... Bài viết sau đây của Kumbhakar và Parmeter (2010) mô hình chính xác điều đó (cho phép cả trường hợp đối xứng) và với một ứng dụng trên thị trường nội địa: link.springer.com/article/10.1007/s00181-009 -0292-8 # trang-1
Alecos Papadopoulos

3
Tuổi chết là tiêu cực lệch ở các nước phát triển.
Nick Cox

Câu trả lời:


3

Ở Anh, giá của một cuốn sách. Có một "giá bán lẻ được đề xuất" thường sẽ là giá theo phương thức, và hầu như không nơi nào bạn sẽ phải trả nhiều hơn. Nhưng một số cửa hàng sẽ giảm giá, và một số ít sẽ giảm giá mạnh.

Ngoài ra, tuổi khi nghỉ hưu. Hầu hết mọi người nghỉ hưu ở tuổi 65-68, đó là khi lương hưu nhà nước bắt đầu, rất ít người làm việc lâu hơn, nhưng một số người nghỉ hưu ở độ tuổi 50 và khá nhiều vào đầu thập niên 60.

Sau đó, số lượng GCSE người nhận được cũng vậy. Hầu hết trẻ em được nhập vào 8-10 và vì vậy nhận được 8-10. Một số nhỏ làm nhiều hơn. Tuy nhiên, một số trẻ không vượt qua tất cả các bài kiểm tra của mình, vì vậy có sự gia tăng ổn định từ 0 đến 7.


1
Điều này có lẽ cần một lời giải thích rằng GCSE là một kỳ thi ở các trường trung học Anh và một số hệ thống liên quan, thường được thực hiện ở tuổi khoảng 16. Số lượng các môn học được thực hiện, ví dụ Toán học thường là một môn học.
Nick Cox

18

Nick Cox nhận xét chính xác rằng "tuổi chết là tiêu cực ở các nước phát triển" mà tôi nghĩ là một ví dụ tuyệt vời.

Tôi tìm thấy những số liệu thuận tiện nhất mà tôi có thể đặt tay đến từ Cục Thống kê Úc ( đặc biệt là tôi đã sử dụng tờ Excel này ), vì các thùng tuổi của họ đã lên đến 100 tuổi và nam giới Úc lớn nhất là 111 , vì vậy tôi cảm thấy thoải mái khi cắt thùng cuối cùng sau 110 năm. Các cơ quan thống kê quốc gia khác thường dường như dừng lại ở mức 95 khiến thùng cuối cùng rộng một cách khó chịu. Biểu đồ kết quả cho thấy một độ lệch âm rất rõ ràng, cũng như một số tính năng thú vị khác như tỷ lệ tử vong nhỏ ở trẻ nhỏ, rất phù hợp để thảo luận và giải thích trên lớp.

Tuổi chết của nam giới Úc năm 2012

Mã R với dữ liệu thô theo sau, HistogramTools gói tỏ ra rất hữu ích cho việc vẽ đồ thị dựa trên dữ liệu tổng hợp! Nhờ câu hỏi StackOverflow này để gắn cờ nó.

library(HistogramTools)

deathCounts <- c(565, 116, 69, 78, 319, 501, 633, 655, 848, 1226, 1633, 2459, 3375, 4669, 6152, 7436, 9526, 12619, 12455, 7113, 2104, 241)
ageBreaks <- c(0, 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110)

myhist <- PreBinnedHistogram(
    breaks = ageBreaks,
    counts = deathCounts,
    xname = "Age at Death of Australian Males, 2012")
plot(myhist)

2
Một số liên quan đến bài đăng này, tôi đã nghe nói rằng tuổi nghỉ hưu có sự sai lệch tiêu cực: hầu hết mọi người nghỉ hưu ở độ tuổi danh nghĩa (ví dụ, 65 hoặc 67 ở nhiều quốc gia) nhưng một số (giả sử, công nhân ở các mỏ than) nghỉ hưu sớm hơn nhiều.
Christoph Hanck

Có phải tuổi chết theo một số phân phối đã biết theo kinh nghiệm?
StubbornAtom

11

Dưới đây là kết quả cho bốn mươi vận động viên đã hoàn thành một bước nhảy hợp pháp trong vòng loại của môn nhảy xa nam Olympic 2012, được trình bày trong một âm mưu mật độ hạt nhân với âm mưu thảm bên dưới.

Kết quả vòng loại Olympic London 2012 Long Jump nam

Có vẻ như dễ dàng hơn một mét phía sau nhóm đối thủ chính so với một mét phía trước, điều này sẽ giải thích cho sự sai lệch tiêu cực.

Tôi nghi ngờ một số bó ở đầu cuối là do trình độ nhắm mục tiêu của vận động viên (yêu cầu kết thúc mười hai đầu hoặc kết quả 8,10 mét trở lên) thay vì đạt được khoảng cách dài nhất có thể. Thực tế là hai kết quả hàng đầu là 8,11 mét, ngay trên điểm vòng loại tự động, rất có ý nghĩa, cũng giống như cách các cú nhảy giành huy chương trong trận Chung kết dài hơn và lan rộng hơn ở 8,31, 8,16 và 8,12 mét. Kết quả trong trận Chung kết có một sai lệch nhỏ, không đáng kể, tiêu cực.

Để so sánh, kết quả cho Heptathlon Olympic tại Seoul 1988 có sẵn trong các heptathlonbộ dữ liệu trong gói R HSAUR. Trong cuộc thi đó không có vòng loại nhưng mỗi sự kiện đều đóng góp điểm vào phân loại cuối cùng; các đối thủ nữ cho thấy độ lệch âm rõ rệt trong kết quả nhảy cao và hơi lệch âm trong bước nhảy dài. Điều thú vị là điều này không được sao chép trong các sự kiện ném (bắn và lao) mặc dù chúng cũng là những sự kiện trong đó số cao hơn tương ứng với kết quả tốt hơn. Điểm số cuối cùng cũng có phần sai lệch.

Dữ liệu và mã

require(moments)
require(ggplot2)

sourceAddress <- "http://www.olympic.org/olympic-results/london-2012/athletics/long-jump-m"

longjump.df <- read.csv(header=TRUE, sep=",", text="
rank,name,country,distance
1,Mauro Vinicius DA SILVA,BRA,8.11 
2,Marquise GOODWIN,USA,8.11
3,Aleksandr MENKOV,RUS,8.09
4,Greg RUTHERFORD,GBR,8.08
5,Christopher TOMLINSON,GBR,8.06
6,Michel TORNEUS,SWE,8.03
7,Godfrey Khotso MOKOENA,RSA,8.02
8,Will CLAYE,USA,7.99
9,Mitchell WATT,AUS,7.99,
10,Tyrone SMITH,BER,7.97,
11,Henry FRAYNE,AUS,7.95,
12,Sebastian BAYER,GER,7.92,
13,Christian REIF,GER,7.92,
14,Eusebio CACERES,ESP,7.92,
15,Aleksandr PETROV,RUS,7.89,
16,Sergey MORGUNOV,RUS,7.87,
17,Mohammad ARZANDEH,IRI,7.84,
18,Ignisious GAISAH,GHA,7.79,
19,Damar FORBES,JAM,7.79,
20,Jinzhe LI,CHN,7.77,
21,Raymond HIGGS,BAH,7.76,
22,Alyn CAMARA,GER,7.72,
23,Salim SDIRI,FRA,7.71,
24,Ndiss Kaba BADJI,SEN,7.66,
25,Arsen SARGSYAN,ARM,7.62,
26,Povilas MYKOLAITIS,LTU,7.61,
27,Stanley GBAGBEKE,NGR,7.59,
28,Marcos CHUVA,POR,7.55,
29,Louis TSATOUMAS,GRE,7.53,
30,Stepan WAGNER,CZE,7.50,
31,Viktor KUZNYETSOV,UKR,7.50,
32,Luis RIVERA,MEX,7.42,
33,Ching-Hsuan LIN,TPE,7.38,
33,Supanara SUKHASVASTI N A,THA,7.38,
35,Boleslav SKHIRTLADZE,GEO,7.26,
36,Xiaoyi ZHANG,CHN,7.25,
37,Mohamed Fathalla DIFALLAH,EGY,7.08,
38,Roman NOVOTNY,CZE,6.96,
39,George KITCHENS,USA,6.84,
40,Vardan PAHLEVANYAN,ARM,6.55,
NA,Luis MELIZ,ESP,NA,
NA,Irving SALADINO,PAN,NA")

roundedSkew <- signif(skewness(longjump.df$distance, na.rm=TRUE), 3)

ggplot(longjump.df, aes(x=distance)) + 
    xlab("Distance in metres") +
    ggtitle("London 2012 Men's Long Jump qualifying round results") +
    geom_rug(size=0.8) + 
    geom_density(fill="steelblue") +
    annotate("text", x=7.375, y=0.0625, colour="white", label=paste("Source:", sourceAddress), size=3) +
    annotate("rect", xmin = 6.25, xmax = 7.25, ymin = 0.5, ymax = 1.125, fill="white") +
    annotate("text", x=6.75, y=1, colour="black", label="Best jump in up to 3 attempts") +
    annotate("text", x=6.75, y=.875, colour="black", label="42 athletes competed") +
    annotate("text", x=6.75, y=.75, colour="black", label="2 athletes had no legal jump") +
    annotate("text", x=6.75, y=.625, colour="black", label=paste("Skewness = ", roundedSkew))


# Results of the top twelve who qualified for the Final were closer to symmetric
skewness(longjump.df$distance[1:12])
# -0.1248782

# Results in the Final (some had 3 jumps, others 6) were only slightly negatively skewed
skewness(c(8.31, 8.16, 8.12, 8.11, 8.10, 8.07, 8.01, 7.93, 7.85, 7.80, 7.78, 7.70))
# -0.08578357

# Compare to Seoul 1988 Heptathlon
require(HSAUR)
skewness(heptathlon)

11

Điểm trong các bài kiểm tra dễ, hoặc cách khác, điểm số trong các bài kiểm tra mà học sinh đặc biệt có động lực, có xu hướng bị lệch.

Do đó, điểm SAT / ACT của sinh viên vào các trường đại học được tìm kiếm (và thậm chí nhiều hơn, điểm trung bình của họ) có xu hướng bị lệch. Có rất nhiều ví dụ tại colleg Ứng dụng.about.com, ví dụ như một lô của Đại học Chicago SAT / ACT và GPA có ở đây .

Tương tự GPA của sinh viên tốt nghiệp thường bị lệch trái, ví dụ như biểu đồ dưới đây của GPA của sinh viên tốt nghiệp trắng và đen tại một trường đại học vì lợi nhuận được lấy từ Hình 5 của Gramling, Tim. " Làm thế nào năm đặc điểm sinh viên dự đoán chính xác tỷ lệ tốt nghiệp đại học vì lợi nhuận ." Mở SAGE 3.3 (2013): 2158244013497026.

Biểu đồ GPA cho thấy độ lệch âm

(Không khó để tìm thấy các ví dụ khác, tương tự.)


2
Đối với lớp thống kê giới thiệu, tôi nghĩ ví dụ này hoạt động tốt về mặt sư phạm - đó là điều mà sinh viên có thể có kinh nghiệm thực tế, có thể suy luận về trực giác và có thể xác nhận đối với các tập dữ liệu có sẵn rộng rãi.
Cá bạc

9

Trong Phân tích biên giới Stochastic, và đặc biệt tập trung vào lịch sử ban đầu, sản xuất, chức năng sản xuất của một công ty / đơn vị sản xuất nói chung, được chỉ định một cách ngẫu nhiên như

q= =f(x)+bạn-w

qf(x)xbạnwdo những lý do mà nhà kinh tế lượng có thể không biết, nhưng anh ta có thể đo lường thông qua thiết lập này. Biến ngẫu nhiên này thường được giả định là tuân theo phân phối nửa bình thường hoặc hàm mũ. Giả sử một nửa bình thường (vì một lý do), chúng ta có

bạn~N(0,σbạn2),w~HN(2πσ2,(1-2π)σ22)

σ2

ε= =bạn-w

fε(ε)= =2S2φ(ε/S2)Φ((-σ2σbạn)(ε/S2)),S22= =σbạn2+σ22

0S2(-σ2σbạn)φΦσbạn= =1,σ2= =3nhập mô tả hình ảnh ở đây

Vì vậy, sự sai lệch tiêu cực là, mô hình tự nhiên nhất về những nỗ lực của chính loài người: luôn đi lệch khỏi lý tưởng tưởng tượng của nó - trong hầu hết các trường hợp tụt lại phía sau nó (phần tiêu cực của mật độ), trong khi trong trường hợp tương đối ít hơn, vượt quá giới hạn nhận thức của nó (phần tích cực của mật độ). Bản thân sinh viên có thể được mô hình hóa như một chức năng sản xuất. Thật đơn giản để ánh xạ nhiễu loạn đối xứng và lỗi một phía đối với các khía cạnh của cuộc sống thực. Tôi không thể tưởng tượng làm thế nào một người trực quan hơn có thể nhận được về nó.


1
Câu trả lời này dường như lặp lại đề xuất của GPA @ Glen_b. Hành vi của con người có động lực cao nhằm vào một lý tưởng khó nắm bắt chắc chắn phù hợp với kịch bản đó! Hiệu quả nói chung là một ví dụ tuyệt vời.
Nick Stauner

2
@Nick Stauner Điểm quan trọng ở đây là chúng tôi xem xét "mục tiêu trừ thực tế" đã ký, không phải là "khoảng cách" trong các giá trị tuyệt đối. Chúng tôi giữ dấu hiệu để biết liệu chúng tôi ở trên hay dưới mục tiêu. Trực giác ở đây là, chính xác như bạn viết, rằng hành vi "có động lực cao" sẽ đẩy "thực tế" gần hơn với "mục tiêu", tạo ra sự bất cân xứng.
Alecos Papadopoulos

1
@NickStauner Thật vậy, bài đăng kết quả vòng loại nhảy xa của riêng Silverfish cũng liên quan đến 'hành vi có động lực cao' (xem xét giới hạn của những gì con người hiện có thể đạt được như một loại 'lý tưởng khó nắm bắt')
Glen_b -Reinstate Monica

6

Sai lệch âm là phổ biến trong thủy văn lũ. Dưới đây là một ví dụ về đường cong tần suất lũ (South Creek tại Mulgoa Rd, lat -33.8783, lon 150.7683) mà tôi đã lấy từ 'Lượng mưa và dòng chảy của Úc' (ARR) hướng dẫn về ước tính lũ lụt được phát triển bởi Engineers, Australia.

Có một nhận xét trong ARR:

Với độ lệch âm, phổ biến với các giá trị logarit của lũ lụt ở Úc, bản phân phối Pearson III có giới hạn trên. Điều này đưa ra giới hạn trên cho lũ có thể được rút ra từ phân phối. Trong một số trường hợp, điều này có thể gây ra vấn đề trong việc ước tính lũ lụt với AEP thấp, nhưng thường không gây ra vấn đề gì trong thực tế. [Trích từ Lượng mưa và dòng chảy của Úc - Tập 1, quyển IV Phần 2.]

Thông thường lũ lụt, tại một địa điểm cụ thể, được coi là có giới hạn trên được gọi là 'Lũ lụt tối đa có thể xảy ra' (PMF). Có những cách tiêu chuẩn để tính toán PMF.

nhập mô tả hình ảnh ở đây


7
+1 Ví dụ này cho thấy câu hỏi thực sự độc đoán như thế nào: khi bạn đo lũ theo mức xả cao điểm, chúng sẽ bị lệch một cách tích cực , nhưng được đo trong lưu lượng nhật ký, chúng (rõ ràng) bị lệch. Tương tự, bất kỳ biến dương nào cũng có thể được biểu thị lại theo cách đơn giản làm lệch phân phối của nó một cách tiêu cực (chỉ bằng cách lấy tham số Box-Cox âm phù hợp). Tất cả đều thuộc về ý nghĩa của "dễ dàng nắm bắt", tôi cho rằng - nhưng đó là một câu hỏi về các sinh viên, không phải về thống kê.
whuber

5

Thay đổi giá tài sản (lợi nhuận) thường có độ lệch âm - nhiều mức tăng giá nhỏ với một vài lần giảm giá lớn. Độ lệch dường như giữ cho hầu hết tất cả các loại tài sản: giá cổ phiếu, giá hàng hóa, v.v ... Có thể thấy độ lệch âm trong thay đổi giá hàng tháng nhưng rõ ràng hơn nhiều khi bạn bắt đầu xem xét thay đổi giá hàng ngày hoặc hàng giờ. Tôi nghĩ rằng đây sẽ là một ví dụ tốt bởi vì bạn có thể hiển thị các tác động của tần số lên độ lệch.

Thêm chi tiết: http://www.fusioninvesting.com/2010/09/what-is-skew-and-why-is-it-important/


Tôi thích ví dụ này rất nhiều! Có một cách trực quan để giải thích nó - về cơ bản, "những cú sốc nhược điểm có nhiều khả năng (hoặc ít nhất, có khả năng nghiêm trọng hơn) so với những cú sốc ngược"?
Cá bạc

2
@Silverfish Tôi sẽ nói nó là kết quả thị trường tiêu cực cực đoan có nhiều khả năng hơn kết quả thị trường cực kỳ tích cực. Thị trường cũng có biến động bất đối xứng. Biến động thị trường thường tăng nhiều hơn sau lợi nhuận âm so với lợi nhuận dương. Điều này thường được mô hình hóa với các mô hình Garch, chẳng hạn như GJR-Garch (xem mục Arch wikipedia).
John

3
Tôi cũng thấy một lời giải thích rằng tin xấu được phát hành theo bó. Tôi chưa sử dụng GJR-GARCH. Tôi đã cố gắng sử dụng chuyển động Brownian đa sắc (Mandelbrot) để mô hình hóa sự bất đối xứng, nhưng không thể làm cho nó hoạt động.
wcampbell

4
Đây là lúc đơn giản nhất. Ví dụ: tôi vừa lấy một bộ dữ liệu về lợi nhuận hàng ngày trên 31 chỉ số vốn chủ sở hữu. Hơn một nửa trong số họ có độ lệch dương (sử dụng độ lệch của Pearson) và hơn 70% là dương tính với thước đo 3 * (trung bình - trung bình) / stdev. Đối với hàng hóa, bạn có xu hướng nhìn thấy độ lệch tích cực hơn nữa, vì cú sốc cung và cầu có thể khiến giá cả tăng nhanh (ví dụ như dầu, khí đốt và ngô trong những năm gần đây).
Chris Taylor

5

Tuổi thai khi sinh (đặc biệt đối với trẻ sinh ra sống) bị lệch. Trẻ sơ sinh có thể được sinh ra từ rất sớm (mặc dù cơ hội sống sót tiếp tục là rất nhỏ khi quá sớm), cao điểm trong khoảng 36-41 tuần và giảm nhanh. Đó là điển hình cho phụ nữ ở Hoa Kỳ được gây ra nếu 41/42 tuần, vì vậy chúng tôi thường không thấy nhiều lần sinh nở sau thời điểm đó.


4

Trong nghề cá thường có những ví dụ về độ lệch âm do yêu cầu quy định. Ví dụ, sự phân bố chiều dài của cá được thả trong nghề cá giải trí; bởi vì đôi khi có một chiều dài tối thiểu mà một con cá phải được giữ lại để tất cả cá dưới giới hạn bị loại bỏ. Nhưng bởi vì mọi người đánh cá ở những nơi có xu hướng cá dài hợp pháp nên có xu hướng lệch âm và chế độ hướng tới giới hạn pháp lý cao hơn. Chiều dài pháp lý không đại diện cho một cắt cứng mặc dù. Do giới hạn túi (hoặc giới hạn số lượng cá có thể được đưa trở lại bến), mọi người vẫn sẽ loại bỏ cá có kích thước hợp pháp khi họ bắt được những con lớn hơn.

vd SEDAR31-DW11. SEDAR, Bắc Charleston, SC. 29 trang.


"Skew hướng tới kích thước lớn" thường sẽ được hiểu là sai lệch tích cực , không phải "tiêu cực". Có lẽ bạn có thể làm rõ câu trả lời này với một minh họa về một phân phối điển hình? Các cơ chế bạn mô tả - giới hạn trên có thể điều chỉnh và một số xu hướng vượt quá nó - có thể dẫn đến độ lệch âm hoặc dương, tùy thuộc vào sự phân bố cắt ngắn của cá có kích thước nhỏ (và tùy thuộc vào cách đo của cá: độ lệch phân phối khối lượng của chúng sẽ không giống như độ lệch của phân bố chiều dài của chúng).
whuber

3

Một số gợi ý tuyệt vời đã được thực hiện trên chủ đề này. Với chủ đề về tỷ lệ tử vong liên quan đến tuổi, tỷ lệ thất bại của máy thường là một chức năng của tuổi máy và sẽ rơi vào nhóm phân phối này. Ngoài các yếu tố tài chính đã được lưu ý, các chức năng và phân phối tổn thất tài chính thường giống với các hình dạng này, đặc biệt là trong trường hợp tổn thất có giá trị cao, ví dụ, như trong các ước tính của BIS III (Ngân hàng thanh toán quốc tế) về thiếu hụt dự kiến ​​(ES), hoặc trong BIS II, giá trị rủi ro (VAR) là đầu vào cho các yêu cầu quy định đối với phân bổ dự trữ vốn.


2

Tuổi nghỉ hưu ở Mỹ bị lệch. Phần lớn những người về hưu già hơn với một vài người về hưu tương đối trẻ.


2

Trong lý thuyết ma trận ngẫu nhiên, phân phối Tracy Widom bị lệch phải. Đây là phân phối giá trị riêng lớn nhất của ma trận ngẫu nhiên. Theo tính đối xứng, giá trị riêng nhỏ nhất có phân phối Tracy Widom âm, và do đó bị lệch trái.

Điều này gần như là do thực tế là các giá trị riêng ngẫu nhiên gần giống với các hạt tích điện đẩy nhau, và do đó giá trị riêng lớn nhất có xu hướng bị đẩy ra khỏi phần còn lại. Đây là một hình ảnh phóng đại (chụp từ đây ):

nhập mô tả hình ảnh ở đây


Phân phối lệch phải có độ lệch dương và do đó không trả lời câu hỏi.
whuber

@whuber: Mete để sử dụng giá trị riêng nhỏ nhất. Đã sửa.
Alex R.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.