Hàm khả năng của dữ liệu bị cắt


8

Tôi gặp một chút khó khăn trong việc hiểu khái niệm và dẫn xuất về khả năng dữ liệu bị cắt ngắn.

Ví dụ: nếu tôi muốn tìm hàm khả năng dựa trên mẫu từ phân phối, nhưng khi lấy mẫu từ phân phối, tôi quan sát các giá trị bị cắt bớt (trong đó có một điểm cắt của , tức là bất kỳ được ghi là ):Mxi>MM

x1,x2,M,x3,M,x4,x5,...,x10

trong đó số lượng giá trị là . Sau đó, khả năng được cho là của:Mm

L(x;θ)=i=110f(xi;θ)[P(X>M)]m

Tôi rất đánh giá cao một lời giải thích / bằng chứng về lý do tại sao điều này là như vậy, quan trọng là tại sao yếu tố thứ hai là như vậy. Trực giác và toán học nếu có thể. Cảm ơn rất nhiều trước.


Chữ thường " " là gì? m
Alecos Papadopoulos

Đó là số lần xuất hiện của .. tức là tôi đã quan sát điểm dữ liệu, trong đó không được cắt ngắn, và trong số đó là (tôi quan sát những chọn, tất cả với giá trị )10 + m 10 m m MM10+m10mmM
Delvesy

2
Như @Alecos chỉ ra, bạn đang sử dụng "cắt ngắn" một cách ngẫu nhiên. "Kiểm duyệt" là thuật ngữ thông thường.
Scortchi - Tái lập Monica

Một số thuật ngữ khác bạn có thể muốn tìm kiếm trên: "hiệu ứng trần / sàn", "hồi quy beta" và "mô hình không lạm phát".
DWin

Câu trả lời:


8

Những gì bạn mô tả cần được đối xử đặc biệt, đó không phải là những gì chúng ta thường có nghĩa là "các biến ngẫu nhiên bị cắt cụt" - và điều chúng ta thường nói là biến ngẫu nhiên không nằm ngoài hỗ trợ bị cắt cụt, có nghĩa là không có sự tập trung của khối lượng xác suất tại điểm cắt ngắn. Để tương phản trường hợp:

A) Ý nghĩa "thông thường" của một rv bị cắt bớt
Đối với bất kỳ phân phối nào mà chúng tôi cắt bớt hỗ trợ của nó, chúng tôi phải "sửa" mật độ của nó để nó tích hợp với sự thống nhất khi được tích hợp trên hỗ trợ bị cắt bớt. Nếu biến có hỗ trợ trong , , thì (pdf , cdf )- < a < b < f F[a,b]<a<b<fF

abfX(x)dx=aMfX(x)dx+MbfX(x)dx=aMfX(x)dx+[1FX(M)]=1

aMfX(x)dx=FX(M)

Vì LHS là tích phân trên hỗ trợ bị cắt cụt, chúng tôi thấy rằng mật độ của rv bị cắt ngắn, gọi nó là , phải làX~

[ a , M ] n n

fX~(x~)=fX(xXM)=fX(x)dx[FX(M)]1
sao cho nó tích hợp để thống nhất trên . Thuật ngữ giữa trong biểu thức trên làm cho chúng ta nghĩ về tình huống này (một cách chính xác) như một dạng điều hòa - nhưng không phải trên một biến ngẫu nhiên khác, nhưng về các giá trị có thể mà chính rv có thể thực hiện. Ở đây, hàm mật độ / khả năng chung của một tập hợp ix rv bị cắt ngắn sẽ gấp lần mật độ trên, như thường lệ.[a,M]nn

B) Nồng độ khối lượng xác suất
Ở đây, đó là những gì bạn mô tả trong câu hỏi, mọi thứ đều khác nhau. Điểm tập trung tất cả các khối lượng xác suất mà tương ứng với sự hỗ trợ của các biến cao hơn . Điều này tạo ra một điểm gián đoạn trong mật độ và làm cho nó có hai nhánhMM M

fX(x)=fX(x)x<MfX(x)=P(XM)xM

Một cách không chính thức, điểm thứ hai là "giống như một rv rời rạc" trong đó mỗi điểm trong hàm khối xác suất đại diện cho xác suất thực tế. Bây giờ giả sử rằng chúng ta có biến ngẫu nhiên iid như vậy và chúng ta muốn hình thành hàm mật độ / khả năng chung của chúng. Trước khi nhìn vào mẫu thực tế, chúng ta nên chọn ngành nào? Chúng tôi không thể đưa ra quyết định đó vì vậy chúng tôi phải bao gồm cả hai. Để làm điều này, chúng ta cần sử dụng các hàm chỉ báo: biểu thị hàm chỉ thị nhận giá trị khi và khác. Mật độ của một rv như vậy có thể được viếttôin1 x *M 0I{xM}IM(x)1xM0

n

fX(x)=fX(x)[1IM(x)]+P(XM)IM(x)
và do đó hàm mật độ khớp của biến iid đó làn

fX(Xθ)=i=1n[fX(xi)[1IM(xi)]+P(XiM)IM(xi)]

Bây giờ, xem ở trên là một hàm khả năng, mẫu thực tế bao gồm ngộ của những ngẫu nhiên biến đi vào chơi. Và trong mẫu này, một số nhận thức được quan sát sẽ thấp hơn ngưỡng , một số bằng nhau. Suy ra số lượng thực hiện trong mẫu bằng và tất cả phần còn lại, . Ngay lập tức, đối với việc thực hiện , phần mật độ tương ứng sẽ vẫn có khả năng sẽ là phần , trong khi đối với phần thực hiện , phần khác. Sau đóM m M v m + v = n m P ( X iM ) vnMmMvm+v=nmP(XiM)v

L(θ{xi;i=1,...n})=i=1v[fX(xi)]j=1m[P(XjM)]=i=1v[fX(xi)][P(XM)]m

Cảm ơn bạn. Tôi rất đánh giá cao trả lời. Tôi đoán vấn đề chính của tôi là điểm đầu tiên trong phần b) ... tức là, "nhánh thứ hai" của pdf được định nghĩa như thế nào. Nó là một pmf rời rạc và không thực sự định nghĩa pdf từ định nghĩa của pdf. Phần này có thể được giải thích thêm? Cảm ơn rất nhiều.
Delvesy

Các biến ngẫu nhiên này được gọi là "kiểu hỗn hợp", nghĩa là chúng liên tục một phần và rời rạc. Theo trực giác nó có ý nghĩa rõ ràng, như câu hỏi của bạn cho thấy. Để xử lý nghiêm ngặt, hãy tra cứu "biến ngẫu nhiên loại hỗn hợp" hoặc "phân phối loại hỗn hợp". Đừng nhầm lẫn chúng với "hỗn hợp".
Alecos Papadopoulos

4

Lý thuyết khả năng là một khuôn khổ khá chung chung. Hầu hết các sách giáo khoa đều đưa ra kết quả cho các trường hợp riêng biệt của r.vs liên tục và cho các trường hợp r.vs rời rạc. Tuy nhiên trường hợp hỗn hợp xảy ra trong thực tế, như trường hợp ở đây.

Đối với rv rời rạc , khả năng quan sát được xác định là xác suất nhận được giá trị quan sát , giả sử . Đối với một rv liên tục, khả năng thường được xác định là mật độ tại , giả sử . Tuy nhiên, trong thực tế, người ta chỉ biết rằng - vì độ chính xác đo lường hạn chế và nên được sử dụng như khả năng. Lấy , vớiAaapA(a)LxfX(x)xL<X<xUPr{xL<X<xU}xL:=xdx/2xU:=x+dx/2dxnhỏ, chúng tôi nhận được lên tới bội số không quan trọng. Vì vậy, định nghĩa thông thường có thể được xem là ngầm định giả định độ chính xác vô hạn trên quan sát.fX(x)dx

Đối với một vài r.vs và với loại hỗn hợp rời rạc / liên tục, khả năng sẽ là phân phối chung, thường được biểu thị bằng các phân phối có điều kiện, ví dụ: Do đó, trong một khoảng với độ dài nhỏ , là lần mật độ của điều kiện trên , giả sửAX

L:=Pr{A=a,xL<X<xU}=Pr{A=a}×Pr{xL<X<xU|A=a}.
(xL,xU)dxLpA(a)X{A=a}fX|A(x|a). Một lần nữa, chúng tôi bỏ qua thuật ngữ .dx

Bây giờ chúng ta hãy quay lại ví dụ của bạn và chỉ xem xét một quan sát. Khi đó là một Bernoulli rv với xác suất thành công . Tùy thuộc vào hay không, hoặc là bạn quan sát chỉ hoặc bạn quan sát cả hai và giá trị của . Trong cả hai trường hợp, bạn sử dụng công thức trên, nhưng được lấy là hoặc là một khoảng có độ dài nhỏ chứa . Quả thực điều này mang lại Pr { X > M } X > MA=1{X>M}Pr{X>M}X>MA=1A=0xX(xL,xU)d x x L = { Pr { X > M } × 1 nếu (M,)dxx

L={Pr{X>M}×1if X>M i.e. A=1,Pr{XM}×fX|A(x|a)dxif XM i.e. A=0.
Vì , khả năng chỉ đơn giản là trong trường hợp thứ hai và chúng ta có được khả năng được yêu cầu, lên đến thuật ngữ cho một quan sát với độ chính xác vô hạn. Khi các quan sát độc lập và được thực hiện, khả năng thu được là sản phẩm của khả năng cận biên dẫn đến biểu thức trong câu hỏi.f X ( x )fX|A(x|0)=fX(x)/Pr{XM}d x A i X ifX(x)dxdxAiXi
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.