Chuyển đổi số liệu thống kê đơn hàng


9

Giả sử các biến ngẫu nhiên và là độc lập và phân phối . rằng có \ phân phối văn bản {Exp} (1) .X1,...,XnY1,...,YnU(0,a)Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))Exp(1)

Tôi đã bắt đầu vấn đề này bằng cách đặt {X1,...,Xn,Y1,...Yn}={Z1,...,Zn} Sau đó, max(Yn,Xn)=Z(2n) sẽ được phân phối dưới dạng (za)2nmin(Yn,Xn)=Z(1) sẽ được phân phối dưới dạng 1(1za)2n Mật độ có thể dễ dàng tìm thấy dưới dạng fZ1(z)=(2n)(1za)2n11afZ(2n)(z)=(2n)(za)2n11a

Đây là lúc tôi đang gặp khó khăn để biết nên đi đâu tiếp theo bây giờ khi những điều này được tính toán. Tôi nghĩ rằng nó phải làm một cái gì đó với một sự biến đổi, nhưng tôi không chắc chắn ...


Chắc chắn bạn cần phải thừa nhận rằng không chỉ XiYi iid, mà cả Xi cũng độc lập với Yj . Cho rằng, bạn đã nghĩ đến việc làm việc trực tiếp với log(Zi) chưa?
whuber

@whuber suy nghĩ của tôi từ nhận xét của bạn sẽ là thiết lập một biến đổi trong đó tôi giải quyết mật độ của n * log (Z )? i
Susan

Tôi đã thực hiện một số định dạng lại (đặc biệt là chuyển và thành và ) nhưng nếu bạn không thích nó như thế nào, bạn có thể quay lại phiên bản trước (bằng cách nhấp vào liên kết "đã chỉnh sửa <x> trước" phía trên gravatar của tôi ở cuối bài viết của bạn) và sau đó nhấp vào liên kết "cuộn lại" phía trên phiên bản trước của bạn. logminlogmin
Glen_b -Reinstate Monica

3
Susan, bạn dường như đã giải thích sai / đọc sai câu hỏi. Câu hỏi tìm tỷ lệ Mẫu số đề cập đến : trong đó là thống kê thứ tự tối đa của s và là thống kê thứ tự tối đa của S. Nói cách khác, tìm kiếm min (maxX, maxY), KHÔNG phải là tối thiểu của tất cả các và , vì vậy bạn không thể sử dụng thủ thuật Z của mình để làm phẳng / kết hợp tất cả các giá trị X và Y. .......
max(Y(n),X(n))min(Y(n),X(n))
min(Y(n),X(n))Y(n)YX(n)Xmin(Y(n),X(n))XY
sói

2
Trong mọi trường hợp và như một vấn đề riêng biệt, không có điểm nào (như bạn đã làm) tính mật độ của , và riêng biệt mật độ của , bởi vì các chỉ số đơn hàng khác nhau không phải là Nói chung là độc lập. Để tìm tỷ lệ , trước tiên người ta cần tìm pdf chung của , nếu đó là vấn đề trong tầm tay (mà nó không phải). Z(1)Z(2n)Z(2n)/Z(1)(Z(1),Z(2n))
sói

Câu trả lời:


2

Vấn đề này có thể được giải quyết từ các định nghĩa một mình: phép tính nâng cao duy nhất là tích phân của một đơn thức.


Quan sát sơ bộ

Chúng ta hãy làm việc với các biến và xuyên suốt: điều này không thay đổi nhưng nó làm cho iid với các phân phối Thống nhất , loại bỏ mọi sự xuất hiện gây mất tập trung của trong các tính toán. Do đó, chúng tôi có thể giả sử mà không mất bất kỳ tính tổng quát nào.Xi/aYi/aZn(X1,,Yn)(0,1)aa=1

Lưu ý rằng tính độc lập của và phân phối đồng đều của chúng ngụ ý rằng với bất kỳ số nào có ,Yiy0y1

Pr(yY(n))=Pr(yY1,,yYn)=Pr(yY1)Pr(yYn)=yn,

với kết quả giống hệt nhau giữ cho . Để tham khảo trong tương lai, điều này cho phép chúng tôi tính toánX(n)

E(2X(n)n)=012xnd(xn)=012nx2n1dx=1.

Giải pháp

Đặt là một số thực dương. Để tìm phân phối , thay thế định nghĩa của nó và đơn giản hóa bất đẳng thức dẫn đến:tZn

Pr(Zn>t)=Pr(Zn/n>t/n)=Pr(exp(Zn/n)>et/n)=Pr(max(X(n),Y(n))min(X(n),Y(n))>et/n)=Pr(et/nmax(X(n),Y(n))>min(X(n),Y(n))).

Sự kiện này chia thành hai trường hợp có thể trang bị, tùy thuộc vào việc hay là nhỏ hơn trong hai trường hợp (và giao điểm của chúng, với xác suất bằng 0, có thể bỏ qua). Do đó, chúng ta chỉ cần tính toán cơ hội của một trong những trường hợp này (giả sử là nhỏ hơn) và nhân đôi nó. Vì , , cho phép chúng tôi (khi để đóng vai trò của ) để áp dụng các tính toán trong phần sơ bộ:X(n)Y(n)Y(n)t00et/nX(n)1et/nX(n)y

Pr(Zn>t)=2Pr(et/nX(n)>Y(n))=2E[(et/nX(n))n]=etE[2X(n)n]=et.

Đó là ý nghĩa của việc có phân phối Exp .Zn(1)


4

Tôi sẽ phác thảo giải pháp, ở đây sử dụng hệ thống đại số máy tính để thực hiện các công thức nitty ...

Giải pháp

Nếu là mẫu có kích thước trên cha mẹ , thì pdf của mức tối đa của mẫu là: và tương tự cho .X1,...,XnnXUniform(0,a)

fn(x)=nanxn1
Y

Cách tiếp cận 1: Tìm pdf chung của(X(n),Y(n))

Vì và là độc lập, nên pdf chung của 2 mức tối đa mẫu chỉ đơn giản là sản phẩm của 2 pdf, giả sử :XY(X(n),Y(n))f(n)(x,y)

nhập mô tả hình ảnh ở đây

Cho . Khi đó, cdf của là là:Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))ZnP(Zn<z)

nhập mô tả hình ảnh ở đây

nơi mà tôi đang sử dụng các Probchức năng từ mathStatica gói cho Mathematica để tự động hóa. Phân biệt cdf wrt mang lại pdf của là số mũ tiêu chuẩn.zZn


Cách tiếp cận 2: Thống kê đơn hàng

Chúng ta có thể sử dụng số liệu thống kê đơn hàng để 'vượt qua' các cơ chế phải xử lý các hàm Max và Min.

Một lần nữa: Nếu là mẫu có kích thước trên cha mẹ , thì pdf của mẫu tối đa là, nói, : X1,...,XnnXUniform(0,a)W=X(n)fn(w)

nhập mô tả hình ảnh ở đây

Các mẫu tối đa và chỉ là hai bản vẽ độc lập từ phân phối này của ; tức là thống kê đơn hàng và của (trong mẫu có kích thước 2) chỉ là những gì chúng tôi đang tìm kiếm:X(n)Y(n)W1st2ndW

  • W(1)=min(Y(n),X(n))

  • W(2)=max(Y(n),X(n))

Pdf chung của , trong một mẫu có kích thước 2, giả sử , Là:(W(1),W(2))g(.,.)

nhập mô tả hình ảnh ở đây

Cho . Khi đó, cdf của là là:Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))ZnP(Zn<z)

nhập mô tả hình ảnh ở đây

Ưu điểm của phương pháp này là việc tính toán xác suất không còn liên quan đến các hàm max / min, điều này có thể làm cho đạo hàm (đặc biệt là bằng tay) có thể dễ dàng diễn đạt hơn.

Khác

Theo nhận xét của tôi ở trên, có vẻ như bạn đã hiểu sai câu hỏi ...

Chúng tôi được yêu cầu tìm:

Zn=nlogmax(Y(n),X(n))min(Y(n),X(n))

nơi mẫu số là min (xmax, ymax), ... không phải là tối thiểu của tất cả các 's và ' s.XY


Theo bản phác thảo của bạn, tôi hiểu làm thế nào tôi hiểu sai câu hỏi. Tôi hiểu cách tính pdf chung của hai mức tối đa mẫu, nhưng tôi vẫn không chắc chúng ta sẽ diễn giải tỷ lệ tối đa / phút như thế nào.
Susan

Tôi đã thêm một dẫn xuất thay thế bằng cách sử dụng số liệu thống kê đơn hàng, trong đó 'chu vi' tối đa / phút.
sói

Nếu bạn đã bắt đầu với nhật ký dữ liệu, Susan, thì bạn sẽ xem xét sự khác biệt của thống kê đơn hàng hơn là tỷ lệ .
whuber

Tôi không bị thuyết phục bằng cách sử dụng các tính toán chính thức của máy tính là cách tốt nhất để giải thích lý do tại sao tỷ lệ này là biến ngẫu nhiên Exp (1).
Tây An

1
Điểm hay ... ngoại trừ OP không hỏi lý do ... nhưng để cho thấy rằng đó là Exp [1]. Tôi cũng không chắc chắn liệu đây có phải là bài tập về nhà (hay bài tập) hay không ... và đó thực sự là một lợi thế tốt của việc sử dụng máy tính: người ta cung cấp các bước để làm theo, xác minh kết quả, để người ta có cách tiếp cận đúng , nhưng các cơ chế vẫn còn lại cho OP. Sẽ rất tốt nếu ai đó khám phá đề xuất của @ whuber về việc ghi nhật ký khi bắt đầu.
sói
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.