Số ngẫu nhiên đồng phục giả: Phân bố đều hơn dữ liệu thống nhất thật


43

Tôi đang tìm cách tạo ra các số ngẫu nhiên có vẻ như được phân phối đồng đều - và mọi thử nghiệm sẽ cho thấy chúng là đồng nhất - ngoại trừ việc chúng được phân phối đều hơn so với dữ liệu thống nhất thực sự .

Vấn đề tôi gặp phải với các randoms đồng phục "thật" là đôi khi chúng sẽ co cụm. Hiệu ứng này mạnh hơn ở cỡ mẫu thấp. Nói một cách thẳng thắn: khi tôi vẽ hai randoms thống nhất trong U [0; 1], có khả năng khoảng 10% rằng chúng nằm trong phạm vi 0,1 và 1% là trong vòng 0,01.

Vì vậy, tôi đang tìm kiếm một cách tốt để tạo ra các số ngẫu nhiên được phân bổ đều hơn các randoms thống nhất .

Ví dụ về trường hợp sử dụng: giả sử tôi đang chơi trò chơi trên máy tính và tôi muốn đặt kho báu ngẫu nhiên trên bản đồ (không quan tâm đến bất kỳ điều gì khác). Tôi không muốn kho báu nằm ở một nơi, nó phải ở khắp nơi trên bản đồ. Với các randoms thống nhất, nếu tôi đặt, giả sử, 10 đối tượng, cơ hội không thấp đến mức có 5 hoặc rất thực sự gần nhau. Điều này có thể cung cấp cho một người chơi một lợi thế hơn người khác. Hãy nghĩ về người quét mìn, cơ hội (mặc dù thấp, nếu có đủ mìn) là bạn thực sự may mắn và giành chiến thắng chỉ với một cú nhấp chuột.

Một cách tiếp cận rất ngây thơ cho vấn đề của tôi là chia dữ liệu thành một lưới. Miễn là số lượng đủ lớn (và có các yếu tố), người ta có thể thực thi tính đồng nhất thêm theo cách này. Vì vậy, thay vì vẽ 12 biến ngẫu nhiên từ U [0; 1], tôi có thể rút 6 từ U [0; .5] và 6 từ U [0,5; 1] hoặc 4 từ U [0; 1/3] + 4 từ U [1/3; 2/3] + 4 từ U [2/3; 1].

Có cách nào tốt hơn để có được sự đồng đều này vào đồng phục không? Nó có lẽ chỉ hoạt động cho các đợt randoms (khi vẽ ngẫu nhiên, tôi rõ ràng phải xem xét toàn bộ phạm vi). Đặc biệt, tôi có thể xáo trộn các hồ sơ một lần nữa sau đó (vì vậy đây không phải là bốn lần đầu tiên từ lần thứ ba đầu tiên).

Làm thế nào về việc làm nó tăng dần? Vì vậy, đầu tiên là trên U [0; 1], sau đó hai từ mỗi nửa, một từ mỗi thứ ba, một từ mỗi thứ tư? Điều này đã được điều tra, và nó tốt như thế nào? Tôi có thể phải cẩn thận sử dụng các trình tạo khác nhau cho x và y để không làm cho chúng tương quan với nhau (xy thứ nhất sẽ luôn ở nửa dưới, thứ hai ở nửa bên trái và thứ ba dưới cùng, thứ ba ở giữa thứ ba và thứ ba trên cùng. .. vì vậy ít nhất một số hoán vị bin ngẫu nhiên cũng cần thiết. Và về lâu dài, nó sẽ quá chẵn, tôi đoán vậy.

Là một nút bên, có một thử nghiệm nổi tiếng cho dù một số phân phối được phân phối quá đồng đều để thực sự thống nhất? Vì vậy, thử nghiệm "đồng phục thực sự" so với "ai đó nhầm lẫn với dữ liệu và phân phối các mục đồng đều hơn". Nếu tôi nhớ lại một cách chính xác, Hopkins Statistic có thể đo lường điều này, nhưng nó cũng có thể được sử dụng để thử nghiệm không? Ngoài ra phần nào đó là một thử nghiệm KS ngược: nếu độ lệch lớn nhất nằm dưới ngưỡng dự kiến ​​nhất định, dữ liệu có được phân phối quá đều không?


7
Bạn đã nghe nói về trình tự Halton ? Đối với "quá đồng đều", mọi người (bắt đầu với cuộc điều tra của Fisher về kết quả thí nghiệm hạt đậu của Mendel) đã đề cập đến thống kê chi bình phương (bình thường) cho phần dưới của phân phối chi bình phương.
whuber

Một cách để chính thức hóa điều này là muốn phân phối sao cho (1) bị thiệt thòi thành trên , (2 ) là đối xứng, tức là có thể trao đổi và (3) lớn khi bị phân tán. Tôi nghĩ có một vấn đề thực sự với (2) và (3) kể từ chuỗi trao đổi vô hạn trong không thể tương quan nghịch, do đó lớn hơn chúng tôi muốn sử dụng lực đẩy ít chúng ta có thể thực thi; mặt khác, đối với lớn , chúng ta nên có sự lan truyền tốt.g ( ) 1 x 1 , . . . , x n - 1 g X 1 , . . . , X n g ( x 1 , . . . , X n ) x 1 , . . . , x n R ng(x1,...,xn)g()1x1,...,xn1gX1,...,Xng(x1,...,xn)x1,...,xnRnn
anh chàng

Trình tự Halton khá gần với cách tiếp cận mà tôi đã nghĩ đến. Bao gồm bỏ qua một vài mục đầu tiên để giảm nguy cơ tương quan. Tôi cũng đã nghĩ đến việc sử dụng một hoán vị ngẫu nhiên cho mỗi cấp độ. Cảm ơn bạn cho con trỏ này, vì điều này cho tôi một điểm tốt để tìm kiếm các phương pháp liên quan!
Anony-Mousse

viết Halton trình tự một lần nữa. Tôi cần phải có chúng không xác định, ít nhất là ngoại trừ một hạt giống ban đầu. Tôi thấy hai cách ở đây. Tôi có thể thực hiện dịch chuyển theo chu kỳ bằng cách bù ngẫu nhiên + bù bắt đầu ngẫu nhiên + kích thước bước. Vấn đề là tất nhiên "kho báu" vẫn còn trong ví dụ trò chơi cũng không nên ở cùng một vị trí so với nhau mỗi lần. Hoặc tôi có thể sử dụng phương pháp tiếp cận thống nhất từ ​​phụ này mà tôi có trong câu hỏi của mình để thêm một số lượng "xoắn ngẫu nhiên". Vì vậy, để nói: Halton dường như một lần nữa quá dễ đoán và thường xuyên cho việc sử dụng của tôi.
Anony-Mousse

3
vi.wikipedia.org/wiki/Low-discrepancy_ resultence hoặc mathworld.wolfram.com/QuasirandomSequence.html . Một số thử nghiệm phổ biến về các RNG thống nhất (chẳng hạn như các thử nghiệm trong pin thử nghiệm Diehard / Dieharder) rất nhạy cảm với những điều đó; ví dụ, có quá ít "khoảng cách nhỏ" giữa các điểm.
Glen_b

Câu trả lời:


60

, có nhiều cách để tạo ra một chuỗi các số được phân bố đều hơn so với đồng phục ngẫu nhiên. Trong thực tế, có cả một lĩnh vực dành riêng cho câu hỏi này; nó là xương sống của quasi-Monte Carlo (QMC). Dưới đây là một chuyến tham quan ngắn về những điều cơ bản tuyệt đối.

Đo độ đồng đều

Có nhiều cách để làm điều này, nhưng cách phổ biến nhất có hương vị hình học mạnh mẽ, trực quan. Giả sử chúng ta quan tâm đến việc tạo điểm x 1 , x 2 , Mạnh , x n trong [ 0 , 1 ] d cho một số nguyên dươngnx1,x2,,xn[0,1]d . Xác định trong đólà một hình chữ nhậttrongsao chovàdR

Dn:=supRR|1ni=1n1(xiR)vol(R)|,
R[ 0 , 1 ] d 0 một ib i1 R R R v o l ( R ) = Π i ( b i - một i )[a1,b1]××[ad,bd][0,1]d0aibi1Rlà tập hợp của tất cả các hình chữ nhật như vậy. Thuật ngữ đầu tiên bên trong mô đun là tỷ lệ "quan sát" của các điểm bên trong và thuật ngữ thứ hai là khối lượng của , .RRvol(R)=i(biai)

Số lượng thường được gọi là sai lệch hoặc sai lệch cực lớn của tập hợp các điểm . Theo trực giác, chúng ta tìm thấy hình chữ nhật "tệ nhất" trong đó tỷ lệ điểm sai lệch nhiều nhất so với những gì chúng ta mong đợi dưới sự đồng nhất hoàn hảo. ( x i ) RDn(xi)R

Điều này là khó sử dụng trong thực tế và khó tính toán. Đối với hầu hết các phần, mọi người thích làm việc với sự khác biệt của sao , Sự khác biệt duy nhất là tập mà supremum được thực hiện. Đó là tập hợp các hình chữ nhật neo (ở gốc), nghĩa là, trong đó .A a 1 = a 2 = = a d = 0

Dn=supRA|1ni=1n1(xiR)vol(R)|.
Aa1=a2==ad=0

Bổ đề : cho tất cả , . n d MộtR R R 2 d MộtDnDn2dDnnd
Bằng chứng . Mặt trái ràng buộc rõ ràng kể từ . Giới hạn bên phải theo sau bởi vì mọi có thể được tạo thông qua các hiệp, giao và bổ sung của không quá hình chữ nhật neo (tức là, trong ).ARRR2dA

Như vậy, chúng ta thấy rằng D n nDn và tương đương theo nghĩa là nếu một cái nhỏ khi phát triển, thì cái kia cũng sẽ như vậy. Dưới đây là một hình ảnh (phim hoạt hình) hiển thị hình chữ nhật ứng cử viên cho mỗi sự khác biệt.Dnn

chênh lệch cực và sao

Ví dụ về trình tự "tốt"

Các chuỗi có chênh lệch sao thấp có thể kiểm chứng thường được gọi, không có gì đáng ngạc nhiên, các chuỗi sai lệch thấp .Dn

van der Corput . Đây có lẽ là ví dụ đơn giản nhất. Với , các chuỗi van der Corput được hình thành bằng cách mở rộng số nguyên thành nhị phân và sau đó "phản ánh các chữ số" xung quanh dấu thập phân. Chính thức hơn, điều này được thực hiện với hàm nghịch đảo triệt để trong cơ sở , trong đó và là các chữ số trong khai triển cơ sở của . Hàm này tạo thành cơ sở cho nhiều chuỗi khác nữa. Ví dụ: trong nhị phân là và như vậyi b φ b ( i ) = Σ k = 0 một k b - k - 1d=1ibi = k = 0 a k b k a k b i 41 101001 a 0 = 1 a 1 = 0 a 2 = 0 a 3 = 1 a 4 = 0 a 5 = 1 x 41 = ϕ 2 ( 41 ) = 0.100101

ϕb(i)=k=0akbk1,
i=k=0akbkakbi41101001a0=1 , , , , và . Do đó, điểm thứ 41 trong chuỗi van der Corput là .a1=0a2=0a3=1a4=0a5=1x41=ϕ2(41)=0.100101(base 2)=37/64

Lưu ý rằng vì bit có ý nghĩa nhỏ nhất của dao động trong khoảng từ đến , các điểm cho lẻ nằm trong , trong khi các điểm cho chẵn nằm trong .0 1 x i i [ 1 / 2 , 1 ) x i i ( 0 , 1 / 2 )i01xii[1/2,1)xii(0,1/2)

Trình tự Halton . Trong số các trình tự chênh lệch thấp cổ điển phổ biến nhất, đây là các phần mở rộng của trình tự van der Corput cho nhiều chiều. Đặt là số nguyên tố nhỏ nhất thứ . Sau đó, điểm thứ của j i x i d x i = ( φ p 1 ( i ) , φ p 2 ( i ) , ... , φ p d ( i ) )pjjixid chuỗi Halton là Đối với thấp, chúng hoạt động khá tốt, nhưng có vấn đề ở kích thước cao hơn .Cười mở miệng

xi=(ϕp1(i),ϕp2(i),,ϕpd(i)).
d

Trình tự Halton thỏa mãn . Họ cũng tốt bởi vì họ lànDn=O(n1(logn)d) thể mở rộng ở chỗ việc xây dựng các điểm không phụ thuộc vào sự lựa chọn tiên nghiệm về độ dài của chuỗi .n

Trình tự Hammersley . Đây là một sửa đổi rất đơn giản của chuỗi Halton. Thay vào đó, chúng tôi sử dụng Có lẽ đáng ngạc nhiên, lợi thế là chúng có độ chênh lệch sao tốt hơn .D n = O ( n - 1 ( log n ) d - 1 )

xi=(i/n,ϕp1(i),ϕp2(i),,ϕpd1(i)).
Dn=O(n1(logn)d1)

Dưới đây là một ví dụ về trình tự Halton và Hammersley theo hai chiều.

Halton và Hammersley

Trình tự Halton thấm Faure . Một tập hợp hoán vị đặc biệt (cố định là hàm của ) có thể được áp dụng cho khai triển chữ số cho mỗi khi tạo chuỗi Halton. Điều này giúp khắc phục (ở một mức độ nào đó) các vấn đề được đề cập ở các chiều cao hơn. Mỗi hoán vị có tính chất thú vị là giữ và làm điểm cố định.a k i 0 b - 1iaki0b1

Quy tắc mạng . Đặt là số nguyên. Lấy trong đó biểu thị phần phân số của . Sự lựa chọn thận trọng của các giá trị mang lại các đặc tính đồng nhất tốt. Lựa chọn kém có thể dẫn đến trình tự xấu. Chúng cũng không thể mở rộng. Đây là hai ví dụ. x i = ( i / n , { i beta 1 / n } , ... , { i β d - 1 / n } )β1,,βd1{ Y } y β

xTôi= =(Tôi/viết sai rồi,{Tôiβ1/viết sai rồi},Giáo dục,{TôiβCười mở miệng-1/viết sai rồi}),
{y}yβ

Mạng tốt và xấu

(t,m,S) lưới . lưới trong cơ sở là tập hợp các điểm sao cho mọi hình chữ nhật có thể tích trong chứa điểm. Đây là một hình thức mạnh mẽ của sự đồng nhất. Nhỏ là bạn của bạn, trong trường hợp này. Các chuỗi Halton, Sobol 'và Faure là ví dụ về lưới. Những người này cho vay độc đáo để ngẫu nhiên thông qua tranh giành. Việc xáo trộn ngẫu nhiên (thực hiện đúng) của một mạng lưới mang lại kết quả khác(t,m,S)bbt-m[0,1]Sbtt(t,m,S)(t,m,S)(t,m,S) . Các Mint dự án giữ một bộ sưu tập các trình tự như vậy.

Sinh ngẫu nhiên đơn giản: phép quay Cranley-Patterson . Đặt là một chuỗi các điểm. Đặt . Sau đó, các điểmxTôi[0,1]Cười mở miệngBạn~Bạn(0,1)x^Tôi= ={xTôi+Bạn} được phân phối đồng đều trong .[0,1]Cười mở miệng

Dưới đây là một ví dụ với các chấm màu xanh là các điểm ban đầu và các chấm đỏ là các điểm được xoay với các đường nối chúng (và được hiển thị bao quanh, khi thích hợp).

Cranley Patterson

Trình tự phân phối hoàn toàn thống nhất . Đây là một khái niệm thậm chí còn mạnh mẽ hơn về tính đồng nhất đôi khi xuất hiện. Đặt là chuỗi các điểm trong và bây giờ tạo thành các khối chồng chéo có kích thước để có được chuỗi . Vì vậy, nếu , chúng tôi lấy thì , v.v. Nếu, với mọi , , sau đó được cho là phân phối hoàn toàn thống nhất . Nói cách khác, chuỗi mang lại một tập hợp các điểm bất kỳ(bạnTôi)[0,1]Cười mở miệng(xTôi)S= =3x1= =(bạn1,bạn2,bạn3)x2= =(bạn2,bạn3,bạn4) S1CƯỜI MỞ MIỆNGviết sai rồi(x1,Giáo dục,xviết sai rồi)0(bạnTôi)thứ nguyên có các thuộc tính mong muốn .CƯỜI MỞ MIỆNGviết sai rồi

Ví dụ: chuỗi van der Corput không được phân phối hoàn toàn thống nhất vì với , các điểm nằm trong ô vuông và các điểm nằm trong . Do đó, không có điểm nào trong hình vuông ngụ ý rằng với , cho tất cảS= =2x2Tôi(0,1/2)×[1/2,1)x2Tôi-1[1/2,1)×(0,1/2)(0,1/2)×(0,1/2)S= =2nCƯỜI MỞ MIỆNGviết sai rồi1/4viết sai rồi .

Tài liệu tham khảo tiêu chuẩn

Các Niederreiter (1992) chuyên khảo và Fang và Wang (1994) văn bản là những nơi để đi cho tiếp tục thăm dò.


4
Câu trả lời này là tuyệt vời, và tôi chỉ muốn đánh giá cao những nỗ lực bạn bỏ ra. Cảm ơn bạn!
Anony-Mousse

1
Một câu hỏi tiếp theo nhỏ. Trình tự Halton có vẻ tốt, bởi vì chúng cũng có vẻ không quá thường xuyên. Các công cụ mạng là thường xuyên đối với tôi, và trình tự Hammersley dường như có rất nhiều đối tượng trên các dòng thông qua nguồn gốc. Một cách tốt để kiểm soát sự cân bằng giữa đồng phục thật và đồng phục giả là gì? Chỉ cần đóng góp 80% từ Halton + 20% đồng phục ngẫu nhiên?
Anony-Mousse

1
+ 10k và chắc chắn với câu trả lời thấp kỷ lục (87 !!!!)! Ồ, và tôi rất thích bài viết này. Tôi đánh dấu câu hỏi vì nó, thực sự. Làm tốt lắm, @cardinal.
Macro

@Macro: Cảm ơn bạn đã nhận xét tốt đẹp như vậy! Bạn thật tốt bụng. Tôi nghĩ rằng điều 10K này có thể là tạm thời đối với tôi. Tôi nghi ngờ tôi có thể giảm xuống dưới 10 nghìn ngay khi phiếu bầu của Procrastinator được hoàn nguyên. Tôi ngạc nhiên điều này đã không xảy ra, tuy nhiên, thực sự. Tôi tin rằng họ đã bỏ gần 3000 phiếu trên trang web này. Cảm ơn cũng đã gửi bài ở đây; bằng cách nào đó tôi chưa bao giờ thấy câu hỏi tiếp theo của Anony-Mousse!
Đức hồng y

@ Anony-Mousse: Xin lỗi vì sự chậm trễ khủng khiếp trong việc phản hồi. Tôi phải bỏ qua những bình luận này. Tôi nghĩ rằng việc tạo ra sự cân bằng sẽ phụ thuộc vào mục tiêu của bạn. Về mặt lý thuyết, giới thiệu bất kỳ điểm thống nhất ngẫu nhiên nào đều bị ràng buộc để phá hủy các thuộc tính tối ưu của . Như một vấn đề thực tế, có thể tốt hơn là sử dụng một jitter rất nhỏ của các điểm QMC trong đó jitter được chọn dựa trên các thuộc tính của chuỗi. Bạn cũng có thể giới thiệu các phép biến đổi thân cứng ngẫu nhiên trên tất cả các điểm, ví dụ: dịch chuyển và xoay tọa độ. D CƯỜI MỞ MIỆNGCƯỜI MỞ MIỆNG
Đức hồng y

3

Một cách để làm điều này là tạo ra các số ngẫu nhiên thống nhất, sau đó kiểm tra "độ gần" bằng bất kỳ phương pháp nào bạn thích và sau đó xóa các mục ngẫu nhiên quá gần với người khác và chọn một bộ đồng phục ngẫu nhiên khác để bù cho chúng.

Một phân phối như vậy sẽ vượt qua mọi bài kiểm tra về tính đồng nhất? Tôi chắc chắn hy vọng không! Nó không còn được phân phối đồng đều, bây giờ nó là một số phân phối khác.

Một khía cạnh không trực quan của xác suất là cơ hội là cục bộ. Có nhiều lần chạy trong dữ liệu ngẫu nhiên hơn mọi người nghĩ sẽ có. Tôi nghĩ Tversky đã thực hiện một số nghiên cứu về điều này (tuy nhiên, ông đã nghiên cứu rất nhiều, điều đó thật khó nhớ).


2
Một trong (nhiều) vấn đề với phương pháp này là rất khó để mô tả phân phối kết quả.
whuber

OP dường như quan tâm nhất với kích thước mẫu nhỏ. Điều này cho thấy anh ta không cần quan tâm đến toàn bộ phân phối. Giả sử bạn có một tập hợp tọa độ, bạn tạo một tọa độ khác và sau đó tính khoảng cách euclide đối với tất cả các tọa độ khác. Nếu khoảng cách nhỏ nhất nằm dưới ngưỡng nào đó, hãy ném số ra và tạo số mới. Tôi nghĩ giải pháp của Peter hoạt động tốt.
Giăng

@whuber Anh ấy dường như không quan tâm đến điều đó, mặc dù tôi có thể sai.
Peter Flom - Tái lập Monica

2
Hãy để tôi nói rõ hơn về sự phản đối của mình, Peter: khi bạn loại bỏ và / hoặc điều chỉnh các giá trị giả ngẫu nhiên theo cách đặc biệt để ước tính một số thuộc tính mong muốn, chẳng hạn như phân cụm, rất khó để đảm bảo rằng các chuỗi kết quả có bất kỳ tính chất mong muốn. Ví dụ, với phương pháp của bạn, bạn thậm chí có thể cho chúng tôi biết khoảnh khắc đầu tiên của quá trình kết quả sẽ là gì không? (Đó là, bạn thậm chí có thể đảm bảo với chúng tôi rằng cường độ là đồng đều không?) Còn khoảnh khắc thứ hai thì sao? Thông thường chúng tạo thành thông tin tối thiểu cần thiết để sử dụng các trình tự một cách hiệu quả để suy luận.
whuber

2
OK, nhưng, trong ví dụ trong câu hỏi, anh ta muốn đặt kho báu trên bản đồ trong một trò chơi. Điều đó sẽ không liên quan đến suy luận hoặc khoảnh khắc hoặc bất cứ điều gì thuộc loại này. Tôi thừa nhận phương pháp của tôi sẽ không tốt cho nhiều mục đích, nhưng tôi nghĩ nó phù hợp với ví dụ. Tất nhiên, có lẽ ví dụ không thực sự là những gì anh ấy muốn .... Có lẽ anh ấy muốn một cái gì đó trang trọng hơn, trong trường hợp đó tất cả các câu trả lời khác nên được xem xét.
Peter Flom - Tái lập Monica

3

Điều này được biết đến như là một quá trình điểm poisson "lõi cứng" - được đặt tên bởi Brian Ripley trong những năm 1970; tức là bạn muốn nó là ngẫu nhiên, nhưng bạn không muốn bất kỳ điểm nào quá gần nhau. "Lõi cứng" có thể được hình dung như một vùng đệm xung quanh mà các điểm khác không thể xâm nhập.

Hãy tưởng tượng bạn đang ghi lại vị trí của một số chiếc xe trong thành phố - nhưng bạn chỉ ghi điểm tại trung tâm danh nghĩa của chiếc xe. Trong khi họ ở trên đường, không có cặp đôi nào có thể đến gần nhau vì các điểm được bảo vệ bởi "lõi cứng" của thân xe - chúng ta sẽ bỏ qua vị trí siêu tiềm năng trong bãi đỗ xe nhiều tầng :-)

Có các quy trình để tạo các quy trình điểm như vậy - một cách là chỉ tạo các điểm đồng nhất và sau đó loại bỏ bất kỳ quá gần nhau!

Để biết một số chi tiết về các quy trình như vậy, hãy tham khảo ví dụ về điều này


2

Đối với việc tạo ra các đợt trước, tôi sẽ tạo ra một số lượng lớn các biến thể giả ngẫu nhiên, và sau đó kiểm tra chúng bằng một thử nghiệm như thử nghiệm Kolmogorov - Smirnov. Bạn sẽ muốn chọn bộ có giá trị p cao nhất (nghĩa là là lý tưởng). Lưu ý rằng điều này sẽ chậm, nhưng vìNp1VIẾT SAI RỒI lớn hơn, nó có thể trở nên ít cần thiết hơn.

Đối với thế hệ gia tăng, về cơ bản, bạn đang tìm kiếm một loạt với sự tự tương quan âm vừa phải. Tôi không chắc cách tốt nhất để làm điều đó là gì, vì tôi có rất ít kinh nghiệm với chuỗi thời gian, nhưng tôi nghi ngờ có những thuật toán hiện có cho việc này.

Đối với thử nghiệm "quá chẵn", bất kỳ thử nghiệm nào về việc một mẫu có tuân theo phân phối cụ thể (như KS đã lưu ý ở trên) hay không, bạn chỉ muốn kiểm tra xem , chứ không phải là phương pháp tiêu chuẩn. Tôi đã viết về một ví dụ về phương pháp thay thế này ở đây: chi bình phương luôn là một bài kiểm tra một phía . p>(1-α)


1

Tôi sẽ chính thức hóa vấn đề của bạn theo cách này: Bạn muốn phân phối trên sao cho mật độ là đối với một số định lượng lực đẩy của các điểm. f ( x ) e ( 1[0,1]viết sai rồi k<0f(x)e(1kij|xixj|k)1kk<0

Một cách dễ dàng để tạo các vectơ như vậy là lấy mẫu Gibbs.


bạn có thể xây dựng trên này? Lấy mẫu Gibbs dường như không giúp được gì ở đây, vì phân phối có điều kiện = distribuion biên = thống nhất? Hoặc là đề xuất của bạn để sử dụng các mẫu trước đó để tạo ra "lỗ hổng" trong phân phối để lấy mẫu từ?
Anony-Mousse

Chọn một vectơ ngẫu nhiên thống nhất và sau đó liên tục chọn một chỉ số và lấy mẫu lại . Tính tỷ lệ của trước và sau khi lấy mẫu lại và từ chối việc lấy lại mẫu của bạn với tỷ lệ cược . Điều này nhanh hơn nhiều so với các câu trả lời khác mà bạn nhận được khi bạn có một vectơ rất dài bởi vì bạn đang thực hiện địa phương thay vì từ chối toàn cầu. x i r f ( x ) rTôixTôirđụ(x)r
Neil G
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.