Một số câu hỏi về tính ngẫu nhiên thống kê


15

Từ randoness thống kê của Wikipedia :

Tính ngẫu nhiên toàn cầu và tính ngẫu nhiên cục bộ là khác nhau. Hầu hết các quan niệm triết học về tính ngẫu nhiên là toàn cầu vì chúng dựa trên ý tưởng rằng "về lâu dài" một chuỗi trông thực sự ngẫu nhiên, ngay cả khi các chuỗi con nhất định sẽ không có vẻ ngẫu nhiên. Ví dụ, trong một chuỗi ngẫu nhiên "thực sự" các số có độ dài đủ, có thể có các chuỗi dài không có gì ngoài các số không, mặc dù trên toàn bộ chuỗi có thể là ngẫu nhiên. Tính ngẫu nhiên cục bộ đề cập đến ý tưởng rằng có thể có độ dài chuỗi tối thiểu trong đó phân phối ngẫu nhiên gần đúng.Các đoạn dài của cùng một chữ số, ngay cả những chữ số được tạo bởi các quá trình ngẫu nhiên "thực sự", sẽ làm giảm "tính ngẫu nhiên cục bộ" của một mẫu (nó chỉ có thể là ngẫu nhiên cục bộ đối với các chuỗi 10.000 chữ số; các chuỗi nhỏ hơn 1.000 có thể không xuất hiện ngẫu nhiên tất cả, ví dụ).

Một trình tự thể hiện một mô hình không được chứng minh là không ngẫu nhiên về mặt thống kê. Theo các nguyên tắc của lý thuyết Ramsey, các vật thể đủ lớn nhất thiết phải chứa một cấu trúc con nhất định ("rối loạn hoàn toàn là không thể").

Tôi không hiểu ý nghĩa của hai câu in đậm.

  1. Có phải câu đầu tiên có nghĩa là một cái gì đó tạo ra một chuỗi ngẫu nhiên cục bộ ở độ dài dài hơn và không phải là ngẫu nhiên cục bộ ở độ dài ngắn hơn?

    Làm thế nào để ví dụ bên trong dấu ngoặc đơn hoạt động?

  2. Có phải câu thứ hai có nghĩa là một chuỗi thể hiện một mẫu không thể được chứng minh là không ngẫu nhiên về mặt thống kê? Tại sao?

Cảm ơn


1
câu hỏi hay. Tôi tìm thấy văn bản này một chút khó khăn bản thân mình. Tôi đã có thể nghĩ rằng một chuỗi là ngẫu nhiên hay không là để làm với cách nó được tạo ra; không phải là kết quả. Tôi nghi ngờ có một vấn đề ngôn ngữ ở đây - đối với tôi ngẫu nhiên có nghĩa là nó được tạo ra như thế nào; đối với lẽ thường (và có thể ít triết gia suy nghĩ rõ ràng hơn?) đó là về một cái gì đó xuất hiện rối loạn?
Peter Ellis

3
@Peter, bạn có thể gặp khó khăn ngay cả khi xác định tính ngẫu nhiên nếu bạn chỉ có thể tham khảo cơ chế tạo. Cuối cùng, bởi vì tất cả các tiện ích của các chuỗi ngẫu nhiên nằm ở các số chúng chứa - và không phải là cách các số đó được tạo ra - phải có một cách để xác định và kiểm tra tính ngẫu nhiên hoàn toàn theo các chuỗi, bạn có nghĩ vậy không?
whuber

1
Chắc chắn tôi đồng ý bạn có thể kiểm tra tính ngẫu nhiên từ kết quả của nó - về tính hợp lý của tính ngẫu nhiên, mà không khao khát chứng minh điều đó. Tôi có lẽ cần phải đọc thêm và suy nghĩ về những thách thức triết học của một định nghĩa dựa trên thế hệ.
Peter Ellis

Tôi nghĩ rằng sự ngẫu nhiên chỉ là một từ đồng nghĩa với không rõ. Tôi cũng tìm thấy câu này bizzare
xác suất

Câu trả lời:


15

Khái niệm này có thể được minh họa gọn gàng bởi một số mã thực thi. Chúng tôi bắt đầu (bằng R) bằng cách sử dụng trình tạo số ngẫu nhiên giả tốt để tạo chuỗi 10.000 số không và số không:

set.seed(17)
x <- floor(runif(10000, min=0, max=2))

Điều này vượt qua một số bài kiểm tra số ngẫu nhiên cơ bản. Ví dụ, một t-test để so sánh giá trị trung bình để có giá trị p của 40,09 %, trong đó cho phép chúng ta chấp nhận giả thuyết rằng số không và những người được bình đẳng với khả năng.1/240.09

Từ những con số này, chúng tôi tiến hành trích xuất một chuỗi giá trị liên tiếp bắt đầu từ giá trị thứ 5081:1000

x0 <- x[1:1000 + 5080]

Nếu chúng trông có vẻ ngẫu nhiên, chúng cũng sẽ vượt qua các bài kiểm tra số ngẫu nhiên tương tự. Chẳng hạn, hãy kiểm tra xem giá trị trung bình của chúng là 1/2:

> t.test(x0-1/2)

    One Sample t-test

data:  x0 - 1/2 
t = 2.6005, df = 999, p-value = 0.009445
alternative hypothesis: true mean is not equal to 0 
95 percent confidence interval:
 0.01006167 0.07193833 
sample estimates:
mean of x 
    0.041 

P có giá trị thấp (dưới 1%) mạnh mẽ cho thấy giá trị trung bình là đáng kể hơn so với . Thật vậy, tổng tích lũy của chuỗi này có xu hướng tăng mạnh:1/2

> plot(cumsum(x0-1/2))

Random walk?

Đó không phải là hành vi ngẫu nhiên!

So sánh chuỗi ban đầu (được vẽ dưới dạng tổng cộng) với chuỗi này cho thấy điều gì đang xảy ra:

Random walk

Chuỗi dài thực sự hoạt động như một bước đi ngẫu nhiên - như nó phải - nhưng các dãy riêng tôi chiết xuất chứa sự trỗi dậy trở lên dài nhất trong số tất cả subsequences của cùng độ dài. Có vẻ như tôi cũng có thể trích xuất một số phần tiếp theo khác thể hiện hành vi "không hợp lý", chẳng hạn như một tập trung vào khoảng , trong đó có khoảng 20 cái liên tiếp xuất hiện!9000


Như những phân tích đơn giản này đã chỉ ra, không có thử nghiệm nào có thể "chứng minh" rằng một chuỗi xuất hiện ngẫu nhiên. Tất cả những gì chúng ta có thể làm là kiểm tra xem các chuỗi có đủ lệch khỏi các hành vi dự kiến ​​của các chuỗi ngẫu nhiên để đưa ra bằng chứng rằng chúng không phải là ngẫu nhiên hay không . Đây là cách pin của các thử nghiệm số ngẫu nhiên hoạt động: chúng tìm kiếm các mẫu rất khó phát sinh trong chuỗi số ngẫu nhiên. Cứ sau một thời gian, chúng sẽ khiến chúng ta kết luận rằng một chuỗi số thực sự ngẫu nhiên không xuất hiện ngẫu nhiên: chúng ta sẽ từ chối nó để thử một thứ khác.

Tuy nhiên, về lâu dài - giống như tất cả chúng ta đều đã chết - bất kỳ trình tạo số thực sự ngẫu nhiên nào cũng sẽ tạo ra mọi chuỗi 1000 chữ số có thể, và nó sẽ làm như vậy vô cùng nhiều lần. Điều giải cứu chúng ta khỏi một tình huống khó khăn hợp lý là chúng ta sẽ phải chờ một thời gian rất dài để xảy ra hiện tượng quang sai rõ ràng như vậy.


Cảm ơn! Một câu hỏi liên quan: khi kiểm tra tính ngẫu nhiên của các số ngẫu nhiên giả được tạo bởi một số phương pháp, tính ngẫu nhiên có nghĩa là phân phối đồng đều không? Nói cách khác, kiểm tra ngẫu nhiên chỉ để kiểm tra phân phối thống nhất? Tôi đã hỏi điều này bởi vì những phân phối thiên vị hơn dường như ít ngẫu nhiên hơn đối với tôi bằng trực giác.
StackExchange cho tất cả

@Tim: không, có nhiều thử nghiệm phổ biến về tính ngẫu nhiên của Gaussian và có thể xây dựng các thử nghiệm cho bất kỳ phân phối nào.
ness101

1
[0,1)

2
Tôi gần như có thể "nhìn" vào đầu câu trả lời và nói "Whuber" :) Rất đẹp!
Tiến sĩ

2

Đoạn trích này sử dụng thuật ngữ "tính ngẫu nhiên cục bộ" và "tính ngẫu nhiên toàn cầu" để phân biệt giữa những gì có thể xảy ra với số lượng mẫu hữu hạn của một biến ngẫu nhiên và phân phối xác suất hoặc kỳ vọng của một biến ngẫu nhiên.

xi{0,1}θθlimn1ni=1nxi=θ

[0,1][a,b]0a<b1θ

Không có gì mới ở đây.

n

Vì vậy, tôi sẽ không đốt quá nhiều tế bào não khi nghĩ về đoạn trích này. Nó không chính xác về mặt toán học và thực sự sai lệch về bản chất của sự ngẫu nhiên.

Chỉnh sửa dựa trên nhận xét: @kjetilbhalvorsen +1 để nhận xét của bạn về kiến ​​thức lịch sử. Tuy nhiên, tôi vẫn nghĩ rằng giá trị của các điều khoản này là hạn chế và sai lệch. Các bảng mà bạn mô tả dường như đưa ra hàm ý sai lệch rằng các mẫu nhỏ, ví dụ, mẫu có nghĩa là khác xa với giá trị dự kiến ​​thực tế hoặc có lẽ là một chuỗi dài 0 không thể lặp lại (trong ví dụ Bernoulli của tôi), bằng cách nào đó thể hiện ít ngẫu nhiên hơn (bằng cách nói rằng họ không thể hiện "sự ngẫu nhiên cục bộ" giả mạo này). Tôi không thể nghĩ bất cứ điều gì sai lệch hơn cho các nhà thống kê vừa chớm nở!


Mặc dù "tính ngẫu nhiên toàn cầu" có vẻ bình dị, "tính ngẫu nhiên cục bộ" có ít nhất 20 năm lịch sử. Xem isiweb.ee.ethz.ch/papers/arch/umaure-mass-inspec-1991-1.pdf , ví dụ.
whuber

nn

2
Đôi khi tôi nhớ rằng tôi đã đọc điều này: Vào thời điểm mọi người xuất bản những cuốn sách có bảng "số ngẫu nhiên" được sử dụng để mô phỏng, thử nghiệm, v.v., một số trong số này đã đánh dấu các phần của bảng là phù hợp để sử dụng trong mô phỏng nhỏ (trưng bày "cục bộ tính ngẫu nhiên ") và các phần khác chỉ nên được sử dụng cho các mô phỏng lớn hơn (thể hiện" tính ngẫu nhiên toàn cầu ") Vì vậy, các khái niệm dường như chỉ ra điều gì đó có giá trị!
kjetil b halvorsen

1
Xin lỗi, tôi không thể nhớ nơi tôi đã đọc này. Nhưng điều này gần như rõ ràng: khác hẳn với các vấn đề triết học trong việc xác định tính ngẫu nhiên, Nếu bạn có một mô phỏng rất nhỏ trong đó bạn cần 1000 số ngẫu nhiên và trình tạo ngẫu nhiên chất lượng cao của bạn cung cấp cho bạn 1000 số không, Bạn sẽ làm gì? Mặc dù thực tế là các phép đo như vậy là có thể và thực sự cần thiết trong một chuỗi "thực sự ngẫu nhiên", mô phỏng của bạn bị hủy hoại!
kjetil b halvorsen

1
Cảm ơn các bạn, có lẽ tôi đã quá khắc nghiệt trong sự lên án của mình. Tôi sẽ thay đổi ngôn ngữ này một chút.
Chris A.

-1

Tôi nghĩ rằng các tác giả của bài viết Wikipedia là hiểu sai ngẫu nhiên. Đúng, có thể có những trải dài dường như không phải là ngẫu nhiên, nhưng nếu quá trình tạo ra chuỗi này thực sự ngẫu nhiên, thì phải là đầu ra. Nếu một số trình tự nhất định dường như không ngẫu nhiên, đó là một nhận thức sai lầm của người đọc (tức là con người được thiết kế để tìm các mẫu). Khả năng chúng ta nhìn thấy Bắc Đẩu và Orion, v.v. trên bầu trời đêm là không có bằng chứng nào cho thấy mô hình của các ngôi sao là không hợp lý. Tôi đồng ý rằng sự ngẫu nhiên thường xuất hiện không ngẫu nhiên. Nếu một quy trình tạo ra các mẫu thực sự không hợp lý cho các chuỗi ngắn, thì đó không phải là một quy trình ngẫu nhiên.

Tôi không nghĩ rằng quy trình thay đổi ở các cỡ mẫu khác nhau. Bạn tăng kích thước mẫu, bạn tăng xác suất mà chúng ta thấy một chuỗi ngẫu nhiên xuất hiện với chúng ta là không hợp lệ. Nếu có 10% cơ hội chúng ta sẽ thấy một mẫu trong 20 lần quan sát ngẫu nhiên, việc tăng tổng số quan sát lên 10000 sẽ làm tăng khả năng chúng ta sẽ thấy sự không hợp lý, ở đâu đó.


2
"Nếu một quy trình tạo ra các mẫu thực sự không hợp lý cho các chuỗi ngắn, thì đó không phải là một quy trình ngẫu nhiên", tôi sợ, hoàn toàn không chính xác. Ví dụ, trong bất kỳ 100 lần tung đồng xu công bằng nào, chúng tôi sẽ mong đợi quan sát sáu đầu hoặc sáu đuôi liên tiếp - và đó là một "mô hình thực sự không hợp lý cho [một] chuỗi ngắn" theo ý nghĩa ngẫu nhiên của bất kỳ ai. " Tôi nghi ngờ bạn có ý định viết một cái gì đó cần phải có trình độ cẩn thận hơn, chẳng hạn như áp dụng "tất cả" trước "các chuỗi ngắn".
whuber

Có thật không? Tôi đã có thể nghĩ rằng, vì người ta mong đợi nhìn thấy các chuỗi đuôi từ một trình tạo số ngẫu nhiên, rằng khi chúng ta nhìn thấy nó, chúng ta không nên ngạc nhiên. Tại sao coi nó là không ngẫu nhiên? Nếu một người có một trình tạo số đã thực hiện 100 lần lật và nó cố tình tránh được 4 đầu hoặc nhiều đuôi liên tiếp, thì nó sẽ trông ngẫu nhiên hơn một quá trình thực sự ngẫu nhiên, nhưng nó thực sự sẽ không có giá trị. Một quan điểm ngây thơ về tính ngẫu nhiên là thiếu tất cả các mẫu - nhưng đó sẽ là không hợp lý.
P auritus

Nhận xét của bạn là chính xác, nhưng giải thích trong câu trả lời của bạn không rõ ràng và thậm chí mâu thuẫn về điểm này. Ví dụ, hãy xem xét giải thích chính xác hơn ý của bạn bằng cách tạo ra "các mẫu thực sự không hợp lý cho các chuỗi ngắn", hoặc ý nghĩa của việc "nhìn thấy sự không hợp lý".
whuber

Tôi thấy không có mâu thuẫn. Bạn dường như nghĩ rằng các trình tạo ngẫu nhiên tạo ra các mẫu không ngẫu nhiên. Đó là sự mâu thuẫn. Bạn đang tranh luận rằng các quá trình thực sự ngẫu nhiên sẽ tạo ra các quan sát không ngẫu nhiên. Những gì bạn đang mô tả đôi khi được gọi là "ảo ảnh phân cụm", đó là xu hướng nhận thức không chính xác các cụm từ các phân phối ngẫu nhiên. Tất cả những gì tôi đang nói là nếu một quá trình tạo ra các quan sát không hợp lý, thì đó không phải là ngẫu nhiên. Bạn lập luận rằng bạn mong đợi một quá trình ngẫu nhiên để tạo ra các chuỗi các quan sát không hợp lệ, nhưng bạn gọi đó là sự không hợp lý. Ví dụ cổ điển về Apophenia.
P auritus

1
Thật khó để tiếp tục một cuộc trò chuyện với một người đối thoại, người đã đánh lạc hướng vị trí của một người, vì vậy tôi sẽ rời khỏi vị trí này. Lấy làm tiếc.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.