Đi bộ ngẫu nhiên làm gì chính xác?


8

Thành thật mà nói, tôi đã đọc nhiều trang web và câu trả lời liên quan đến câu hỏi này, và không ai giải thích nó bằng những từ đơn giản dễ hiểu. Những gì tôi muốn làm là hiểu những gì một bước đi ngẫu nhiên làm, và làm thế nào nó có thể được sử dụng cho Phân tích làm giàu Gene Set.

Có một bài báo được xuất bản ở đây http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3205944/ tuy nhiên, tôi không thể thực sự hiểu nó.

Ai đó có thể vui lòng giải thích những gì nó làm bằng những từ đơn giản?


2
Đó là hai câu hỏi rất khác nhau!
Alexis

1
@Alexis Tôi chấp nhận sửa đổi của bạn, tôi hy vọng bây giờ là rõ ràng!
Học viên

1
@Nemo Tôi đã xóa các thẻ không liên quan và thêm thẻ chuỗi thời gian . Vui lòng chỉnh sửa các thay đổi của tôi hoặc thêm các thẻ bổ sung nhưng các thẻ như r , ý nghĩa thống kê hoặc toán học dường như không liên quan ở đây.
Tim

Câu trả lời:


11

Tôi sẽ cố gắng trả lời câu hỏi đầu tiên của bạn

Bước đi ngẫu nhiên là một chuỗi các phép đo trong đó giá trị tại bất kỳ điểm đã cho nào trong chuỗi là giá trị của điểm trước đó trong chuỗi cộng với một số lượng ngẫu nhiên.

Ví dụ: giả sử bạn lật một đồng xu công bằng trong một loạt các lần tung và mỗi khi đồng xu xuất hiện, bạn thêm 1 vào giá trị trước của biến nối tiếp và mỗi khi đồng xu xuất hiện, bạn sẽ trừ 1 từ giá trị trước đó của biến nối tiếp của bạn. Nếu giá trị bắt đầu là 0 và nếu bạn lật chuỗi tung đồng xu sau:

T H T T T H H H T T H T H T H

Bước đi ngẫu nhiên , dựa trên các giá trị này như được mô tả ở trên sẽ là:y

0 -1 0 -1 -2 -3 -2 -3 -1 -2 -2 -1 -2 -1 -2 -1

Vậy giá trị của là:y

yt=yt1+2Bernoulli(0.5)1

Phân phối của phụ thuộc vào thời gian , đưa ra một số tính chất thú vị cho một mẫu của trong các thời điểm khác nhau:yty

  1. Giá trị trung bình của là không xác định. yĐiều này có vẻ phản trực giác, vì bạn có thể mong đợi rằng đầu và đuôi của một đồng tiền cân bằng được tập trung vào số không. Điều này đúng theo như nó nói, nhưng số 0 chỉ là giá trị bắt đầu tùy ý của . yVì vậy, không có ý nghĩa thực sự!

  2. Phương sai của . y=tKhi thời gian (số lần lật) tăng, phương sai cũng tăng. Ví dụ: ở lần lật đầu tiên ( ), các giá trị có thể là hoặc và thực tế phương sai là 1. Nhưng ở lần lật thứ hai ( ), các giá trị có thể là , hoặc và phương sai bằng 2. Với số lần lật vô hạn (tại , khi phạm vi của tất cả các giá trị có thể có của đi từ đến ), phương sai là vô hạn.t=111t=2202t=y

Hai sự thật này đóng vai trò trong việc cố gắng rút ra những suy luận về phân phối (chứ không phải cho một ) chỉ được cung cấp một mẫu khi sử dụng các công cụ suy luận thống kê cơ bản. (Làm thế nào một ước tính hữu hạn không thể xác định ? Làm thế nào một hữu hạn ước tính ?)yyty0y¯sy2σy2=

Có nhiều loại bước đi ngẫu nhiên, và nói chung hơn, của quá trình tự động nhấn mạnh (tức là bất kỳ biến nào phụ thuộc một cách nào đó vào các giá trị trước đó của nó). Ví dụ ở đây sử dụng một biến ngẫu nhiên Bernouli đơn giản (tung đồng xu), nhưng người ta có thể:

  • thêm một giá trị ngẫu nhiên được phân phối bình thường vào các giá trị liên tiếp của thay vào đó ... hoặc thực sự là một giá trị ngẫu nhiên được rút ra từ bất kỳ loại phân phối nào;y
  • làm cho giá trị của tại một thời điểm phụ thuộc vào các giá trị trước đó của từ nhiều hơn một điểm trong thời gian (ví dụ: );yyyt=yt1+yt2+Something Random
  • ghép giá trị của với giá trị ngẫu nhiên là để tạo ra bước đi ngẫu nhiên hai chiều;yx
  • làm cho một số chức năng ưa thích của , một ví dụ đơn giản là , trong đó , có nghĩa là bộ nhớ của bất kỳ thời điểm cụ thể nào của phân rã theo thời gian (với bộ nhớ kéo dài càng gần là 1) Nhận xét của Alperos Alecos, điều này chỉ đơn giản là 'tự phát' (đi bộ ngẫu nhiên thuần túy sẽ có );ytyt1yt=αyt1+Something Random|α|<1y |α||α|=1
  • làm nhiều việc khác để làm cho các bước đi ngẫu nhiên và / hoặc các quá trình tự phát trở nên phức tạp hơn.

Nhưng tất cả họ đều là những người Dickens để thử và phân tích bằng các phương pháp cơ bản. Đó là lý do tại sao chúng tôi có hồi quy kết hợpmô hình sửa lỗi và các kỹ thuật phân tích chuỗi thời gian khác để xử lý các loại dữ liệu này (đôi khi chúng tôi gọi là 'không tích hợp', 'ghi nhớ dài' hoặc 'gốc đơn vị' trong số các nhãn khác , tùy thuộc vào các chi tiết).

Nguồn gốc của thuật ngữ "đi bộ ngẫu nhiên" là từ một cặp chữ cái rất ngắn gọn với Thiên nhiên vào năm 1905.

Tài liệu tham khảo
Pearson, K. (1905). Thư gửi biên tập viên: Vấn đề đi bộ ngẫu nhiên. Thiên nhiên , 72 (1865): 294.

Pearson, K. (1905). Thư gửi biên tập viên: Vấn đề đi bộ ngẫu nhiên. Thiên nhiên , 72 (1867): 342.


2
Bạn viết "Bước đi ngẫu nhiên là một chuỗi các phép đo trong đó giá trị tại bất kỳ điểm đã cho nào trong chuỗi phụ thuộc vào giá trị của các điểm trước đó trong chuỗi." Nhưng điều này mô tả bất kỳ quy trình tự phát, và không phải tất cả quy trình tự phát là các bước ngẫu nhiên. Vì rõ ràng bạn biết vấn đề này, tôi tin rằng sẽ hữu ích nếu bạn sửa đổi tuyên bố này để đưa vào bề mặt những đặc điểm độc đáo của một bước đi ngẫu nhiên.
Alecos Papadopoulos

@AlecosPapadopoulos TY! Xin hãy giúp tôi ra khỏi đây ... thực sự không có sự quen thuộc sâu sắc với chủ đề này. Làm thế nào bạn có thể đề nghị tôi phân biệt bước đi ngẫu nhiên với các quá trình tự phát?
Alexis

Vui mừng. Có một tài liệu lớn về (các) bước đi ngẫu nhiên, chủ đề rất đa dạng. Nhưng ở cấp độ đầu tiên, điều phân biệt bước đi ngẫu nhiên là tất cả các giá trị trong quá khứ của mỗi bước đóng góp với giá trị đầy đủ của chúng với giá trị hiện tại của tổng của chúng (là bước đi ngẫu nhiên). Trong một quá trình tự phát, thường là hiệu ứng của quá khứ dần dần chết đi Về cơ bản, bạn thảo luận về vấn đề này trong bài viết của mình. Bây giờ tôi đọc lại câu trả lời của bạn, có lẽ bạn muốn nghĩ lại cách sử dụng từ "dân số": mỗi có một phân phối khác nhau, vì vậy theo nghĩa nào thì thuộc cùng một dân số? ytyt,yt+1...
Alecos Papadopoulos

1
@Nemo Bạn nhận được một loại hành vi cụ thể (thường là theo thời gian): quá khứ hoàn toàn xác định bạn đang ở đâu - nhưng , con đường tiến hóa không ảnh hưởng đến nơi bạn sẽ ở bên cạnh. Làm thế nào quá trình đến vị trí hiện tại của nó, không quan trọng cho tương lai.
Alecos Papadopoulos

1
Một bước đi ngẫu nhiên thực sự không "tương tự như xét nghiệm Kolmogorov-Smirnov". Một dẫn xuất của phân phối tiệm cận của thống kê kiểm tra KS theo giả thuyết null sử dụng một khái niệm liên quan đến việc đi bộ ngẫu nhiên. Điểm vẽ kết nối đó dường như từ cái nhìn nhanh chóng của tôi là để thúc đẩy sự phát triển trong phần tiếp theo (bài kiểm tra GSEA). Tôi không chắc đó là một lựa chọn tốt; nó dường như đã khiến bạn bối rối hơn là giúp bạn nhìn thấy những gì đang diễn ra. Tôi khuyên bạn nên cố gắng hiểu riêng về các lần đi bộ ngẫu nhiên trước khi cố gắng hiểu mối liên hệ giữa các lần đi ngẫu nhiên và GSEA.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.