Tạo các biến ngẫu nhiên phụ thuộc nguyên nhân


8

Tôi đang cố gắng tạo ra các bộ biến ngẫu nhiên được kết nối có nguyên nhân và bắt đầu thực hiện điều này với phương pháp monte carlo.

Đường cơ sở là biểu đồ đo 2 chiều mà tôi vẽ các giá trị ngẫu nhiên.

Trong các ví dụ cụ thể của tôi, các biến này là gia tốc và vận tốc - vì vậy rõ ràng phải giữ.v v i + 1 = v i + a id tavvi+1=vi+aidt

Cách tiếp cận ngây thơ hiện tại của tôi là:

Tôi bắt đầu với một số . Sau đó, tôi tạo ngẫu nhiên theo xác suất đo được là cho giá trị của . Sử dụng này tôi có thể tính và toàn bộ quy trình bắt đầu lại.a 0 a v 0 a 0 v 1v0a0av0a0v1

Vì vậy, khi tôi kiểm tra các gia tốc được tạo trong các thùng của mọi thứ đều ổn. Nhưng tôi rõ ràng điều này hoàn toàn không tôn trọng phân phối cận biên của .v vavv

Tôi khá quen thuộc với các phương pháp monte carlo cơ bản, mặc dù thiếu một số nền tảng lý thuyết như bạn có thể đoán. Tôi sẽ ổn nếu hai biến chỉ được kết nối bởi một ma trận tương quan nào đó, nhưng kết nối nhân quả giữa hai biến khiến tôi đau đầu.

Tôi đã không quản lý để tìm một ví dụ cho loại vấn đề này ở đâu đó - tôi có thể đang hiểu sai các điều khoản. Tôi sẽ hài lòng nếu ai đó có thể chỉ cho tôi một số tài liệu / ví dụ hoặc phương pháp đầy hứa hẹn để nắm bắt điều này.

(Hoặc nói với tôi rằng điều đó thực sự không thể thực hiện được với đầu vào của tôi - đó là điều tôi thỉnh thoảng đoán ...)

BIÊN TẬP:

Mục tiêu thực tế của toàn bộ quy trình này: Tôi có một bộ các phép đo và , được biểu thị trong biểu đồ hai chiều . Đưa ra đầu vào này, tôi muốn tạo các bộ ngẫu nhiên và để tái tạo phân phối được đo.v N ( a , v ) a r v ravN(a,v)arvr


1
Một câu hỏi thú vị. Tuy nhiên, "rõ ràng" thứ hai (về việc không tôn trọng phân phối cận biên) đối với tôi không rõ ràng. Tại sao nó rõ ràng? Phân phối của , như được phản ánh bởi "biểu đồ hai chiều" của bạn phụ thuộc vào cách bạn đã lấy mẫu các biến này; Tôi tự hỏi liệu điều này có thể giải thích sự khác biệt có thể. Loại dữ liệu nào được biểu thị bằng biểu đồ này và chính xác làm thế nào để bạn "rút ra các giá trị" từ nó? (v,a)
whuber

Chà, với tôi điều đó là hiển nhiên, bởi vì các bản phân phối khá đối xứng quanh không. Vì vậy, khi tạo , không có sự phụ thuộc vào . Khi hiện tại ở cạnh trên của phân phối cận biên , bạn sẽ cho rằng nên có sự thiên vị đối với âm . "vẽ các giá trị" đề cập đến: lấy phân phối xác suất 1 mờ, xây dựng phân phối tích lũy, ném một số ngẫu nhiên trong khoảng từ 0 đến 1, tìm trong đó cum. phân phối có giá trị . Đây là "giá trị được rút ra" của tôia i v v v a i r x r xaaivvvairxrx
sebastian

Để đầy đủ: dữ liệu bắt nguồn từ ghi nhật ký gps. Tôi có một bộ các chuyến đi được ghi lại trong xe ô tô, tốc độ đăng nhập với 1Hz. Vì vậy, họ là một cặp và cho mỗi datapoint. Chúng được điền vào biểu đồ. ava
sebastian

2
Nhận xét của bạn cho thấy bạn đang giả sử rằng và là độc lập. Điều đó không thể có thể, bởi vì có những giới hạn vật lý đối với tốc độ: điều đó có nghĩa là nhiều lần tăng tốc sẽ không được trải nghiệm ở tốc độ cực đoan nhất. Tuy nhiên, không dễ để cung cấp lời khuyên chi tiết hơn vì bạn chưa nói rõ những gì bạn đang cố gắng thực hiện; thay vào đó, bạn đã mô tả một cách tiếp cận để giải quyết một vấn đề không có căn cứ. Tại sao bạn không thay đổi câu hỏi này và thay vào đó hỏi về vấn đề bạn cần giải quyết thay vì làm thế nào để thực hiện một giải pháp có vẻ không hợp lệ? vav
whuber

Câu trả lời:


1

Dường như để tái sản xuất phân phối của doanh , bạn nên chọn mới không chỉ dựa trên , nhưng dựa trên cái cũ thêm:ρ(a,v)ava

ai+1ρ(ai+1|ai,vi)

Câu hỏi (mà tôi chưa biết câu trả lời) là làm thế nào để tìm tạo ra .ρρ

CẬP NHẬT: Bạn phải giải phương trình tích phân sau:

ρ(a,v)=daρ(a|a,va+a2Δt)ρ(a,va+a2Δt)

Xấp xỉ hàm với biểu đồ, bạn biến điều này thành một hệ phương trình tuyến tính:ρ

{ρ(a,v)=aρ(a|a,va+a2Δt)ρ(a,va+a2Δt)aρ(a|a,v)=1

Hệ thống này chưa được xác định rõ ràng. Bạn có thể áp dụng một hình phạt mịn để có được một giải pháp.


0

Không phải dữ liệu gps có chứa vị trí ? Tôi đã nghĩ rằng, không chỉ phụ thuộc vào và mà cũng sẽ phụ thuộc vào . Xem xét: trong bất kỳ mạng lưới đường nào cũng có nút cổ chai, giới hạn tốc độ, tín hiệu, giao lộ, độ dốc lớn, v.v ... được định vị địa lý. Vì vậy, một cái gì đó giống như một nhóm (phân phối) được xác định bởi:v i + 1 v i a i a i + 1 p ipvi+1viaiai+1pi

v i + 1 = v i + một i d tFa=Pr(Ai+1ai+1 | ai,vi,pi)
vi+1=vi+aidt

Đối với một tập hợp như vậy, khó khăn sẽ nằm trong bản chất của dữ liệu. Có khả năng dân số thực sự sẽ không đối xứng, phi tuyến tính (mảnh khôn ngoan) và có thể không có những khoảnh khắc xác định. Những đặc điểm này có thể không rõ ràng trong mẫu bạn có trong tay.

Như @whuber đã nêu, vấn đề, tức là chính xác những gì bạn đang tìm cách sản xuất, dường như chưa được xác định đầy đủ và rõ ràng. Không rõ liệu bạn có quan tâm đến đoàn thể hay nhiều cá nhân không.


Tôi nghĩ vấn đề của tôi khá rõ ràng - tôi có phân phối được đo là và và từ đó tôi muốn lấy mẫu giả ngẫu nhiên , cuối cùng sẽ sao chép đầu vào. Tôi nhận thức rõ quan điểm của bạn về việc liệu những gì phát sinh từ nó có thực tế hay không, nhưng đó là một câu hỏi khác ...a v r a n dvavrand
sebastian

Ít nhất, như được chỉ ra trong phương trình trên, đây sẽ không phải là một hiệu ứng đứng yên. Tôi nghĩ rằng bước đầu tiên sẽ là bin các bài đọc theo khoảng thời gian và sau đó so sánh chúng. Tôi không biết bạn có bao nhiêu bài đọc nhưng sự so sánh này có thể được thực hiện thông qua một cái gì đó như Phân phối của Pearson như một điểm khởi đầu - để cố gắng phân loại bản chất của phân phối.
AsymLabs
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.