Mô phỏng phân phối


9

Tôi đang làm một bài tập Lập kế hoạch năng lực và tôi đã đọc một số sách. Điều này đặc biệt về phân phối. Tôi sử dụng R.

  1. Cách tiếp cận được đề xuất để xác định phân phối dữ liệu của tôi là gì? Có phương pháp thống kê để xác định nó?

Tôi có sơ đồ này.

TIẾP CẬN VẤN ĐỀ: PHÂN TÍCH SCENARIO, ĐIỀU TRỊ QUYẾT ĐỊNH VÀ MÔ PHỎNG

  1. Phương pháp mô phỏng có sẵn bằng R là gì? Ở đây tôi muốn tạo dữ liệu cho một phân phối nhất định như theo cấp số nhân. R-java có phải là cách tiếp cận phù hợp nếu tôi muốn tích hợp nó với Java?

  2. Có cách nào để dự đoán hiệu ứng phân phối (sử dụng CPU, v.v.) sẽ có khi tôi truyền dữ liệu cho một phân phối cụ thể không? Các tác động khác nhau của việc gửi phân phối dữ liệu nhất định là gì?

Vui lòng coi đây là những câu hỏi dành cho người mới bắt đầu. Có những cuốn sách hoặc tài liệu liên quan đến các loại mô phỏng này?

Ghi chú

Sơ đồ này là từ cuối bài http://people.stern.nyu.edu/adamodar/pdfiles/ con / probabilistic.pdf .

Sự tốt lành của các kỹ thuật phù hợp tôi đã đi qua

Đánh giá mức độ phù hợp

  1. Chi bình phương
  2. Kolmogorov-Smirnov,
  3. Mật độ thống kê Anderson-Darling, lô cdf, PP và QQ

Tôi không chắc cách giải thích hoặc các bước tiếp theo sẽ là gì nếu tôi thấy rằng phân phối của mình là bình thường hoặc theo cấp số nhân, vv Nó cho phép tôi làm gì? Sự dự đoán? Hy vọng câu hỏi này là rõ ràng.

Sự chậm trễ theo cấp số nhân sẽ gây ra biến động hàng đợi theo cuốn sách Lập kế hoạch năng lực của tôi bởi Neil Gunther. Vì vậy, tôi biết rằng một điểm.


Nếu bạn nghĩ rằng sơ đồ của bạn là quan trọng, thì bạn nên cố gắng cải thiện chất lượng của hình ảnh ...
ocram

Tôi đánh giá cao sự chăm sóc cần thiết để làm cho một câu hỏi hay. Theo ý kiến ​​của tôi, quan điểm của bạn 2. (nên là 3 tôi đoán) cần làm rõ hoặc thậm chí bạn có thể chuyển nó sang Stack Overflow.
gui11aume

1
Tôi nghĩ rằng câu hỏi cuối cùng của tôi thuộc về đây. Hãy nói rằng tôi xác định phân phối dữ liệu của tôi. Có phải tôi dự đoán rằng các bản phân phối trong tương lai sẽ tuân theo xác suất này? Tôi đang thiếu một phần phân tích dữ liệu ở đây. Tôi biết rằng một âm mưu râu ria hộp dễ dàng hiển thị các phần tư mà tôi hiểu. Tôi không nhận được tiện ích của một bản phân phối. Có thể có các thuộc tính của phân phối này, tôi cần điều tra để dự đoán.
Mohan Radhakrish Nam

@ocram Nếu chất lượng kém, hãy phóng to trang trong trình duyệt của bạn: chi tiết là có. BTW, những hình ảnh này phải từ một số tài liệu của Crystal Ball .
whuber

@whuber: Thật vậy, tôi thậm chí không thử! Xin lỗi cho nhận xét.
ocram

Câu trả lời:


7

Tôi sẽ trả lời quan điểm của bạn về mô phỏng với R vì đây là người duy nhất tôi quen thuộc. R có rất nhiều bản phân phối dựng sẵn mà bạn có thể mô phỏng. Logic của việc đặt tên là để mô phỏng một phân phối được gọi là distên rdis.

Dưới đây là những cái tôi sử dụng thường xuyên nhất

# Some continuous distributions.
?rnorm
?runif
?rgamma
?rlnorm
?rweibull
?rexp
?rt
# Some discrete distributions.
?rpoiss
?rbinom
?rnbinom
?rgeom
?rhyper

Bạn có thể tìm thấy một số bổ sung trong Lắp phân phối với R .

Ngoài ra, cảm ơn @jthetzel đã cung cấp một liên kết với một danh sách toàn diện các bản phân phối và các gói mà chúng thuộc về.

Nhưng chờ đã, còn nữa: OK, theo dõi bình luận của @ whuber Tôi sẽ cố gắng giải quyết các điểm khác. Về điểm 1, tôi không bao giờ đi theo cách tiếp cận phù hợp. Thay vào đó tôi luôn nghĩ về nguồn gốc của tín hiệu, giống như nguyên nhân gây ra hiện tượng, có một số đối xứng tự nhiên trong việc tạo ra nó, v.v. Bạn cần một vài chương sách để trình bày về nó nên tôi sẽ chỉ đưa ra hai ví dụ.

  1. Nếu dữ liệu được tính và không có giới hạn trên, tôi thử dùng Poisson. Các biến Poisson có thể được hiểu là các số độc lập liên tiếp trong một cửa sổ thời gian, đây là một khung rất chung. Tôi phù hợp với phân phối và xem (thường trực quan) xem phương sai có được mô tả tốt không. Rất thường xuyên, phương sai của mẫu cao hơn nhiều, trong trường hợp đó tôi sử dụng Binomial âm. Binomial âm có thể được hiểu là sự pha trộn của Poisson với các biến khác nhau, thậm chí còn tổng quát hơn, vì vậy điều này thường rất phù hợp với mẫu.

  2. Nếu tôi nghĩ rằng dữ liệu đối xứng quanh giá trị trung bình, nghĩa là độ lệch có khả năng dương hoặc âm như nhau, tôi cố gắng khớp với Gaussian. Sau đó tôi kiểm tra (một lần nữa bằng mắt) xem có nhiều ngoại lệ hay không, tức là các điểm dữ liệu rất xa so với giá trị trung bình. Nếu có, tôi sử dụng t của Sinh viên thay thế. Phân phối t của Học sinh có thể được hiểu là một hỗn hợp của Gaussian với các phương sai khác nhau, một lần nữa rất chung chung.

Trong những ví dụ đó, khi tôi nói một cách trực quan, ý tôi là tôi sử dụng cốt truyện QQ

Điểm 3, cũng xứng đáng với một số chương của cuốn sách. Hiệu quả của việc sử dụng phân phối thay vì phân phối khác là vô hạn. Vì vậy, thay vì đi qua tất cả, tôi sẽ tiếp tục hai ví dụ trên.

  1. Trong những ngày đầu của tôi, tôi không biết rằng Binomial âm có thể có một cách giải thích có ý nghĩa nên tôi đã sử dụng Poisson mọi lúc (vì tôi muốn có thể diễn giải các tham số theo thuật ngữ của con người). Rất thường xuyên, khi bạn sử dụng Poisson, bạn phù hợp với ý nghĩa độc đáo, nhưng bạn đánh giá thấp phương sai. Điều này có nghĩa là bạn không thể tái tạo các giá trị cực đoan của mẫu của mình và bạn sẽ xem xét các giá trị đó như các ngoại lệ (các điểm dữ liệu không có cùng phân phối như các điểm khác) trong khi thực tế chúng không như vậy.

  2. Một lần nữa trong những ngày đầu tiên của tôi, tôi không biết rằng Sinh viên cũng có một cách giải thích có ý nghĩa và tôi sẽ sử dụng Gaussian mọi lúc. Một điều tương tự đã xảy ra. Tôi sẽ phù hợp với giá trị trung bình và phương sai, nhưng tôi vẫn không nắm bắt được các ngoại lệ vì hầu như tất cả các điểm dữ liệu được cho là nằm trong 3 độ lệch chuẩn của giá trị trung bình. Điều tương tự cũng xảy ra, tôi kết luận rằng một số điểm là "phi thường", trong khi thực tế thì không.


2
Một lưu ý để thêm vào câu trả lời gui11aume của: Có một "d, p, q, r" cú pháp cho các chức năng phân phối liên quan trong R. Ví dụ dnorm, pnorm, qnorm, và rnormlà mật độ, hàm phân phối tích lũy (CDF), ngược CDF, và chức năng tạo biến thiên ngẫu nhiên cho phân phối chuẩn, tương ứng. Xem chế độ xem nhiệm vụ phân phối xác suất để biết danh sách toàn diện các phân phối có sẵn.
jthetzel

Đúng, cảm ơn rất nhiều (+1). Tôi đã tìm kiếm một danh sách như vậy trong một thời gian dài. Tôi đặt nó trong câu trả lời để nó dễ nhìn hơn.
gui11aume

1
Tôi thậm chí không thể nói cho bạn biết một phần ba trong số các bản phân phối đó là gì. Quá nhiều thứ để học ... +1, nhưng chúng ta đừng quên phần còn lại của câu hỏi, đó là điều cơ bản (nhưng có thể hơi rộng): những lựa chọn phân phối có ảnh hưởng gì trong một mô phỏng? Làm thế nào một người nên đi về việc thực hiện những lựa chọn này?
whuber

@whuber Tôi đã thêm ảnh hưởng của phân phối lũy thừa của độ trễ lên biến động hàng đợi. Tham khảo. sách về CP hoặc xếp hàng.
Mohan Radhakrish Nam

Tôi đã đọc bản phân phối Lắp với R và cũng đã sử dụng cốt truyện QQ một lần. Ước tính khả năng tối đa bắt đầu bằng biểu thức toán học được gọi là hàm khả năng của dữ liệu mẫu .. Nói một cách lỏng lẻo, khả năng của một tập hợp dữ liệu là xác suất có được tập hợp dữ liệu cụ thể đó cho mô hình xác suất đã chọn. Điều này có nghĩa là có một cách để tính toán rằng phân phối có thể xảy ra lần nữa? Có bao nhiêu phép đo được yêu cầu để chứng minh điều này?
Mohan Radhakrish Nam
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.