Thống kê và dữ liệu lớn

1

Một mô hình của P (Y | X) có thể được đào tạo thông qua việc giảm độ dốc ngẫu nhiên từ các mẫu không iid của P (X) và mẫu iid của P (Y | X) không?

Khi đào tạo một mô hình được tham số hóa (ví dụ để tối đa hóa khả năng) thông qua việc giảm độ dốc ngẫu nhiên trên một số tập dữ liệu, người ta thường cho rằng các mẫu đào tạo được rút ra từ phân phối dữ liệu đào …

10 machine-learning conditional-probability reinforcement-learning gradient-descent

2

Kurtosis khổng lồ?

Tôi đang làm một số thống kê mô tả về lợi nhuận hàng ngày trên các chỉ số chứng khoán. Tức là nếu và là các mức của chỉ số vào ngày 1 và ngày 2, thì là mức hoàn trả mà tôi đang sử dụng (hoàn toàn chuẩn trong …

10 distributions finance skewness kurtosis

2

Xấp xỉ bình thường của phân phối đa thức là gì?

Nếu có nhiều xấp xỉ có thể, tôi đang tìm kiếm một cơ bản nhất.

10 normal-distribution multinomial approximation

2

Phân phối tiệm cận của thống kê đơn hàng tối đa của các quy tắc ngẫu nhiên IID

Có đẹp hạn chế phân phối như n đi vào \ infty , giả định rằng họ là iid phân phối chuẩn với phương sai \ sigma ^ 2 .max(X1,X2,...,Xn)max(X1,X2,...,Xn)\max( X_1,X_2,...,X_n) nnn∞∞\inftyσ2σ2\sigma^2 Đây gần như chắc chắn là một vấn đề nổi tiếng với một bằng chứng thông minh và …

10 distributions probability extreme-value

1

Tạo số ngẫu nhiên Log-Cauchy

Tôi cần vẽ các số ngẫu nhiên từ phân phối log-cauchy có mật độ: Bất cứ ai có thể giúp tôi ra hoặc chỉ cho tôi một cuốn sách / giấy có thể chỉ cho tôi làm thế nào?f(x;μ,σ)=1xπσ[1+(ln(x)−μσ)2].f(x;μ,σ)=1xπσ[1+(ln(x)−μσ)2].f(x;\mu,\sigma)=\frac{1}{x\pi\sigma\left[1+\left(\frac{ln(x)-\mu}{\sigma}\right)^2\right]}.

10 distributions random-generation

1

Định lý giới hạn trung tâm của người Việt cho tổng trọng số của các biến ngẫu nhiên tương quan

Tôi đang đọc một bài báo tuyên bố rằng X^k=1N−−√∑j=0N−1Xje−i2πkj/N,X^k=1N∑j=0N−1Xje−i2πkj/N,\hat{X}_k=\frac{1}{\sqrt{N}}\sum_{j=0}^{N-1}X_je^{-i2\pi kj/N}, (tức là Biến đổi Fourier rời rạc , DFT) bởi CLT có xu hướng biến ngẫu nhiên gaussian (phức tạp). Tuy nhiên, tôi biết điều này không đúng nói chung. Sau khi đọc lập luận (ngụy biện) này, tôi …

10 time-series central-limit-theorem fourier-transform

1

Các câu hỏi về việc chỉ định mô hình hỗn hợp tuyến tính trong R cho dữ liệu đo lặp lại với cấu trúc lồng bổ sung

Cấu trúc dữ liệu > str(data) 'data.frame': 6138 obs. of 10 variables: $ RT : int 484 391 422 516 563 531 406 500 516 578 ... $ ASCORE : num 5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ... $ HSCORE : num 6 2.1 7.9 1 …

10 r mixed-model repeated-measures model-selection lme4-nlme

4

Tại sao sử dụng các biến kiểm soát trong sự khác biệt?

Tôi có một câu hỏi về cách tiếp cận khác biệt với phương trình chuẩn sau: trong đó điều trị là một biến giả cho nhóm được điều trị và bài. y=a+b1treat+b2post+b3treat⋅post+uy=a+b1treat+b2post+b3treat⋅post+u y= a + b_1\text{treat}+ b_2\text{post} + b_3\text{treat}\cdot\text{post} + u Bây giờ, câu hỏi của tôi rất đơn giản: …

10 regression multiple-regression causality

2

Sách giáo khoa lấy mẫu từ đô thị

Tôi có kinh nghiệm thực tế khá tốt với việc lấy mẫu của Metropolis-Hastings và Gibbs, nhưng tôi muốn có được sự hiểu biết toán học tốt hơn về các thuật toán này. Một số sách giáo khoa hoặc bài báo tốt chứng minh tính đúng đắn của các bộ …

10 bayesian references mcmc

3

Thời gian sống trung bình cho một chức năng sống sót bình thường

Tôi đã tìm thấy rất nhiều công thức cho thấy cách tìm thời gian tồn tại trung bình cho phân phối theo cấp số nhân hoặc Weibull, nhưng tôi gặp ít may mắn hơn cho các chức năng sinh tồn thông thường. Cho hàm tồn tại sau: S( t ) …

10 survival

1

Về tương quan cophenetic cho phân cụm dendrogram

Xem xét bối cảnh của một cụm dendrogram. Chúng ta hãy gọi những khác biệt ban đầu là khoảng cách giữa các cá nhân. Sau khi xây dựng chương trình dendro, chúng tôi xác định sự khác biệt về cophenetic giữa hai cá nhân là khoảng cách giữa các cụm …

10 clustering classification

4

Kết hợp phân phối log-normal trong R so với SciPy

Tôi đã trang bị một mô hình logic bất thường bằng R với một bộ dữ liệu. Các tham số kết quả là: meanlog = 4.2991610 sdlog = 0.5511349 Tôi muốn chuyển mô hình này sang Scipy, điều mà tôi chưa từng sử dụng trước đây. Sử dụng Scipy, tôi …

10 r python numpy scipy

3

Làm thế nào để mô hình một đồng xu thiên vị với thời gian thay đổi thiên vị?

Các mô hình tiền xu thiên vị thường có một tham số . Một cách để ước tính từ một loạt các lần rút là sử dụng bản beta trước và tính toán phân phối sau với khả năng nhị thức.θ=P(Head|θ)θ=P(Head|θ)\theta = P(\text{Head} | \theta)θθ\theta Trong cài đặt của tôi, …

10 time-series bayesian kalman-filter

2

Cách tốt nhất để kết hợp phản ứng nhị phân và liên tục

Tôi đang cố gắng đưa ra cách tốt nhất để dự đoán số tiền thanh toán cho một công ty thu nợ. Biến phụ thuộc chỉ khác không khi thanh toán đã được thực hiện. Có thể hiểu được, có rất nhiều số không vì hầu hết mọi người không …

10 regression predictive-models logistic

2

Làm thế nào để giải thích những tương phản tùy chỉnh?

Tôi đang thực hiện ANOVA một chiều (mỗi loài) với độ tương phản tùy chỉnh. [,1] [,2] [,3] [,4] 0.5 -1 0 0 0 5 1 -1 0 0 12.5 0 1 -1 0 25 0 0 1 -1 50 0 0 0 1 trong đó tôi so sánh cường …

10 r anova contrasts generalized-least-squares