Thống kê và dữ liệu lớn

Q & A cho những người quan tâm đến thống kê, học máy, phân tích dữ liệu, khai thác dữ liệu và trực quan hóa dữ liệu

1
Một mô hình của P (Y | X) có thể được đào tạo thông qua việc giảm độ dốc ngẫu nhiên từ các mẫu không iid của P (X) và mẫu iid của P (Y | X) không?
Khi đào tạo một mô hình được tham số hóa (ví dụ để tối đa hóa khả năng) thông qua việc giảm độ dốc ngẫu nhiên trên một số tập dữ liệu, người ta thường cho rằng các mẫu đào tạo được rút ra từ phân phối dữ liệu đào …

2
Kurtosis khổng lồ?
Tôi đang làm một số thống kê mô tả về lợi nhuận hàng ngày trên các chỉ số chứng khoán. Tức là nếu và là các mức của chỉ số vào ngày 1 và ngày 2, thì là mức hoàn trả mà tôi đang sử dụng (hoàn toàn chuẩn trong …


2
Phân phối tiệm cận của thống kê đơn hàng tối đa của các quy tắc ngẫu nhiên IID
Có đẹp hạn chế phân phối như n đi vào \ infty , giả định rằng họ là iid phân phối chuẩn với phương sai \ sigma ^ 2 .max(X1,X2,...,Xn)max(X1,X2,...,Xn)\max( X_1,X_2,...,X_n) nnn∞∞\inftyσ2σ2\sigma^2 Đây gần như chắc chắn là một vấn đề nổi tiếng với một bằng chứng thông minh và …

1
Tạo số ngẫu nhiên Log-Cauchy
Tôi cần vẽ các số ngẫu nhiên từ phân phối log-cauchy có mật độ: Bất cứ ai có thể giúp tôi ra hoặc chỉ cho tôi một cuốn sách / giấy có thể chỉ cho tôi làm thế nào?f(x;μ,σ)=1xπσ[1+(ln(x)−μσ)2].f(x;μ,σ)=1xπσ[1+(ln(x)−μσ)2].f(x;\mu,\sigma)=\frac{1}{x\pi\sigma\left[1+\left(\frac{ln(x)-\mu}{\sigma}\right)^2\right]}.

1
Định lý giới hạn trung tâm của người Việt cho tổng trọng số của các biến ngẫu nhiên tương quan
Tôi đang đọc một bài báo tuyên bố rằng X^k=1N−−√∑j=0N−1Xje−i2πkj/N,X^k=1N∑j=0N−1Xje−i2πkj/N,\hat{X}_k=\frac{1}{\sqrt{N}}\sum_{j=0}^{N-1}X_je^{-i2\pi kj/N}, (tức là Biến đổi Fourier rời rạc , DFT) bởi CLT có xu hướng biến ngẫu nhiên gaussian (phức tạp). Tuy nhiên, tôi biết điều này không đúng nói chung. Sau khi đọc lập luận (ngụy biện) này, tôi …


4
Tại sao sử dụng các biến kiểm soát trong sự khác biệt?
Tôi có một câu hỏi về cách tiếp cận khác biệt với phương trình chuẩn sau: trong đó điều trị là một biến giả cho nhóm được điều trị và bài. y=a+b1treat+b2post+b3treat⋅post+uy=a+b1treat+b2post+b3treat⋅post+u y= a + b_1\text{treat}+ b_2\text{post} + b_3\text{treat}\cdot\text{post} + u Bây giờ, câu hỏi của tôi rất đơn giản: …

2
Sách giáo khoa lấy mẫu từ đô thị
Tôi có kinh nghiệm thực tế khá tốt với việc lấy mẫu của Metropolis-Hastings và Gibbs, nhưng tôi muốn có được sự hiểu biết toán học tốt hơn về các thuật toán này. Một số sách giáo khoa hoặc bài báo tốt chứng minh tính đúng đắn của các bộ …


1
Về tương quan cophenetic cho phân cụm dendrogram
Xem xét bối cảnh của một cụm dendrogram. Chúng ta hãy gọi những khác biệt ban đầu là khoảng cách giữa các cá nhân. Sau khi xây dựng chương trình dendro, chúng tôi xác định sự khác biệt về cophenetic giữa hai cá nhân là khoảng cách giữa các cụm …

4
Kết hợp phân phối log-normal trong R so với SciPy
Tôi đã trang bị một mô hình logic bất thường bằng R với một bộ dữ liệu. Các tham số kết quả là: meanlog = 4.2991610 sdlog = 0.5511349 Tôi muốn chuyển mô hình này sang Scipy, điều mà tôi chưa từng sử dụng trước đây. Sử dụng Scipy, tôi …
10 r  python  numpy  scipy 




Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.